CBA

未开始

新疆

04-29

广州

CBA

未开始

浙江

04-29

上海

CBA

未开始

广东

04-28

广厦

CBA

未开始

辽宁

04-28

深圳

CBA

未开始

上海

04-26

浙江

CBA

未开始

广州

04-26

新疆

CBA

未开始

深圳

04-25

辽宁

CBA

未开始

广厦

04-25

广东

CBA

未开始

广州

04-24

新疆

CBA

未开始

上海

04-24

浙江

CBA

未开始

深圳

04-23

辽宁

CBA

未开始

广厦

04-23

广东

西甲第32轮

未开始

皇马

04-22

巴萨

法甲第30轮

未开始

大巴黎

04-22

里昂

西甲第32轮

未开始

阿拉维斯

04-22

马竞

英超第34轮

未开始

富勒姆

04-21

利物浦

德甲第30轮

未开始

多特蒙德

04-21

勒沃库森

CBA

未开始

新疆

04-21

广州

中超第7轮

未开始

北京国安

04-21

青岛西海岸

CBA

未开始

浙江

04-21

上海

中超第7轮

未开始

梅州客家

04-21

上海海港

NBA

未开始

湖人

04-21

掘金

美职联第9轮

未开始

迈阿密国际

04-21

纳什维尔SC

NBA

未开始

太阳

04-21

森林狼

西甲第32轮

未开始

吉罗纳

04-21

加的斯

英超第34轮

未开始

狼队

04-21

阿森纳

沙特联第28轮

未开始

哈森姆

04-21

吉达联合

NBA

未开始

魔术

04-21

骑士

意甲第33轮

未开始

恩波利

04-21

那不勒斯

中超第7轮

未开始

南通支云

04-20

上海申花

CBA

未开始

辽宁

04-20

深圳

CBA

未开始

广东

04-20

广厦

中超第7轮

未开始

成都蓉城

04-20

深圳新鹏城

中超第7轮

未开始

山东泰山

04-20

沧州雄狮

意甲第33轮

未开始

卡利亚里

04-20

尤文

沙特联第28轮

未开始

利雅得胜利

04-19

费哈

CBA

未开始

新疆

04-19

广州

CBA

未开始

浙江

04-19

上海

欧联1/4决赛

未开始

罗马

04-19

米兰

欧联1/4决赛

未开始

西汉姆联

04-19

勒沃库森

欧联1/4决赛

未开始

马赛

04-19

本菲卡

欧联1/4决赛

未开始

亚特兰大

04-19

利物浦

CBA

未开始

广东

明日

广厦

CBA

未开始

辽宁

明日

深圳

NBA

未开始

老鹰

明日

公牛

NBA

未开始

热火

明日

76人

欧冠1/4决赛

未开始

曼城

明日

皇马

欧冠1/4决赛

未开始

拜仁

明日

阿森纳

NBA

已结束

勇士

94

国王

NBA

已结束

湖人

110

鹈鹕

欧冠1/4决赛

已结束

巴萨

1

大巴黎

欧冠1/4决赛

已结束

多特蒙德

4

马竞

U23亚洲杯第1轮

已结束

韩国U23

1

阿联酋U23

U23亚洲杯第1轮

已结束

日本U23

1

中国U23

CBA

已结束

上海

118

北京

英超第33轮

已结束

切尔西

6

埃弗顿

CBA

已结束

深圳

117

北控

CBA

已结束

广厦

109

山西

NBA

已结束

火箭

116

快船

NBA

已结束

掘金

126

灰熊

NBA

已结束

独行侠

86

雷霆

NBA

已结束

湖人

124

鹈鹕

NBA

已结束

爵士

116

勇士

NBA

已结束

活塞

95

马刺

NBA

已结束

太阳

125

森林狼

NBA

已结束

开拓者

82

国王

意甲第32轮

已结束

国米

2

卡利亚里

NBA

已结束

老鹰

115

步行者

NBA

已结束

公牛

119

尼克斯

NBA

已结束

奇才

122

凯尔特人

NBA

已结束

猛龙

103

热火

NBA

已结束

雄鹿

88

魔术

NBA

已结束

黄蜂

120

骑士

NBA

已结束

篮网

86

76人

意甲第32轮

腰斩

乌迪内斯

1

罗马

CBA

已结束

广州

92

青岛

CBA

已结束

北京

116

上海

CBA

已结束

山西

132

广厦

CBA

已结束

北控

99

深圳

CBA

已结束

青岛

96

广州

CBA

已结束

上海

110

北京

CBA

已结束

深圳

106

北控

CBA

已结束

广厦

107

山西

CBA

已结束

上海

95

浙江

CBA

已结束

广州

109

南京

CBA

已结束

山西

117

北控

CBA

已结束

山东

128

宁波

CBA

已结束

深圳

102

北京

CBA

已结束

新疆

121

江苏

CBA

已结束

吉林

107

福建

CBA

已结束

青岛

87

四川

CBA

已结束

天津

113

广东

CBA

已结束

辽宁

101

广厦

一拖一拽，小猫活了！Netflix等新作爆火，噪声扭曲算法让运动控制更简单

2025-02-03 10:48:28

新智元报道

编辑：英智

【新智元导读】本文提出了一种全新的噪声扭曲算法，利用光流推导出的结构化噪声来替代传统随机噪声，成功实现了对视频运动的强大控制能力。

在视频扩散生成领域，如何精准操控视频中的运动细节而又不牺牲画面质量，一直是研究者共同追逐的目标。

来自Neflix、Stony Brook大学等机构的研究人员创新性地提出通过结构化的潜在噪声采样控制运动。

实现方法很简单，只要对训练视频做预处理，生成结构化噪声。这一过程不涉及扩散模型的设计，无需改变其架构和训练流程。

研究提出了一种全新的噪声扭曲算法，速度超快，能实时运行。它用光流场推导的扭曲噪声，取代随机的时序高斯噪声，同时保持了空间高斯性。

由于算法高效，能用扭曲噪声以极小的成本微调视频扩散基础模型。

这为用户提供了全面的运动控制方案，可用于局部物体运动控制、全局摄像机运动控制以及运动迁移等场景。

此外，算法兼顾了扭曲噪声的时序一致性和空间高斯性，既能保证每帧画面的像素质量，又能有效控制运动。

论文链接：https://arxiv.org/pdf/2501.08331

本研究的贡献如下：

创新的视频扩散模型解决方案：提出一种简单新颖的方法，将运动控制转化为可用于噪声变形的流场，在潜在空间采样时能直接使用。它不仅能与任意视频扩散基础模型搭配，还可和其他控制方式协同使用。
高效的噪声变形算法：研发出高效的噪声变形算法，它既能保持空间高斯性，又能追踪跨帧的时间运动流。这让微调运动可控的视频扩散模型时，花费的成本最小，操作也更方便。

实验和用户研究充分验证了该方法在各类运动控制应用中的优势。

这些应用涵盖局部物体运动控制、运动传递到新场景、基于参考的全局相机运动控制等。

在像素质量、可控性、时间连贯性以及用户主观偏好等方面，表现十分优异。‍

Go-with-the-Flow

当前的视频扩散模型存在局限性，研究者提出了一种创新且简单的方法，旨在把运动控制当作结构化组件，融入到视频扩散模型潜在空间的无序状态中。

具体实现方式是关联潜在噪声的时间分布。

先从二维高斯噪声片入手，把它和根据训练视频样本提取的光流场算出来的扭曲噪声片，按照时间顺序连接起来。下图清晰展示了该方法的流程。

本文提出创新的噪声扭曲算法，运行速度极快，能够实时运行。

传统方法需从初始帧起，对每一帧都进行一系列复杂的扭曲操作，而本文的算法则通过在连续帧之间迭代扭曲噪声来实现目标。

具体来说，研究者在像素层面精准地追踪噪声和光流密度，依据前向、后向光流，计算画面的扩展与收缩变化，以此来确定噪声的扭曲方式。

同时，结合HIWYN提出的条件白噪声采样方法，保证算法在运行过程中始终维持高斯性。

在视频扩散推理阶段，本文提出的方法优势明显，能依据不同运动类型，自动调整噪声变形，为多种运动控制应用提供一站式解决方案。

局部物体运动控制：当用户想要控制局部物体运动时，只需给出拖动信号，就能在物体轮廓范围内灵活改变噪声元素，让局部物体按照需求运动。
全局相机运动控制：针对全局相机运动的控制，复用参考视频里的光流数据，对输入噪声进行扭曲处理，这样就能在不同文本描述或初始帧条件下，重新生成视频。
任意运动传递：进行任意运动传递时，运动表达方式不再局限于常见光流，还包括3D渲染引擎生成的光流、深度变形等形式。

Go-with-the-Flow主要由两部分组成：噪声扭曲算法和视频扩散微调。

噪声扭曲算法运行时，和扩散模型的训练流程互不干扰。研究团队利用这个算法生成噪声模式，再用这些模式去训练扩散模型。

本研究中的运动控制完全基于噪声初始化，在视频扩散模型中没有添加任何额外参数，这样既能简化模型结构，又能提高运行效率。

HIWYN提出将噪声扭曲应用于图像扩散模型的设想。受此启发，研究团队发现了扭曲噪声的新用法，就是把它作为视频生成模型的运动控制条件。

研究团队使用由大量视频和扭曲噪声对构成的数据集，对视频扩散模型进行微调。经过这样的处理，在推理阶段就能很好地控制视频里的运动了。

噪声扭曲算法

为了便于进行大规模噪声扭曲操作，研究团队研发出一种快速噪声扭曲算法。

这个算法是逐帧处理噪声的，只需要存储前一帧噪声（尺寸是H×W×C）和每个像素的光流密度值矩阵（尺寸为H×W），这里的密度值能体现特定区域中噪声的压缩程度。

HIWYN算法在运行时，需要进行耗时的多边形光栅化和每个像素的上采样操作。

新算法直接根据光流追踪帧与帧之间画面的扩展和收缩情况，全程只用到像素级别的操作，这些操作还很容易实现并行处理，大大提高了效率。

新算法和HIWYN算法一样，都能保证噪声的高斯性。

下一帧噪声扭曲

噪声扭曲算法通过迭代方式来计算噪声，某一帧的噪声计算仅取决于前一帧的状态。

假设每帧视频的尺寸是H×W，用代表一个高为H、宽为W的二维矩阵。

已知前一帧的噪声q和流密度，同时知道正向流f和反向流f ′：，基于这些条件，算法就能算出下一帧的噪声q′和流密度， q′（或p′）与前一帧的q（或p）通过流在时间上建立起关联。

本文的算法结合了扩展和收缩两种动态机制。

当视频里某个区域放大，或者有物体朝着相机移动时，就会触发扩展机制。在这种情况下，当前帧的一个噪声像素，会在下一帧中对应一个或多个噪声像素，这就是扩展。

在收缩时，研究者借鉴了拉格朗日流体动力学的思路，把噪声像素想象成沿着前向光流f移动的粒子。

这些粒子移动后，画面中往往会留下空白区域。对于前向光流f没有覆盖到的区域，就利用反向光流f'拉回一个噪声像素，再用扩展过程中算好的噪声去填充这些空白。

此外，为了长时间维持噪声分布的正确性，研究团队借助密度值，来记录特定区域内噪声像素的聚集数量。

在收缩情形下，当这些噪声像素与附近其他粒子混合时，密度较高的粒子会有更大的权重。

为了同时处理好扩展和收缩这两种情况，研究者构建了一个二分图G。图里的边表明了噪声和密度从前一帧传递到下一帧的方式。

在综合考虑图中各边的作用，生成下一帧噪声q'时，依据光流密度对噪声进行缩放，以此确保原始帧的分布特性能够得以保留。

同时计算扩展和收缩的情况，避免它们相互干扰，就能确保最终输出的结果符合完美的高斯分布。

实验结果

为了验证方案的有效性，研究团队开展了大量实验及用户调研。结果表明，在保持运动一致性和针对同一情境渲染不同的运动效果方面，该方案表现十分出色。

从实验数据和用户反馈可知，本方案在像素画面质量、运动控制精准度、与文本描述的契合度、视频时间连贯性以及用户喜好程度等方面，都具有显著优势。

用Moran's I指标衡量空间相关性，K-S检验评估正态性。选择多种基准进行对比，包括固定独立采样噪声、插值方法及其他噪声扭曲算法。

可以看到，本文提出的方法在Moran's I指标和K-S检验中表现良好，表明无空间自相关性且符合正态分布；而双线性、双三次和最近邻插值方法未能保持高斯性，存在空间自相关性且偏离正态分布。

本文的方法在保持空间高斯性上成效显著，且在噪声生成效率和实际应用方面有很强的可行性。

实验结果表明，本文的方法效率极高，比并行的InfRes运行更快，相比HIWYN，速度提升了26倍，这得益于算法的线性时间复杂度。

算法的效率比实时速度快了一个数量级，这说明在视频扩散模型微调时动态应用噪声扭曲是可行的。

为验证噪声扭曲算法有效性，将经不同方法扭曲的噪声输入到用于超分辨率和人像重光照的预训练图像扩散模型中，通过评估输出视频的质量和时间一致性。

‍

结果显示，本文的算法在时间一致性上比基线方法更出色，处理前景、背景和边缘时稳定性更好。

在DifFRelight视频重光照任务中评估噪声扭曲方法。推理时，研究者从特定区域裁剪出画面，并按照指定光照条件进行处理。本文的方法在图像和时间指标上表现更好，能有效改进图像扩散模型。

‍

接下来聚焦视频扩散中的局部对象运动控制。为评估模型控制能力，将其与SG-I2V、MotionClone和DragAnything三种基线方法对比。

现有方法在处理复杂局部运动时存在局限，SG-I2V会误判运动导致场景平移，DragAnything缺乏一致性易失真，MotionClone难以捕捉细微动态。

本文的模型在处理复杂运动时表现优异，能保持对象保真度和三维一致性。大量研究和评估证实了本文的方法在运动一致性、视觉保真度和整体真实感方面优势显著。

本文的方法同样支持运动迁移和相机运动控制。

在DAVIS数据集的对象运动迁移中，运动保真度和视频质量更好，生成视频与真实视频还原度高。

在相机运动控制上，在DL3DV和WonderJourney数据集以及深度扭曲实验中表现出色。

在视频首帧编辑能力上，能无缝融入新增对象并保留原始运动，明显优于基线方法。

本研究提出了一种新颖的、速度快于实时的噪声扭曲算法，它能将运动控制自然地融入视频扩散噪声采样过程。

研究者用这种噪声扭曲技术对视频数据进行预处理，以开展视频扩散微调，从而提供了一种通用且用户友好的范式，可应用于各类运动可控的视频生成场景。

参考资料：

https://x.com/EHuanglu/status/1882014762281865379

https://x.com/natanielruizg/status/1882121096859890140

https://eyeline-research.github.io/Go-with-the-Flow/

SB OpenAI Japan成立！2025年首个最火AI赛道开打

SB OpenAI Japan成立！2025年首个最火AI赛道开打

智东西 2025-02-03 23:52:27

英伟达受到挑战，但不会继续跌；AI将会有更广泛应用

英伟达受到挑战，但不会继续跌；AI将会有更广泛应用

DeepTech深科技 2025-02-03 19:07:10

Netflix的国际“煤老板”之路

Netflix的国际“煤老板”之路

饭统戴老板 2025-01-13 20:02:13

大型强子对撞机揭示反物质能在银河系中走多远

大型强子对撞机揭示反物质能在银河系中走多远

零度星系 2025-02-02 09:34:56

小猫的不服都写在脸上，和主人干架谁也不让谁，喵喵拳重现江湖

小猫的不服都写在脸上，和主人干架谁也不让谁，喵喵拳重现江湖

锦明搞笑 2025-02-01 15:02:00

宇宙的终极轮回：爱因斯坦和庞加莱的预言，谁是对的？

宇宙的终极轮回：爱因斯坦和庞加莱的预言，谁是对的？

观察宇宙 2025-02-03 16:49:15

16万公里外的“百鸟齐鸣”！我国科学家全球首次发现“太空合声”

16万公里外的“百鸟齐鸣”！我国科学家全球首次发现“太空合声”

科普大世界 2025-02-02 23:41:54

牛弹琴：一场史诗级贸易战就此开打中美展开直接较量

牛弹琴：一场史诗级贸易战就此开打中美展开直接较量

现代快报 2025-02-03 09:11:26

原来小猫真的会装可爱啊，好吧我承认是真的很可爱

原来小猫真的会装可爱啊，好吧我承认是真的很可爱

爱宠物 2025-02-02 22:16:34

前驱转向不足，后驱转向过度，只有四驱的稳定性最好！

前驱转向不足，后驱转向过度，只有四驱的稳定性最好！

十点瞰视角 2025-01-30 16:00:15

封神质子团的发展差距有多大？内娱没点背景压根混不下去！

封神质子团的发展差距有多大？内娱没点背景压根混不下去！

夏九九来了 2025-01-30 11:35:23

DeepSeek眼中的大理是什么样？

DeepSeek眼中的大理是什么样？

大理融媒 2025-02-03 20:36:53

2025年2月Netflix新剧，这10部必追！

2025年2月Netflix新剧，这10部必追！

ChicMyGeek 2025-02-01 13:00:46

物理，才是最好的人生指南

游子三月三 2025-02-02 21:13:03

中国成功研制小型原子喷泉钟，赋能军事与科技发展

中国成功研制小型原子喷泉钟，赋能军事与科技发展

世界探索者发现 2025-02-03 11:39:35

流体画公仔糖果手工diy

阿钟吗 2025-02-03 18:26:04

小女孩看电影时放声大笑，旁边男孩不满称“有病吧”！

小女孩看电影时放声大笑，旁边男孩不满称“有病吧”！

众横四海 2025-02-03 11:34:45

伊尔76与运20参数对比：深入剖析两款运输机的性能差异

伊尔76与运20参数对比：深入剖析两款运输机的性能差异

猪猪爱影视 2025-02-03 04:47:16

7分钟前韦伯望远镜首次揭示了奥陌陌的真实图像_05

7分钟前韦伯望远镜首次揭示了奥陌陌的真实图像_05

芊妈军事世界 2025-01-31 00:09:13

詹姆斯·韦伯望远镜，刚刚拍摄了几十年来，最清晰的宇宙图像！_1

詹姆斯·韦伯望远镜，刚刚拍摄了几十年来，最清晰的宇宙图像！_1

芊妈军事世界 2025-02-03 00:05:32

爬泰山开“外挂”？游客：像有人拉着我上山，网友：能登“珠峰”吗

爬泰山开“外挂”？游客：像有人拉着我上山，网友：能登“珠峰”吗

环球网资讯 2025-02-01 13:13:10

车主为了过年审，更改轮胎上的参数，办法总比困难多！

车主为了过年审，更改轮胎上的参数，办法总比困难多！

青青笑翻天 2025-02-02 14:32:00

小汽车应急车道超车遭阻拦甩头撞向小车强硬加塞

小汽车应急车道超车遭阻拦甩头撞向小车强硬加塞

征垣之路 2025-02-03 21:24:47

罕见！湖南郴州山顶现白色神秘光柱，知情人透露：2024年就有了

罕见！湖南郴州山顶现白色神秘光柱，知情人透露：2024年就有了

八戒说科学 2025-02-03 21:46:47

AI时代新谜题：这是人类画作还是上帝摄影？

AI时代新谜题：这是人类画作还是上帝摄影？

国际艺术大观 2025-02-03 00:07:37

全球首台可扩展光量子计算机面世，预计将部署数千台服务器

全球首台可扩展光量子计算机面世，预计将部署数千台服务器

DeepTech深科技 2025-02-03 19:07:03

新疆又签一个小外？现已达四个，仅劳森一个大外，不补强内线？

新疆又签一个小外？现已达四个，仅劳森一个大外，不补强内线？

篮球资讯达人 2025-02-03 15:45:31

来看看这些突破想象天际的作品

好机友摄影学院 2025-01-30 20:15:03

百度智能云宣布上线DeepSeek-R1/V3

百度智能云宣布上线DeepSeek-R1/V3

每日经济新闻 2025-02-03 19:32:18

2025款领克Z20新车商品性评价

2025款领克Z20新车商品性评价

车质网 2025-02-03 07:10:45

全面梳理200+篇前沿论文，视觉生成模型理解物理世界规律通关密码

全面梳理200+篇前沿论文，视觉生成模型理解物理世界规律通关密码

机器之心Pro 2025-02-02 15:47:20

解构DeepSeek-R1：一场AI效率革命背后的技术突破

解构DeepSeek-R1：一场AI效率革命背后的技术突破

DeepTech深科技 2025-02-03 19:06:43

万字长文：怎样弥合人工智能和人脑智能的差距？

万字长文：怎样弥合人工智能和人脑智能的差距？

钛媒体APP 2024-12-01 19:58:35

微软AI模型MatterGen能根据需求生成新材料

微软AI模型MatterGen能根据需求生成新材料

量子位 2025-01-21 18:07:40

UniReal登场：统一图像生成与编辑，还学到真实世界动态变化规律

UniReal登场：统一图像生成与编辑，还学到真实世界动态变化规律

机器之心Pro 2024-12-20 15:14:55

模型参数作知识通用载体，MergeNet离真正的异构知识迁移更进一步

模型参数作知识通用载体，MergeNet离真正的异构知识迁移更进一步

机器之心Pro 2025-01-30 11:42:50

第二波AI编程浪潮已经到来

DeepTech深科技 2025-02-02 16:47:28

春晚上的“赛博秧歌”火了！外国网友：肯定还有别的“绝活”

春晚上的“赛博秧歌”火了！外国网友：肯定还有别的“绝活”

上观新闻 2025-02-03 09:01:15

线性扩散模型LiT，极简线性注意力助力扩散模型AIPC时代端侧部署

线性扩散模型LiT，极简线性注意力助力扩散模型AIPC时代端侧部署

机器之心Pro 2025-02-01 15:01:13

聊天机器人有时候会“胡说八道”，GPT等模型的“幻觉率”有多高？

聊天机器人有时候会“胡说八道”，GPT等模型的“幻觉率”有多高？

医咖会 2025-02-02 19:05:14