ai创作的惊悚体操视频中肢体翻飞宛如魔术利库恩评论称这些视频生成模型对物理学一无所知只是单纯地输出重构的画面
体操展示,呃,这个难道不算吗?
这段视频的右上角带有水印,明确表明它是由Luma AI的Dream Machine创造的,这个工具曾被誉为“下一代”的文生视频技术。
人们看过之后都忍不住参与进来,热议的焦点集中在人工智能在视频领域的老生常谈:AI是否真正掌握了物理定律。
LeCun 立刻发言:
看了之后,华盛顿大学的计算机科学教授 Pedro Domingos 也表示了不解,轻轻摇头。
自从 Sora 出现后,对于人工智能是否能理解物理定律的讨论逐渐引起了更多人的兴趣。
Sora 创造的"寄居蟹在夜晚以灯泡为壳"的场景堪称典范,生动展现了海浪轻拂沙滩的微妙动态,而寄居蟹肢体上细腻的绒毛也栩栩如生。
与实际拍摄的相似场景相比较,唯一的明显瑕疵就是灯泡在无电状态下竟然发亮了。
最近,Luma AI 推出的 Dream Machine 同样令人惊叹,它所生成的第一人称视角探索荒废房屋的场景逼真度极高:
因此,许多人相信Sora、LUMA等视频生成模型已经掌握了基础的物理学原理。
然而,这次公开的视频内容实在过于离奇。
不仅手舞足蹈,屡次展示出令人惊叹的魔术般的变化:
这种高难度的空中翻转,就连牛顿恐怕也要为之惊叹不已:
网友们看过之后纷纷表示,说这恐怖实在太过夸张,倒不如说是好笑呢。
LeCun直言不讳地指出,这类视频生成模型对物理学缺乏理解,只能机械地生成内容。
他进一步阐述,Sora以及类似的视频制作模型都存在相同的问题,随着时间的推移,视频生成技术必然会有显著的提升。
但:
还有一种观点可以这样阐述:
LeCun等人的见解迅速引发了网民的疑问:
然而,LeCun 并未被这种反驳所说服。
除此之外,也有一部分人持有不同的观点。
比如,谷歌DeepMind/Brain的研究员Lucas Beyer曾指出:
毕竟,先前的生图模型制作出的图像通常是这样的:
关于模型能够创建出如此荒谬的视频,这是怎么回事呢?
一些网民推测是由于缺少体操展示的数据,另一些人则指出身体部位的不清晰处理,这可能导致模型无法准确把握人体构造,因而难以确保动作之间的流畅性。
近期,SD 3 模型出现了故障,对生成人体图像的效果不理想,引发了网友们的热议。这个情况可能是由于过度严谨的数据审查机制,不慎删除了一些并无不良内容的成人图像,从而影响了模型对人类身体结构的准确理解。
除了 Luma AI 的 Dream Machine 在创造体操视频时遭遇重大失败,Runway 的 Gen-3 也...
同样的多才多艺:
相同的空中漂浮技艺:
参考链接:
本文来自微信公众号:量子位(ID:QbitAI),作者:西风