跳转至

🔥AI副业赚钱星球

点击下面图片查看

郭震AI

达摩院的寻光平台在WAIC大会上惊艳亮相,开创性地解决了AI视频制作的全程操控难题,引领创新潮流。

编辑日期:2024年07月05日

在AIGC时代,视频制作的工作流程正经历革新。

只需轻巧一划,选定对象即刻独立成图层,随后流畅地融入各种背景视频,场景切换变得轻而易举。

img

img

只需轻轻一点,AI就能帮你轻松调整镜头视角:

img

可轻松实现目标的删除与修改:

img

从此告别连续加班导致的手部疲劳(doge)。关键点来了!这不是单纯的实验室技术展示,而是一个即将开启内测的全方位AI视频创作平台——“寻光”,准备让创作者们大展身手。

这意味着,以往需要在各个不同环节进行的剧本构思、故事板绘制、视频素材剪辑等工作,现在都能在AI的支持下,在同一平台上无缝整合、高效完成。

这就是阿里巴巴达摩院在世界人工智能大会上海分会场释放的最新创新震撼。

一经演示,现场观众无不为之振奋。

img

达摩院官方展现了在AI视频领域的雄心壮志:

不模仿Sora,他们决心走出独特的道路,力求让AI的创造力迅速适应人类的想象力边界。

“寻光”寓意着“在梦想与光影之间探索”:

其目标是运用人工智能技术,开创崭新的视频制作方式。

img

不同于今年众多引人注目的AI视频创作模型如Sora,我们更聚焦于“Sora之后,视频制作流程的革新”。

阿里巴巴达摩院指出,虽然Sora等AI模型为视频制作方式带来了革命性的想象空间,但目前的技术仍面临重大挑战,例如如何精准控制AI生成的视频内容,包括理解复杂的故事情节和保持生成对象的一致性。

此外,目前行业缺乏一个集中的AI视频编辑平台,能够使创作者全面体验到从头至尾由AI辅助的视频创作过程。

以OpenAI的创始人Andrej Karpathy为例,他近期也尝试了AI视频制作,创作出了一部人工智能版本的《傲慢与偏见》。

img

在创作这部短片时,他运用了一系列工具,如Claude、Ideogram、Luma、ElevenLabs和VEED。然而,他坦诚地表示:

工作流程实在错综复杂,频繁的复制粘贴操作使得制作一段仅有三个片段的小视频竟耗时约一小时。这无疑揭示了一个巨大的创新空间。究竟有没有人正在构建一个完全基于AI的视频制作平台呢?

达摩院推出了“寻光”项目,它被定位为一个全方位的AI驱动PUGC视频创作平台,旨在解决上述难题,利用人工智能技术改革传统的视频制作全过程。

具体而言,“寻光”能够协助用户编写剧本、设计分镜头,并提供多种AI增强编辑功能,如角色管理、场景切换、镜头运动控制、对象添加、移除或修改等超过十种功能。

img

在用户体验上,我们强调“将视频编辑变得与编辑PPT一样直观易用”。

以镜头规划为例,原始视频在上传至寻光后,会被智能算法自动拆分成一系列独立的镜头。

在创新的工作环境中,用户能够轻松检视每个镜头,并通过简单的拖放动作进行排序或修改。

在创建新的空白镜头时,除了导入现有素材,寻光还允许用户利用多种多模态生成模型,自动生成新颖的内容。

img

在编辑工具方面,寻光侧重于精确的编辑与操控:借助AI技术,它能理解用户的意图,从语义层面执行编辑,而非局限于像素层面;更重要的是,用户可以对视频中的人物、面部、前景、背景等任何细节进行细致入微的编辑和改动。

陈威华,达摩院视觉技术实验室的资深算法专家,在现场特别强调了视频图层编辑功能。以前景图层功能为例,用户只需通过文字描述,系统就能生成具有透明背景的视频内容,而且能够轻松地一键整合到不同的背景视频之中。

img

寻光具备独特的图层分解功能,用户只需在视频起始帧挑选感兴趣的物体,先进的算法将自动进行追踪,从整个视频中精准分离出该目标,生成带有透明背景的独立视频图层,即便是细微如飘动的头发也能精细地抠取出来。

img

此外,寻光平台在视频整体风格编辑方面,提供了超过20种独特的风格转换选择。

img

在镜头移动操作方面,它涵盖了水平左右滑动、垂直上下滑动、缩放推进与拉远以及环形左右移动等多种技术。

img

除了能够消除目标,寻光平台在视频局部编辑方面还能够实现对人脸的精细调整和控制。

img

流畅的动画来自国风武侠作品《少年白马醉春风》的第三集:

轻松一拽即启运动之幕:

img

寻光堪称融合了市面上最为全面的AI编辑特性,将整个视频制作流程全面智能化。与在各个独立工具间切换,零散应用AI技术相比,这种方式无疑更为便捷且高效。

目前,业界和学界都聚焦于研发更深入理解物理世界的规则、能生成更长时间且更具震撼效果的多模态模型。

然而,随着更强大的AI问世,人们能否迅速适应并掌握这种新生产力,也成为了一个引人关注的议题。

在Karpathy引发讨论后,许多网友纷纷表示赞同:

切换不同工具常常打断工作流程,坦白说,这限制了提升工作效率的可能性。AI视频创作亟需一个统一的用户界面。

img

在WAIC大会上,陈威华指出,我们正处于AI驱动的视频制作革命前沿。“要办好一件事,必须先有锐利的工具”,他设想寻光视频创作平台将成为每个人的得力助手,成为一个定制化的个人视频工作室。在这个平台上,AI将与创作者形成更紧密、更高效的协同。

为了实现这一目标,达摩院的视觉技术实验室已积累了丰富的技术基础。

该实验室专注于多模态视觉信号的理解和生成技术,目前主要研究领域涵盖了精确的图像/视频/3D内容生成、可控的编辑技术、高效的生成架构以及多模态的理解-生成框架等。

全球范围内,AIGC已掀起热潮,关键在于它预示着生产力根本性变革的可能性。

如今,释放生产力的第一步正在变为现实,你是否满怀期待?

官方网站:https://xunguang.damo-vision.com/

—— 完 ——

img

人员的行踪尚未得到回应

img

倪光南指出,RISC-V正在塑造全球CPU领域的新版图。

img

知名高校教授们罕见地集体参与其中

img

这款芯片在特定人工智能应用中展现出超过10倍的性能增强,能效比更实现了惊人的300倍提升。

img

微尘隐宏宇,宏宇容纳微尘

img

实现这类顶尖的全球水准,仅提供改写后的文本:

以上全文,欢迎继续阅读学习

大家在看

京ICP备20031037号-1 | AI之家 | AI资讯 | Python200 | 数据分析