直播版Deepfake能够通过单一照片实现实时视频脸部替换,且五分钟内完成安装,对硬件无特别要求。
编辑日期:2024年08月10日
为什么啊?!
答案揭晓 —— 这个栩栩如生的马斯克,根本就不是马斯克本人!
这是由一个最新的AI换脸项目生成的:
只需要一张照片,就可以进行换脸并进行直播。
不得不说,这样的马斯克挺吓人的,有点像恐怖电影里的怪叔叔呢~
进行本地安装后,就可以实现实时无延迟的效果,并且还支持实时预览功能。
也就是说,无论是进行在线会议还是直播带货,都可以使用任何人的脸了。
一启动会议软件,就有30个马斯克正在进行视频会议;一进入直播间,就看到100个董宇辉在发放大额优惠券。
这个项目名为 Deep-Live-Cam,它不需要专门的硬件加速。
虽然AI换脸技术已不算新奇,但最近有个项目因其惊人效果而迅速走红——仅需一张照片就能窃取你的面容进行直播,且该项目已被开源。
直冲GitHub热榜首位,在24小时内狂收1600+颗星。
在围观的网友中,有不少人表现得非常激动:
也有人不禁感叹,连老人都能通过AI直播赚钱的时代终于到来,这一天来得实在太快了,就像龙卷风一样。
你有看过马斯克穿着汗衫在出租屋的情景吗?
"马斯克" 正襟危坐,专注地盯着屏幕。
这个项目一经推出,大家就开始疯玩起来,目前在GitHub上已经累计获得了5300+个星标。(请注意,简介中特别注明了未经审查)
比如这位网友分享了repo,并对它给出了极高的评价。
安装速度如此之快,他在后面也透露了自己的电脑配置确实非常高端。
他变换成了满脸胡茬的小扎克伯格,也许这就是他老了之后的样子吧。
随后他摇身一变,变成了一个像乔治克鲁尼那样的帅气大叔,但却是带着一种嬉皮笑脸的样子。
还有休·格兰特。
相信细心的朋友也看出来了,为什么这三位的发型和胡子都是一样的。
这应该是这款软件的一个小bug:无法轻松更改发型,而且很难隐藏胡须。
因此,它无法满足一些秃顶人士的需求——无法通过换脸来让头发重新生长……
也正是因为注意到了这个软件背后存在的风险,作者在项目开始时就特别做出了声明。
首先,这款软件旨在为人工智能媒体行业做出贡献,帮助博主等用户完成一系列任务,例如制作定制角色的动画,或使用角色作为服装模特等。
为了避免一些不道德的应用,它有一个内置的检查功能,可以防止程序处理一些不适当的内容。
作者也坦诚表示,未来该项目可能会被关闭,或者在生成的图像上添加水印。同时,作者建议如果用户使用真实人物的面孔时,最好先获得本人的同意,并在网络发布相关内容时明确标注为DeepFake的作品。
随后,作者分享了一些食用技巧。他首先表示,这项任务在他的本地计算机(CPU)上更有可能运行,但是运行速度会非常慢。
简单的四个步骤:首先进行一些配置设置:推荐使用 Python 3.10 版本;安装 pipgit;安装 ffmpe;安装 Visual Studio 2022 运行时(仅限 Windows);接着克隆仓库,然后下载两个模型:GFPGANv1.4 和 inswapper_128_fp16.onnx,并将这两个模型放置在名为 models 的文件夹中。
最后安装依赖项;如果想要使用 GPU 加速,作者也提供了进一步的操作指南。
安装完成后即可开始使用~ 但首次运行时会需要下载一个约 300M 大小的模型。
如图所示,选择一张人脸的图片和目标图片或视频,然后点击Live。
这个项目的前身名为 roop-cam,它可以拍摄一段视频,并将视频中的人脸替换成你所选择的人脸。
您只需准备一张所需的人脸图像,例如寡姐的图片。整个过程不需要数据集,也不需要进行训练。
同样也支持直播模式。
随着开源时间的延长,开发者和围观网友的讨论也越来越多。
不少人认为这非常“疯狂”,因为这样一个操作门槛极低且效果显著的项目竟然选择了开源。
另一群认为这很“疯狂”的人,则是感到忧虑,觉得这个世界因此变得更难以分辨真假了。
后者所担心的问题,显然已经摆在我们每个人的面前。
AI换脸技术——不论是实时直播、视频会议还是图片、语音,这些都是现今在网上冲浪的人们需要睁大双眼仔细辨认的。
就拿近期在AI绘画界中最热门的顶流FLUX来说吧!
这是Stable Diffusion原团队正式宣布创业后的首个项目,就连人工智能领域的专家卡帕西也热情转发,表达了对该项目效果的赞赏。
无论是用手还是用文字,效果都非常真实且震撼。
由△FLUX 生成的“照片”
因此,有推特用户使用FLUX、可灵等人工智能生成工具,创建了一个100%由AI驱动的YouTube主播。
网友们看后纷纷流泪表示:"AI生成的图像为何如此逼真,难道我们不知道真人长什么样子吗?"
难怪有人感叹,这难道就是传说中的“硅谷遇到恐怖谷”吗?
对此,量子位只能表示——
那么,如果再加上这款口型同步模型 ReSyncer 呢?(是的,这里有个狗头表情)
ReSyncer发布了自己与Heygen在唇形同步效果上的对比视频,其中展示了类似霉霉(Taylor Swift)用中文说话的神奇技巧。
什么是观感?
大概或多或少都能与这位网友产生共鸣:
AI技术带来了真正的后真相时代。
说到这,就不得不提一则最近的新闻:
三天前(8月7日),湖北省黄石市公安局下陆分局宣布侦破一起利用AI换脸技术解封社交账户并进行非法贩卖牟利的案件。
三名男子通过使用AI技术将一些视频中的脸部进行替换,然后利用这些经过换脸处理的动态面部来解冻一些被平台冻结的账户。
最终,他们三人通过使用人工智能换脸技术,解开了2000多个社交账户,并非法获利超过40万元。
谁说人工智能带来的欺诈风险仅限于直接替换面孔呢?
但生成由AI创造、AI换脸达到几乎无法分辨的照片级真实感,已是大势所趋。
应该怎么办呢?!
已经有人坐不住了,在讨论区表示他们正在开发一个针对渲染时的编解码器的深度伪造检测插件。
让我们为他/她加油吧……
参考链接:
注意:您未提供需要重写的具体内容,仅重写了“参考链接”部分。若需重写其他内容,请提供详细信息。
本文出自微信公众号:微信公众号(ID:QbitAI),作者为关注前沿科技。