真实AI“情侣合照”竟然被代码找出漏洞?沃顿教授预测AI将在18个月内完成进化
编辑日期:2024年08月12日
最近 Flux 的突然爆火,几乎颠覆了所有人的三观。
不懂就问:现在网络上的内容,还有什么是真的?
如今,开源的文生图模型 Flux 已经在全网上引发了一场风暴。
这些合照竟然全部都是AI生成的,这简直让这位博主感到震惊到怀疑自己的认知。
正面特写采用大光圈拍摄,脸部的光线、肌肉的纹理和毛发都表现得非常自然,完全看不出任何破绽。
请注意,即使是背景板上的人物,也显得非常自然,几乎挑不出太大的毛病。
如果镜头拉远一些,光线再暗一些,也会显得很自然。
这两个人物在明暗光线下的对比,简直营造出了如世界名画般的光影质感。
请问是否足够细致,是否真的真实呢?
人再多一些,Flux 也不畏惧。
无论是三个人、四个人、五个人,乃至更多人,画面依旧无可挑剔。
挑剔的网友们仍在不断寻找细微的错误或缺点。
最易被一眼识破为AI的,无疑就是徽标上的文字了。
感受到了AI企图逃避检测的努力
还有一些细节问题,例如 AI 并不了解人类的帽子和项链是用来做什么的,因此在绘制时仍可能存在一些瑕疵。
顺便一提,一年半前,Midjourney V5 在网络上引起轰动的一对情侣的合影是这样的:
如今,整个网络已掀起了一股 Flux 生图的热潮,大家纷纷感慨:Flux 将 AI 生成图像推向了新的高度。
每当我们认为AI生成的图像不可能再变得更好时,它总能再次证明我们是错误的。
按照这位博主的说法,AI 正在失去控制,潘多拉魔盒正被开启!
特别是Flux具有出色的生图能力以及开放源代码的可玩性,这也为各种二次创作、视频和语音创作提供了极大的空间。
这些被广泛传播的TEDx演讲者,就无需多说了。
这位网友运用了Flux、可灵AI和synclabs制作了一段YouTube网红博主的视频。
请您提供需要重写的文本内容,我将尽力帮助您。
尽管仍然存在人工智能的印记,但在图像和视频方面所取得的进步确实令人惊叹。
作者表示,其目的不仅限于打造网络红人,还包括制作自动化的广告、YouTube视频、TikTok短视频、教学视频、市场营销内容以及解说课程等。
甚至当AI达到足够快速时,它能够实现实时生成,这意味着FaceTime AI朋友或AI治疗师都可能成为现实。
是的,如果要说到AI最可怕的地方,那一定是它的速度。
制作一段AI短片,仅需几秒或几分钟的时间。毋庸置疑,AI正在步入世界舞台,对此大家均持乐观态度。
这位网友直接表示:将Flux.1、Midjourney引入AI视频后,尽管存在不足,但这已经成为他目前所见的最优秀的AI作品。
这位博主将Flux与LoRA结合后发现,LoRA对于现实主义图像以及绘画/艺术图像都有着很好的处理效果。
Flux.1 和 LoRA 对于生成动漫效果也非常不错,仅需一块 4090 显卡即可运行。
这位网友表示,自己在不到1个小时的时间里就制作出了两个香水广告。他直接说:“我们已经接近AI视频的奇点。”
沃顿商学院的一位人工智能方向的副教授在观看了最近的人工智能生成的视频后预测,人工智能将在18个月内完成进化。
这种观点的存在是因为AI模型的进化速度实在是超乎想象。
例如以下几张「水獭在飞机上使用wifi」的图片,在一到两周的时间内就显示出可见的进步。
再来看看一年多后,现在的AI已经进化到了何种程度——
不仅水獭的形象更加逼真可爱,而且在操作手机时的手部动作也毫无破绽。
再来对比一下同一款产品的进化速度:MidJourney v3 和 v4 之间展现了非常明显的进步。
不仅如此,最近在GitHub上有一项非常热门的研究表明,只需要一张照片就能够实现脸部替换进行直播。
在以下的视频中,只见马斯克本人戴上眼镜,开始了实时无延迟的直播。
连马斯克的妈妈都要被骗的程度。
大佬LeCun也被网友们利用来进行换脸直播。
目前,该项目已在GitHub上获得了14k的星级评分,并在Trending榜单上名列前茅。
项目地址:https://github.com/hacksider/Deep-Live-Cam
(注意:直接点击即可访问该项目的GitHub页面。)
与此同时,各种对口型技术,例如 ReSyncer,也让 AI 视频中人物的嘴型动作显得极其自然。
到此为止,AI已经完成了一整个工作流程!从此以后,即使我们在网上看到非常逼真的图像,心中也难免会打上一个问号了。
那么,到底有没有可能,通过独具慧眼的方式,来辨识出人工智能的踪迹呢?
趁着最近这波人工智能生成图像的热潮,前谷歌搜索的创始人之一Deedy提出——
要最好地识别AI图片,最有效的方法是提升图像的饱和度,并且仔细检查麦克风的连接部分以及牙齿的位置。
例如,最近非常流行的 TED 演讲者的图片,如果将饱和度设置为 200%,你会看到令人惊恐的牙齿。
值得一提的是,识别工具的代码都是由克劳德编写的,并且是公开可用的。
传送门:https://claude.site/artifacts/6890e3d7-e65e-41ff-a7d4-3ccb38040b46
(注:原句已经是中文,故无需重写。此处“传送门”为网络用语,指链接的意思。)
然而,当尝试用另一张由AI生成的TED演讲者图片进行测试时,结果却没有任何漏洞。
在这张图片中,牙齿并不显得异常,并且在主体颜色区域色彩更为统一。
德迪称,如果对真实的图像进行JPG压缩,可能会破坏这种一致性。
当我们生活在一个被人工智能包围的「楚门的世界」里,人类最后的出路在哪里?
也许,是时候拔掉网络线了。
参考资料:
(注:您提供的文本内容非常短,若需重写具体文本内容请提供更多信息。)
本文来源于微信公众号:微信公众号(ID:null),作者为新智元,原题目为:《情侣合照逼真至极却仍被代码辨识出?沃顿教授预测 AI 将在 18 个月内达到巅峰!》