跳转至

🔥AI副业赚钱星球

点击下面图片查看

郭震AI

新恐怖谷现象:全球500万网友受骗,热门TEDx演讲者竟无一真实存在

编辑日期:2024年08月11日

新恐怖谷现象全球500万网友受骗热门te

最近,这些「TED 演讲者」在海外网络上疯传,简直是病毒式的扩散。仔细观察一下,你能发现有什么问题吗?

新恐怖谷现象全球500万网友受骗热门te

新恐怖谷现象全球500万网友受骗热门te

新恐怖谷现象全球500万网友受骗热门te

新恐怖谷现象全球500万网友受骗热门te

新恐怖谷现象全球500万网友受骗热门te

答案揭晓——这五个人中,没有一个是真实的人!

新恐怖谷现象全球500万网友受骗热门te

如此真实,几乎毫无瑕疵,这个级别的真人图AI直接让网友们惊叹不已。甚至就连AI识别软件都无法分辨出这是由AI生成的图片。

新恐怖谷现象全球500万网友受骗热门te

「看起来如此真实,不就是因为这本来就是真实的照片吗?」

新恐怖谷现象全球500万网友受骗热门te

"没有一个是真人吗?简直太令人毛骨悚然了!"

新恐怖谷现象全球500万网友受骗热门te

网友尖锐评论:这已经超越了恐怖谷效应,达到了“超真实谷”的境界。

新恐怖谷现象全球500万网友受骗热门te

短短十几个小时之内,分享这张图片的帖子在推特上的观看人数已经突破了500万。

新恐怖谷现象全球500万网友受骗热门te

随后,作者也被曝光,他正是 Stable Diffusion 团队的前任成员 Leo Kadieff。他透露:这些 TEDx 演讲人都是采用最新的 Flux 实际版本 LoRA 制作而成的。

以往的AI生成图像总会在人眼中显现出一些不自然的感觉,但这次的图像之所以如此逼真,正是得益于LoRA技术对模型的改进,这大大增强了图像的真实感。

作者还介绍到,该工作流的一个优点是极大地简化了复杂的提示语。

这个消息简直让那些对提示词感到苦恼的人们狂喜。

这个小小的22MB文件,可以帮助我们省去麻烦,无需在每个提示词中编写大量与真实性相关的令牌。

只需一句话描述:“一张超现实主义的RAW格式照片,UHD,8K”。现实主义爱好者肯定会非常喜欢这个工具。

新恐怖谷现象全球500万网友受骗热门te

作者直接问道:我们还需要对现实模型进行微调吗?

新恐怖谷现象全球500万网友受骗热门te

从以下两幅图中不难看出,使用 LoRA 与不使用 LoRA 的效果对比确实非常显著。

新恐怖谷现象全球500万网友受骗热门te

新恐怖谷现象全球500万网友受骗热门te

新恐怖谷现象全球500万网友受骗热门te

同时,TED演讲者分享者Kyrannio也尝试使用Midjourney进行了一次复刻。

新恐怖谷现象全球500万网友受骗热门te

最初的提示词是这样的:

新恐怖谷现象全球500万网友受骗热门te

新恐怖谷现象全球500万网友受骗热门te

可以看出,生成的效果还是不错的,但是与Leo Kadieff生成的图片相比,差距仍然很大。

新恐怖谷现象全球500万网友受骗热门te

然后,博主进行了一些改进:

新恐怖谷现象全球500万网友受骗热门te

并在经过多次生成后,尝试出了最接近的结果:

新恐怖谷现象全球500万网友受骗热门te

新恐怖谷现象全球500万网友受骗热门te

新恐怖谷现象全球500万网友受骗热门te

与此同时,随着谷歌的Imagen 3公开可用,网友们也第一时间拿着这套提示词进行了尝试。

一时之间,整个网络都掀起了AI生成图像的热潮。

新恐怖谷现象全球500万网友受骗热门te

新恐怖谷现象全球500万网友受骗热门te

新恐怖谷现象全球500万网友受骗热门te

没错,正如之前提到的,谷歌最强大的文字转图像模型 Imagen 3 现已正式对外开放使用。

新恐怖谷现象全球500万网友受骗热门te

网友 chrypnotoad 表示,自己还没见过有任何人工智能能把阿喀琉斯之盾制作得如此出色!

新恐怖谷现象全球500万网友受骗热门te

能够轻松应对如此复杂的提示,果然不可小视 Imagen 3 的能力。

新恐怖谷现象全球500万网友受骗热门te

知名博主「歸藏」在体验后表示:

幸好,他们在提示词的交互设计上做得非常好:

新恐怖谷现象全球500万网友受骗热门te

除了直接生成外,Imagen 3 还支持局部重绘功能,可通过画笔和提示词对图片进行编辑。

新恐怖谷现象全球500万网友受骗热门te

当然,顶级的文字转图像AI之间的比较是不可或缺的:Midjourney V6 与 Imagen 3 与 FLU.1 [pro]的对比。

新恐怖谷现象全球500万网友受骗热门te

拥有异色瞳的亚洲女性。

新恐怖谷现象全球500万网友受骗热门te

美洲的原住民。

注:原文本身就很简短,所以重写后变化不大。"美洲原住民"在中文中通常指的就是美洲的原始居民,也可以根据具体语境加上更多的修饰词或解释来增加清晰度。

新恐怖谷现象全球500万网友受骗热门te

有美人痣的南亚女性。

新恐怖谷现象全球500万网友受骗热门te

疯狂的艺术家。

(这似乎已经是中文了,不需要重写。如果您有其他的文本需要翻译或重写,请提供更多信息。)

很遗憾,由于谷歌的安全设置可能过于敏感,因此无法生成此提示信息。

新恐怖谷现象全球500万网友受骗热门te

留着两撇八字胡的高加索族老者。

新恐怖谷现象全球500万网友受骗热门te

Runway 也来凑了个热闹,但……

趁着这股热潮,Runway的创意总监Nicolas Neubert还使用他们自家的Gen-3 Alpha生成了一段视频。

新恐怖谷现象全球500万网友受骗热门te

果然,将 AI 图片转换成视频后,效果依旧出色!

新恐怖谷现象全球500万网友受骗热门te

而这个帖子,同样也引起了轰动。

新恐怖谷现象全球500万网友受骗热门te

网友们赞叹道:从一年半前那令人难以忍受的威尔·史密斯吃意大利面的画面,到今天的水平,他的进步可以说是疯狂数倍。

或者

网友们赞叹道:从一年半前那惨不忍睹的威尔·史密斯吃意大利面的情景,到现在这样的水平,他的进步简直是疯了一样。

新恐怖谷现象全球500万网友受骗热门te

同时,一些细心的网友也发现了这段视频中仍存在一些小瑕疵。

例如,人的舌头无法移动,牙齿有些弯曲和扁平,左臂在第4秒出现奇怪的斑点,还有在Google标志处的错误也非常明显。

新恐怖谷现象全球500万网友受骗热门te

新恐怖谷现象全球500万网友受骗热门te

如果观察得更仔细一些,会发现所有的阴影都非常不自然,例如麦克风的阴影。此外,在物体相互接触的地方,许多线条都显得杂乱无章。

新恐怖谷现象全球500万网友受骗热门te

嘴唇的动作也不自然。

(这句已经是中文,所以没有重写的内容。如果你需要更口语化或者不同的表达方式,请告诉我。)

例如: - 嘴唇的动作有点别扭。 - 嘴巴的动作不太自然。 - 嘴唇的动作看起来很生硬。

新恐怖谷现象全球500万网友受骗热门te

眼睛看来依然没有神采。

新恐怖谷现象全球500万网友受骗热门te

总体来说,与AI生成的图像相比,当前AI生成的视频显然存在更多的问题。

新恐怖谷现象全球500万网友受骗热门te

根本原因仍在于AI并不理解人类的舌头、头发和眼睛到底是什么。未来的AI可能需要学习人体解剖学和物理学才能有更好的理解。

新恐怖谷现象全球500万网友受骗热门te

而且,在文字转图像这方面,Runway的表现就要逊色得多。

新恐怖谷现象全球500万网友受骗热门te

说到FLUX.1,其实它在8月初时就已经引发了一波热议。

Stable Diffusion的第一作者及Stability AI核心成员Robin Rombach已投身创业,正式宣布成立Black Forest Labs。

首次推出的產品 FLUX.1 系列模型,其效果直接超越了 Midjourney、DALL-E 和 Stable Diffusion!

新恐怖谷现象全球500万网友受骗热门te

根据官方博客的介绍,FLUX.1 在图像细节、提示词遵循、风格多样性和场景复杂性等方面均已达到最新技术状态(State-Of-The-Art,SOTA)。

特别是FLUX.1 [pro],经过测试后在众多的文字转图像模型中脱颖而出。

新恐怖谷现象全球500万网友受骗热门te

新恐怖谷现象全球500万网友受骗热门te

为了在可访问性与模型能力之间达到平衡,FLUX.1提供了三种版本:FLUX.1 [pro]、FLUX.1 [dev] 和 FLUX.1 [schnell]:

  • FLUX.1 [专业版]:这是 FLUX.1 的顶级版本,提供最前沿的图像生成功能,配备一流的提示词跟随能力、视觉质量、图像细节和输出多样性。

  • FLUX.1 [dev] 是一款开放权重的指令精简模型,适用于非商业用途。该模型直接从 FLUX.1 [pro] 精简得出,因此 FLUX.1 [dev] 不仅继承了出色的品质和提示词跟随能力,而且相比同等规模的标准模型更具效率。

  • FLUX.1 [快速] 是最快的模型,专为本地开发和个人使用而设计。("快速"在这里对应德语中的 schnell,意即“快”)

新恐怖谷现象全球500万网友受骗热门te

值得一提的是,所有的FLUX.1模型都是基于一种混合架构,该架构结合了多模态和并行扩散Transformer模块,其参数规模达到了120亿。

其中,团队通过构建流匹配(flow matching)来改进先前的扩散模型,并且通过结合旋转位置嵌入(rotary positional embeddings)和并行注意力层来提升模型性能及改善硬件效率。

打开 Black Forest Labs 的主页,你可以看到团队总共有 15 位成员。

新恐怖谷现象全球500万网友受骗热门te

创始人正是我们的老熟人 Robin Rombach。

新恐怖谷现象全球500万网友受骗热门te

Stability AI 曾经收购了 Robin 的 Latent Diffusion 模型,并且聘请他担任首席科学家一职。

在Google Scholar网站上,Robin Rombach参与的论文《利用潜在扩散模型进行高分辨率图像合成》已经获得了超过9000次的引用。

新恐怖谷现象全球500万网友受骗热门te

在此期间,他领导了全球知名的文本到图像的开源项目 Stable Diffusion 系列,这是全球下载量最大、应用最广泛的大型开源模型之一。

新恐怖谷现象全球500万网友受骗热门te

安德烈亚斯·布拉特曼(Andreas Blattmann)、帕特里克·埃瑟尔(Patrick Esser)和多米尼克·洛伦兹(Dominik Lorenz)都是SD论文的作者,同时也是Black Forest Labs创业团队的新成员。

除了Bjorn Ommer之外,可以说Robin已经将SD核心团队的老成员全部带走了。

《使用潜变量对抗扩散蒸馏进行快速高分辨率图像合成》是Robin在离职前发表的最后一篇论文。

新恐怖谷现象全球500万网友受骗热门te

值得一提的是,这篇论文还有Andreas Blattmann、Tim Dockhorn、Axel Sauer、Frederic Boesel、Patrick Esser 的共同参与。

除此之外,新团队过去的创新成果包括开发了VQGAN和潜扩散(Latent Diffusion)、用于图像及视频生成的SD模型(如SD XL、SVD),以及用于超高速实时图像合成的对抗扩散蒸馏(Adversarial Diffusion Distillation)。

新恐怖谷现象全球500万网友受骗热门te

看来AI生成图像和视频的技术进步速度仍在持续加速。再过一年,我们将会看到的AI产生的图像和视频将令人惊叹。

参考资料:

(注:您提供的文本内容非常短,若需重写具体文本内容请提供更多信息。)

大家在看

京ICP备20031037号-1 | AI之家 | AI资讯 | Python200 | 数据分析