跳转至

🔥AI副业赚钱星球

点击下面图片查看

郭震AI

Midjourney的位置动摇了吗?又一匹AI绘图黑马浮现,附带四款产品的首次实战测试。

编辑日期:2024年08月25日

一系列的进展接踵而至:8 月 21 日,Ideogram 正式发布了 2.0 版本,并声称其文本渲染能力得到了增强。

没错,正是那个项目,它成立于去年8月,由谷歌的四位AI绘画专家共同离职创立。该项目曾经获得众多AI业界领袖的投资。

此次,Ideogram 还直接向 Flux 发起挑战,其官方表示 Ideogram 的人类评估明显优于 Flux Pro。

请注意,Flux是由Stable Diffusion的原团队创建的,最近因为生成逼真的TED演讲"照片"而在网络上广为流传。

此外,一周前,谷歌正式发布了Imagen 3,据官方评估称,其性能优于DALL-E 3、Midjourney v6、Stable Diffusion 3等绘画模型。

可能是因为受到了某种刺激(doge),Midjourney 也进行了转变,于8月22日向所有用户推出了免费的网页版本。

这下可有好戏看了!既然大家都自称很强,那我们就把大家聚在一起,来一场面对面的PK吧。

midjourney的位置动摇了吗又一匹

首先,请出我们的四位参赛选手(均使用网页版):

一号选手:Ideogram 2.0。每日免费获得 10 积分,1 积分可生成 4 张图片,因此每天最多可生成 40 张图片。

2号选手:Flux.1。黑森林官方在Hugging Chat提供了免费试用版本(请选择FLUX.1 Schnell版本)。

3号选手:Imagen 3。在Image FX上可进行无限次免费使用。

4号选手:Midjourney。免费试用期间仅提供生成25张图片的机会。

现在正式进入比赛环节。

黑猴子全部出问题了

注:原句可能存在语义不明的问题,"翻车"和"全"可能指代的情况有很多种。因此在重写时需要根据具体情境调整。以上是一种可能的理解方式,如果需要更准确的翻译或改写,请提供更多的上下文信息。

首先,为了测试这些海外的AI是否能理解中文提示,我们也可以顺势借用当前最热门的黑猴主题来测试一下。

不出所料,意外还是发生了……

midjourney的位置动摇了吗又一匹

相信大家第一眼都被3号的大红叉吸引了。确实,同样的提示词下,只有3号的Imagen 3拒绝了生成请求。

midjourney的位置动摇了吗又一匹

首先,我想到的是我们的提示词是否触发了版权保护。于是我试着删去了提示词中的“游戏角色”,但仍然收到无法生成的提示。

midjourney的位置动摇了吗又一匹

难道是Google Imagen 3不支持中文吗?于是我随机换了一个更简单的提示词,这下终于出现图片了。

但结果只是一个大错误,即便尝试了多个不同的中文提示词,最终得到的都是一些完全不相关的图案。看来谷歌 Imagen 3 对中文提示词确实存在问题。

midjourney的位置动摇了吗又一匹

midjourney的位置动摇了吗又一匹

在3号被淘汰后,再看看其余的设计,只有1号的Ideogram 2.0表现最为出色。2号还能隐约看到国产漫画的风格,而4号Midjourney则完全天马行空了~(主要就是毫不相关)最后还是要赞扬一下Ideogram 2.0,它准确地把握住了所有的关键元素。

虽然这并非我心中所期望的内容(我其实希望是关于黑神话的),但提供的信息确实非常贴合提示词,没有问题。

是真人还是AI?让人傻傻分不清

接下来,进入各位参赛者的舒适区 —— 人像生成。

回想当初,Midjourney 凭借一张天台上的情侣合影在网络上爆红;而现在,Flux 则是用一系列的TED演讲图片风靡了整个网络……

midjourney的位置动摇了吗又一匹

到底谁更胜一筹呢?答案即将揭晓。

一位红棕色头发的年轻男子,身穿一件蓝绿色且带有乳白色格子的衬衫,通过50mm的镜头捕捉到了一种复古风格。照片色彩饱满,焦点清晰,略带一丝复古的魅力。

midjourney的位置动摇了吗又一匹

先单独来看2号和4号,很明显,Midjourney赢了!

从细节来看,2号 Flux.1 有些微的小偏差,其衣服颜色多了两种,在一整片蓝绿色格子衬衫中显得格外突出。

另外,我们还在一开始时发现了一个Imagen 3独有的小特色:在生成内容之前会圈出关键词。

midjourney的位置动摇了吗又一匹

通过它完成的作品,我们可以恰好检验几位参赛者对关键元素(如蓝绿色的方格衬衫、50mm镜头等)的还原程度。

可以看出,总体上各位选手的表现都不错(除了2号选手),他们的还原度都很高并且都看向了镜头。而且,如果不是这些图像都是我亲自用AI生成的,真的很难一下子分辨出与真实人物的区别。(尴尬)

最后悄悄地说一句,4号选手Midjourney的颜值是最高的。

老大难问题:图片中显示的文字

在成功欺骗了所有人之后,现在是时候让AI尝尝苦头了——为图片添加文字。

这事一直是个棘手的问题,同时也成为了测试AI生成图像能力的一项标准。不多说了,直接让各位参赛者设计一张精美的广告牌。请大家自行代入客户(甲方)的角色来评判。

一个水平的黄铜牌,上面用时尚的手写体写着‘节日季节’,周围装饰着松树枝和冬青,背景则是深色的木头,特写镜头集中在金色的文字上。

midjourney的位置动摇了吗又一匹

快速扫视一下,看起来都不错,似乎都高度忠实于提示词吧?但是,如果用客户挑剔的眼光来看,问题就藏不住了。请注意,第2款Flux.1有偷工减料的现象,"Season"这个单词少了一个"S"。除了第2款外,其他的都还不错。看来各家的AI在文字渲染功能上都做了不少努力。

所以接下来就是,萝卜青菜,各有所爱,大家根据个人喜好来做选择吧。(我个人更倾向于Midjourney)另外,Ideogram 1号这次在型号升级中特别宣传了他们的“文字渲染”功能,大家可以多尝试一下。

midjourney的位置动摇了吗又一匹

参考麦当劳,制作AI广告。

最近,麦当劳邀请了11位由AI创造的美女为他们的薯条做宣传,引起了极大的关注。其实操作原理很简单:就是利用AI生成不同的角色图片来宣传薯条,并将这些图片整合成一段视频。令人意想不到的是,这个宣传方式的效果惊人,在Twitter平台上,相关的视频浏览量已经接近一千万次。

midjourney的位置动摇了吗又一匹

掌握财富密码后,我们正式开始行动。作为中国人,利用AI助力农业是必须的~

在一场赛博朋克风格的城市背景中,一个女孩正在推销她手中的有机农产品。

midjourney的位置动摇了吗又一匹

很好,3号选手再次选择了"躺平"。但这波操作确实让人有些困惑,提示词既不是中文,也没有明显的违规之处……

淘汰3号之后,1号选手Ideogram 2.0带来的商品种类最为多样,包括大白菜、西红柿、紫甘蓝等一应俱全。此外,他是唯一一个挂出文字标志来推广有机食品的,可以看出他非常努力~ 细看还会发现,只有1号在尽力模仿真人,而2号和4号则完全是二次元风格。

说实话(u1s1),如果以麦当劳的广告风格为参考标准,这次的生成结果确实未能达到理想的预期效果(希望能更加贴近现实)。不过还好,目前这几个AI工具都是可以免费使用的,多尝试几次也无妨,关键还是要掌握正确的方法。[doge]

midjourney的位置动摇了吗又一匹

别急着离开,其实还有一个更可靠的方法来赚钱—— 使用AI轻松制作商业宣传海报,这样就可以省下聘请摄影师、租赁场地和后期制作的费用,这不是很好吗?

在精致的背景下,一支光滑的口红管熠熠生辉,凸显其浓郁的色彩与顺滑的涂抹质感。通过锐利的焦点与一抹光泽,营造出奢华的感觉。

midjourney的位置动摇了吗又一匹

来考考大家,如果你需要为身边的某位女士挑选一支口红,你会选择哪一款呢?(终极考验来袭)嘿嘿,有没有人想要选4号呢?虽然4号Midjourney看起来非常高档,但这款黑色可能会有些小众哦。(选择时需谨慎)

除了它之外,接下来表现最好的是3号Imagen 3,底下的丝绒布料营造出一种奢华感,最重要的是,口红的质地非常真实。相比之下,1号和2号显得有些不自然,“塑料感”较强。

因此,在这一局中,总体来说,3号选手获胜。总结一下,总的来说,四位选手的表现都非常出色。特别提到的是,黑马选手Ideogram 2.0表现出色。

midjourney的位置动摇了吗又一匹

今年2月,Ideogram发布了1.0版本,而在短短的半年后,它已经进化并推出了2.0版本。实际上,Ideogram与谷歌有着密切的关系。该公司成立于去年8月,其初始团队中的前四位成员都是谷歌图文生成研究项目Imagen的研究论文作者。

midjourney的位置动摇了吗又一匹

CEO Mohammad Norouzi,论文共同一作,他在多伦多大学计算机科学博士就读期间拿到了谷歌 ML 博士奖学金。

midjourney的位置动摇了吗又一匹

毕业后,他在Google Brain工作了7年,职位也晋升到了高级研究科学家,主要研究领域为生成模型。此外,他还是谷歌神经机器翻译团队的创始成员之一,并且是Hinton团队自监督对比学习框架SimCLR的共同作者。

midjourney的位置动摇了吗又一匹

首席技术官(CTO)陈俊乐(William Chan),为该论文的共同第一作者。他曾先后在加拿大滑铁卢大学及卡内基梅隆大学就读。2012年加入谷歌后,他首先从事机器学习广告工程的工作,随后转至谷歌大脑进行自然语言处理(NLP)的研究。

midjourney的位置动摇了吗又一匹

联合创始人Jonathan Ho拥有UC伯克利的博士学位,他曾于OpenAI工作一年,之后加入了谷歌。他是Imagen论文的主要贡献者之一,并且是去噪扩散模型开创性论文《Denoising Diffusion Probabilistic Models》的第一作者;该论文的合著者Pieter Abbeel同时也是Ideogram AI的投资人。

midjourney的位置动摇了吗又一匹

联合创始人Chitwan Saharia,也是该论文的共同第一作者,拥有孟买理工学院本科学历,于2019年加入谷歌。在谷歌期间,他主要负责领导image-to-image扩散模型的相关工作。

midjourney的位置动摇了吗又一匹

创始团队中的另外三名成员之一,Shayaan Abdullah,曾是Twitter的机器学习工程师,他在去年4月离职,随后加入了Ideogram AI。

Jacob Lu 是一名软件工程师,在加入 Ideogram 之前曾在亚马逊等公司任职;Jenny Lei 是一名软件工程实习生,在加入 Ideogram AI 之前曾在谷歌实习。

可以看出来,Ideogram是由顶级的扩散模型研究团队组成的,并且从成立之初就获得了资本的青睐。

Ideogram的种子轮融资由a16z和Index Ventures领投,融资金额为1650万美元(当时大约等于1.2亿人民币)。个人投资者中包括了深度学习专家Andrej Karpathy、强化学习领域的知名人物Pieter Abbeel以及GitHub的联合创始人Tom Preston-Werner等。

midjourney的位置动摇了吗又一匹

此外,据多方消息来源,Ideogram在今年2月完成了新的一轮融资,据说成功募集了8000万美元(大约57亿人民币)的A轮融资。本轮融资由Andreessen Horowitz领投,其他参投方还包括Index Ventures、Redpoint Ventures、Pear VC和SV Angel。

看来,资金雄厚且技术先进的Ideogram无疑是AI生图领域的一匹黑马。

继续卷,不断地卷。

Ideogram 2.0 的链接:

请探索我们的网站:https://ideogram.ai/t/explore

中途链接:请注意,您提到的"Midjourney链接"可能需要具体的上下文信息。如果您是指某个特定的链接,请提供更多的相关信息。

请访问这个链接:https://www.midjourney.com/home

"Flux 的链接:"

如果您指的是具体的内容链接,请提供更多的信息,以便我能够更准确地帮助您。

请访问这个链接:https://huggingface.co/spaces/black-forest-labs/FLUX.1-schnell

Imagen3链接:

请访问这个链接以使用图像特效工具:https://aitestkitchen.withgoogle.com/tools/image-fx

参考链接:

注意:您未提供需要重写的具体内容,仅重写了“参考链接”部分。若需重写其他内容,请提供详细信息。

本文出自微信公众号:量子位(ID:QbitAI),作者:一水

大家在看

京ICP备20031037号-1 | AI之家 | AI资讯 | Python200 | 数据分析