跳转至

🔥AI副业赚钱星球

点击下面图片查看

郭震AI

实测四款AI生成图像工具,Midjourney的「霸主」地位难以动摇。

编辑日期:2024年08月24日

谁能成为AI生成图像领域的领头羊?是MJ、Ideogram 2.0、Flux,还是 Imagen 3?

在AI领域,从视频到图像的竞争从未停歇。

自从Flux生成的各种搞笑图像在网络上疯传之后,其他AI图像生成工具也开始迎头赶上:

今天,一向给人“高冷”印象的Midjourney宣布对所有用户提供一个月的免费试用期(但每位用户仅限免费生成25张图像);

与此同时,Ideogram也推出了其2.0版本,并宣称其文本渲染能力得到了加强;

而Google之前多次预告的AI图像生成模型Imagen 3也在不久前正式发布。

值得一提的是,Ideogram与Google之间还存在着某种“亲缘”关系。

-1-

向Midjourney等老牌竞争者发起挑战

今年2月,Ideogram发布了1.0版本。仅仅过了半年,它就进化到了2.0版本,并为每位用户提供每日免费生成40张图像的机会。

不得不承认,Ideogram 2.0的文字处理能力有了显著提升。无论是贺卡、T恤设计、海报还是插图,它都能准确地呈现更长、更精确的文本内容。

示例提示语:一款以珍珠奶茶为主题的现代网站设计。背景色为柔和的青绿色。页面中有一杯透明杯装的桃子珍珠奶茶。旁边是一台打开博客页面的桃子色笔记本电脑。还有一张舒适的青绿色弧形靠背椅子。页面上用现代字体写着:“放松身心,创作,居家工作”。

实测四款AI生成图像工具,Midjour

提示:这是以“庆祝爱”为主题的Hello Kitty三维渲染插图。Hello Kitty是画面的中心,周围环绕着五个散发温暖光芒的蓬松星形物体。每个星星上都用优雅的金色斜体字写着:“Be”、“快乐”、“善良”、“酷”和“感恩”。背景采用了鲜艳对比的黄色与粉色。场景中还装饰着柔和透明的粉红蝴蝶、小巧的红橙色心形图案以及精致的白色花朵,增添了几分浪漫与奇幻。

实测四款AI生成图像工具,Midjour

这是一个3D渲染图,展示了三种表情符号(开心、伤心及愤怒)并以新颖的时尚风格呈现。这些表情符号置于深色纸张背景上。在它们前面有一块展示着“治疗谈话”文字的面板。整幅画面搭配了出色的天气效果。

测试四种AI图像生成工具,Midjour

为了与FLUX一较高下,Ideogram 2.0 在写实图像领域也下了不少功夫。

该工具的现实主义风格能创造出极其逼真的图像,包括纹理、人物皮肤和头发等细节都栩栩如生。

测试四种AI图像生成工具,Midjour

测试四种AI图像生成工具,Midjour

有用户直接利用Ideogram 2.0生成图像,并通过Runway Gen-3将其转换为视频,成品几乎看不出任何瑕疵。

测试四种AI图像生成工具,Midjour

视频链接:https://mp.weixin.qq.com/s/0rSOfNfvS1yCVoYq9gM0Sw

此外,Ideogram 2.0 引入了差异化特性,新增了“调色板控制”功能,让用户能够从多种色彩方案中挑选,精确掌控图像色彩。这样,无论是保持品牌形象一致,还是营造特定氛围,都能够轻松达成。

实测四款AI生成图像工具,Midjour

据了解,去年 Ideogram 的用户创造了超过十亿张图像。为了便于检索和激发创意灵感,平台新增了搜索功能,用户只需输入文字就能快速找到所需图片。

例如,在聊天框中输入“happy birthday”,系统会自动展示一系列相关的图像。

实测四款AI生成图像工具,Midjour

除此之外,Ideogram 还发布了iOS应用程序,并推出了API测试版。

实测四款AI生成图像工具,Midjour

-2-

四大图像生成神器对决

根据官方介绍,在性能评估中,Ideogram 2.0 明显优于Flux Pro和OpenAI的DALLE-3。

实测四款AI生成图像工具,Midjour

实测四款AI生成图像工具,Midjour

既然如此,我们将让Ideogram 2.0与其他市场上顶尖的四款AI图像生成工具一较高下,以实力论英雄。

照片写实

提示:一位红发年轻女子身穿蓝白圆点裙装,采用helios 44-2 58mm f/2风格拍摄,色彩浓烈,照片级逼真技术,以深橙与白色为主色调,强烈而简约,网络摄像头摄影。

四款AI图像生成工具实际效果测试,Midjour

左上:Ideogram2.0 右上:Midjourney

左下:Imagen 3 右下:FLUX Pro

提示:在巴黎街头、路边及对面街道上的房屋,由Sony相机捕捉,高分辨率,杰作级,8K画质。

四款AI图像生成工具实际效果测试,Midjour

左上:Ideogram2.0 右上:Midjourney

左下:Imagen 3 右下:FLUX Pro

提示:最震撼的日式迷你挞,高分辨率照片,真实照片。相机:Canon EF,4K分辨率。| 灯光:自然光,电影静帧,摄影棚灯光 | 细节:超逼真,极致细节,100mm,f 2.8 Macro IS USM — 无水印。

实测四款AI生成图像工具,Midjour

左上:Ideogram2.0 右上:Midjourney

左下:Imagen 3 右下:FLUX Pro

提示:电影静帧,一位凌乱长发、疲惫不堪的年轻女子独自跳舞,日间派对结束时她已精疲力尽。

实测四款AI生成图像工具,Midjour

左上:Ideogram2.0 右上:Midjourney

左下:Imagen 3 右下:FLUX Pro

文本渲染

提示:一个水平放置的青铜色金属标志牌,上面用优雅字体写着“Studio Christmas”。标志牌两侧装饰着松果和常青树枝。背景是深色木纹,温暖色调与冷色调形成了鲜明对比。特写镜头仅聚焦于金色的文字,突出了其质感和设计感。这一场景唤起了圣诞节装饰的感觉。

测试四种AI图像生成工具,Midjour

左上:Ideogram2.0 右上:Midjourney

左下:Imagen 3 右下:FLUX Pro

提示:极简风的股票照片,一个小男孩戴着眼镜、穿着蓝色衬衫,并且有着金色头发。他手持一个“开学啦”标志牌,自信地微笑着站在一个阳光明媚的公园里。这是一张腰部以上的特写镜头,背景是模糊的绿色树木,整体呈现极简背景风格。

测试四种AI图像生成工具,Midjour

左上:Ideogram2.0 右上:Midjourney

左下:Imagen 3 右下:FLUX Pro

多种风格生成展示

提示:一群农民正在田间辛勤工作,他们种植着像垂直小花园般的南瓜。在一个复杂的场景中,微小的人物在巨大的、超大号南瓜顶部制作木板。背景是充满叶绿体的画面,营造出电影般的感觉。高清晰度的细节捕捉到了笛卡尔式的决心、创意的构图以及对微型角色状态的大胆特写镜头、轴向位移摄影技术、精致的细节,全部呈现在8K画质中。

四款AI图像生成工具的实际测试:Midjour

左上:Ideogram2.0 右上:Midjourney

左下:Imagen 3 右下:FLUX Pro

提示:兔子一家在房间里快乐地玩耍,采用迪士尼风格,3D画面,高精细度。

四款AI图像生成工具的实际测试:Midjour

左上:Ideogram2.0 右上:Midjourney

左下:Imagen 3 右下:FLUX Pro

主题:尤加利与薄荷经典清新滴液,简约包装设计。

左上:Ideogram2.0 | 右上:Midjourney

左下:Imagen 3 | 右下:FLUX Pro

-3-

由前谷歌工程师创立,并获得人工智能领域专家的投资,

说起来,Ideogram 与谷歌有着不解之缘。

谷歌可被视为人工智能领域的“黄埔军校”,在其内部孕育了许多优秀的产品和技术,但由于安全和伦理的考虑,许多潜力项目未能得到充分发展。因此,许多工程师选择离开谷歌,自主创业。

Ideogram 便是这样的一个例子。

2022年8月,Ideogram 成立,创始团队共有7人,成员来自 Google Brain、加州大学伯克利分校、卡内基梅隆大学和多伦多大学。

其中包括 CEO Mohammad Norouzi、联合创始人 Jonathan Ho、William Chan 和 Chitwan Saharia,他们都是谷歌的人工智能文转图模型 Imagen 的核心贡献者,相关的论文还入围了 NeurIPS 2022 最佳论文奖。

创业之前,Mohammad Norouzi 在谷歌大脑工作了近7年,职位晋升到了高级研究科学家,他的研究重点是生成模型,涉及多个领域,如 Imagen、Imagen Video、语音合成技术 WaveGrad、神经机器翻译以及用于视觉表示学习的对比学习等。

联合创始人 Jonathan Ho 拥有加州大学伯克利分校博士学位,并在扩散模型领域做出了重要贡献。当他离开谷歌时,业界普遍认为这对谷歌是一大损失。

实测四款AI生成图像工具,Midjour

2022 年 4 月,谷歌发布了视频扩散模型(Video Diffusion Models),首次展示了根据文本生成视频的良好成果。该论文的主要作者包括 Mohammad Norouzi 和 Jonathan Ho。

Jonathan Ho 还是去噪扩散概率模型(Denoising Diffusion Probabilistic Models)这一扩散模型基础工作的第一作者。(值得一提的是,该论文的合著者 Pieter Abbeel 同时也是该公司的投资者之一)。

Chitwan Saharia 在谷歌任职期间,主要负责领导图像到图像扩散模型的研究工作。

除了扩散模型方面的贡献外,Willian Chan 在谷歌工作时还参与了神经语音识别的研究,并与 Mohammad Norouzi 共同研究了用于语音合成的 WaveGrad 技术。

工具链接

延伸阅读

  • 实测最新文生图神器「FLUX.1」:「手刃」Midjourney?为时尚早

AI告别乱涂鸦!快手可图与海外书写高手Ideogram一决高下,谁更胜一筹?Midjourney遭遇最强挑战者,种子轮融资吸引众多投资大腕,其测试版甚至让马斯克一键穿越。

未来我们将带来更多有趣的AI评测内容,欢迎加入我们的社群进行交流。

四款AI图像生成工具实战测试,Midjour

大家在看

京ICP备20031037号-1 | AI之家 | AI资讯 | Python200 | 数据分析