超越DALL-E 3等顶级模型，谷歌开放访问Imagen 3文本生成图像AI

编辑日期：2024年08月16日

超越dalle-3等顶级模型谷歌开放访问

在今年5月的I/O开发者大会上，谷歌宣布了Imagen 3模型，并在6月邀请了部分Vertex AI用户进行试用测试，现在正式对美国用户开放。

DeepMind 的负责人德米斯·哈萨比斯（Demis Hassabis）表示，与前一代产品 Imagen 2 相比，Imagen 3 能更精确地理解和将文本提示转化为图像。此外，它所产生的图象更加“富有创造性和细节”，同时减少了模型产生的干扰元素和错误。

在谷歌的人工和自动评估中，Imagen 3 的表现超越了 Imagen 2、DALL-E 3、Midjourney v6、Stable Diffusion 3 以及 Stable Diffusion XL 1.0。尤其在将文本描述与生成图像的匹配度，以及处理详细提示方面，Imagen 3 展现出优异性能。

以下是网友提供的的对比图片：

超越dalle-3等顶级模型谷歌开放访问