超越DALL-E 3等顶级模型,谷歌开放访问Imagen 3文本生成图像AI
编辑日期:2024年08月16日
在今年5月的I/O开发者大会上,谷歌宣布了Imagen 3模型,并在6月邀请了部分Vertex AI用户进行试用测试,现在正式对美国用户开放。
DeepMind 的负责人德米斯·哈萨比斯(Demis Hassabis)表示,与前一代产品 Imagen 2 相比,Imagen 3 能更精确地理解和将文本提示转化为图像。此外,它所产生的图象更加“富有创造性和细节”,同时减少了模型产生的干扰元素和错误。
在谷歌的人工和自动评估中,Imagen 3 的表现超越了 Imagen 2、DALL-E 3、Midjourney v6、Stable Diffusion 3 以及 Stable Diffusion XL 1.0。尤其在将文本描述与生成图像的匹配度,以及处理详细提示方面,Imagen 3 展现出优异性能。
以下是网友提供的的对比图片: