算数不行、还不懂中国文化，大模型现在抢不了设计师的饭碗！ | AI 测评室

AIGC动态1年前 (2024)发布 ai-front

2,046 0 0

文章摘要

这篇文章是关于AI大模型在文生图领域的测评。作者选择了四个模型：文心一格、360智绘、美图MiracleVision 4.0和GPT-4，通过同题多解的方式，逐一测评了它们的文生图能力。测评分为三个阶段：初级、中级和终极考验。

在初级考验中，作者测试了大模型们对实体的识别和生成能力。在简单场景下，所有模型都生成了符合描述的图像，但文心一格生成的小猫头部偏大。在复杂场景中，大模型们的表现出现了问题，如文心一格未能准确生成10只骆驼，360智绘只生成了5只骆驼，而GPT-4则生成了过多的骆驼。在不同实体组合的场景中，只有GPT-4成功完成了任务。

中级考验中，作者测试了大模型们对中国文化的理解。在诗词主题中，GPT-4更准确地理解了诗句的意境，而其他模型未能准确生成白菊花。在节日主题中，GPT-4再次胜出，成功生成了符合描述的图像。在成语主题中，GPT-4的理解偏差较小，但仍未能完全理解成语的含义。

终极考验中，作者测试了大模型们是否能替代画家和设计师的工作。在油画风格的场景中，文心一格、MiracleVision 4.0和GPT-4都准确生成了图像，但360智绘的表现不佳。在电影院宣传海报的生成中，MiracleVision 4.0成功地在图像中加入了文字，而GPT-4展现了较好的想象力。在饮品广告的生成中，GPT-4的画面美观且细节丰富。

综上所述，大模型们在文生图领域的表现参差不齐，有惊喜也有不足。尽管它们能够捕捉文字的精髓并转化为图像，但在理解中国文化和生成高质量设计作品方面仍有待提高。设计师们目前无需担心被大模型取代。作者还提到了即将发布的《2023年第4季度中国大模型季度监测报告》，并推荐了AI前线的《AI测评室》栏目，以及关于Sora技术和应用的解读视频。