算数不行、还不懂中国文化,大模型现在抢不了设计师的饭碗! | AI 测评室

AIGC动态9个月前发布 ai-front
860 0 0
算数不行、还不懂中国文化,大模型现在抢不了设计师的饭碗! | AI 测评室

 

文章摘要


【关 键 词】 AI测评文生图中国文化图像生成设计作品

这篇文章是关于AI大模型文生图领域的测评。作者选择了四个模型:文心一格360智绘美图MiracleVision 4.0GPT-4,通过同题多解的方式,逐一测评了它们的文生图能力。测评分为三个阶段:初级、中级和终极考验。

在初级考验中,作者测试了大模型们对实体的识别和生成能力。在简单场景下,所有模型都生成了符合描述的图像,但文心一格生成的小猫头部偏大。在复杂场景中,大模型们的表现出现了问题,如文心一格未能准确生成10只骆驼,360智绘只生成了5只骆驼,而GPT-4则生成了过多的骆驼。在不同实体组合的场景中,只有GPT-4成功完成了任务。

中级考验中,作者测试了大模型们对中国文化的理解。在诗词主题中,GPT-4更准确地理解了诗句的意境,而其他模型未能准确生成白菊花。在节日主题中,GPT-4再次胜出,成功生成了符合描述的图像。在成语主题中,GPT-4的理解偏差较小,但仍未能完全理解成语的含义。

终极考验中,作者测试了大模型们是否能替代画家和设计师的工作。在油画风格的场景中,文心一格MiracleVision 4.0GPT-4都准确生成了图像,但360智绘的表现不佳。在电影院宣传海报的生成中,MiracleVision 4.0成功地在图像中加入了文字,而GPT-4展现了较好的想象力。在饮品广告的生成中,GPT-4的画面美观且细节丰富。

综上所述,大模型们在文生图领域的表现参差不齐,有惊喜也有不足。尽管它们能够捕捉文字的精髓并转化为图像,但在理解中国文化和生成高质量设计作品方面仍有待提高。设计师们目前无需担心被大模型取代。作者还提到了即将发布的《2023年第4季度中国大模型季度监测报告》,并推荐了AI前线的《AI测评》栏目,以及关于Sora技术和应用的解读视频。

原文和模型


【原文链接】 阅读原文 [ 3494字 | 14分钟 ]
【原文作者】 AI前线
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...