腾讯研发了快一年的混元文生图模型，说开源就开源了？

AIGC动态2年前 (2024)发布 admin

2,993 0 0

文章摘要

本文主要介绍了腾讯公司开源的混元文生图大模型。该模型是国内首个中文原生的DiT架构模型，具备中英文双语理解及生成能力，特别擅长生成具有中国元素的内容，如古诗词、俚语、传统建筑、中华美食等。

混元文生图大模型解决了现有文生图工具对中文理解不足和不通用的问题。模型支持最多256个字符的输入，大大降低了用户的使用门槛。在长文本输入的基础上，模型还支持用户文本改写以及多轮绘画，确保生成结果的可用性。

该模型采用了DiT架构，具有强大的视觉生成能力。腾讯混元团队通过改进和优化模型算法、数据处理和工程化流程，提升了模型的生成效果。根据腾讯技术报告，混元文生图模型的效果远超开源的Stable Diffusion模型，是目前效果最好的开源文生图模型。

腾讯混元文生图大模型的开源行为被认为是一个积极的信号，有助于推动技术发展和应用。开源后，该模型已在Hugging Face平台及Github上发布，包含模型权重、推理代码、模型算法等完整模型，可供企业与个人开发者免费商用。

此次开源被视为腾讯加入开源阵营的一个重要步骤。在大模型行业关于开源与闭源的争议中，腾讯选择了开放的模式。开源策略有助于抢占市场先机、优化模型和加速产品创新。未来，腾讯是否会推动大模型的进一步开源还有待观察。然而，混元文生图大模型的开源至少表明了腾讯在技术实力和开放合作方面的意愿。

原文和模型

【原文链接】 阅读原文 [ 3479字 | 14分钟 ]
【原文作者】 硅星GenAI
【摘要模型】 glm-4
【摘要评分】 ★★★★☆

智谱AI

智谱AI是一家国内的AI大模型...

# AIGC动态 # 图像生成 # 大模型 # 中文生成 # 市场策略 # 技术进步 # 混元模型 # 腾讯开源

文章版权归作者所有，未经允许请勿转载。

大模型预测，下一个token何必是文字？

量子位

2,907

铁厂千万粉丝大网红，可以随叫随到？

硅星人Pro

2,553

AI卷翻科研！DeepMind 36页报告：全球实验室被「AI科学家」指数级接管

新智元

2,529

六英寸晶圆，退出历史舞台？

admin

1,702

GaN，竞争激烈

admin

3,089

最难方言温州话被攻克！中国电信语音大模型支持30种方言，这题GPT-4o可不会做啊

量子位

3,189

暂无评论

暂无评论...

腾讯研发了快一年的混元文生图模型，说开源就开源了？

文章摘要

原文和模型

阿里向左，腾讯向右？

联发科牵手英伟达，AI PC变天了？！

相关文章

暂无评论

热门网址

热门文章

腾讯研发了快一年的混元文生图模型，说开源就开源了？

文章摘要

原文和模型

阿里向左，腾讯向右？

联发科牵手英伟达，AI PC变天了？！

相关文章

暂无评论

Trac-AI IDE

星辰Agent

讯飞文书-办公助手

热门网址

热门文章