腾讯研发了快一年的混元文生图模型,说开源就开源了?

AIGC动态6个月前发布 admin
767 0 0
腾讯研发了快一年的混元文生图模型,说开源就开源了?

 

文章摘要


【关 键 词】 腾讯开源混元模型中文生成技术进步市场策略

本文主要介绍了腾讯公司开源的混元文生图大模型。该模型是国内首个中文原生的DiT架构模型,具备中英文双语理解及生成能力,特别擅长生成具有中国元素的内容,如古诗词、俚语、传统建筑、中华美食等。

混元文生图大模型解决了现有文生图工具对中文理解不足和不通用的问题。模型支持最多256个字符的输入,大大降低了用户的使用门槛。在长文本输入的基础上,模型还支持用户文本改写以及多轮绘画,确保生成结果的可用性。

该模型采用了DiT架构,具有强大的视觉生成能力。腾讯混元团队通过改进和优化模型算法、数据处理和工程化流程,提升了模型的生成效果。根据腾讯技术报告,混元文生图模型的效果远超开源的Stable Diffusion模型,是目前效果最好的开源文生图模型。

腾讯混元文生图大模型的开源行为被认为是一个积极的信号,有助于推动技术发展和应用。开源后,该模型已在Hugging Face平台及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。

此次开源被视为腾讯加入开源阵营的一个重要步骤。在大模型行业关于开源与闭源的争议中,腾讯选择了开放的模式。开源策略有助于抢占市场先机、优化模型和加速产品创新。未来,腾讯是否会推动大模型的进一步开源还有待观察。然而,混元文生图大模型的开源至少表明了腾讯在技术实力和开放合作方面的意愿。

原文和模型


【原文链接】 阅读原文 [ 3479字 | 14分钟 ]
【原文作者】 硅星GenAI
【摘要模型】 glm-4
【摘要评分】 ★★★★☆

© 版权声明

相关文章

暂无评论

暂无评论...