更美图像生成、直出分钟级视频,国产自研DiT架构的越级之旅

更美图像生成、直出分钟级视频,国产自研DiT架构的越级之旅

 

文章摘要


【关 键 词】 AIGC趋势智象未来视觉多模态视频生成技术领先

2024年,AIGC领域特别是文生视频赛道呈现出显著的发展趋势,其中智象未来(HiDream.ai)作为国内专注于构建视觉多模态基础模型及应用的生成式AI初创公司,以其自主研发的模型和一站式AI图像及视频生成平台「Pixeling 千象」,引起了广泛关注。

智象大模型2.0的升级,基于中文原生的Diffusion Transformer(DiT)架构,不仅优化了底层架构、训练数据和策略,还在图像和视频生成上实现了质的飞跃。

升级后的模型在图像生成上更具美感和艺术性,同时在图像中文字嵌入和分钟级视频生成方面也展现了强大的能力。

智象大模型2.0在文生图技能上进行了显著的改进,生成的图像不仅美感和艺术性得到提升,相关性也更强,能够更好地满足用户需求。

在视频生成方面,智象大模型2.0支持的视频时长从15秒提升至分钟级,实现了业界较高水平。

此外,模型还支持可变时长和尺寸的视频生成,以及4K超清画质,使得生成的视频在动作流畅性、细节渲染上都有显著提升。

智象未来在多模态视觉生成领域的技术积累和创新,为其在AIGC赛道上奠定了坚实的基础。

公司不仅在C端获得了超过百万的单月访问量和千万的AI图像及视频生成总量,而且在B端与多家企业达成战略合作,将模型能力应用到多个行业中,发挥出模型的商业潜能。

智象大模型的持续迭代和实际体验的提升,展示了公司在视觉多模态生成方向上的快速发展和行业领导地位。

随着7月中旬文生视频功能的上线,智象未来有望进一步巩固其在AIGC领域的领先地位,并为用户带来更加丰富和高质量的视觉体验。

豆包-智能助手

原文和模型


【原文链接】 阅读原文 [ 4628字 | 19分钟 ]
【原文作者】 机器之心
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

© 版权声明

相关文章

暂无评论

暂无评论...