更美图像生成、直出分钟级视频，国产自研DiT架构的越级之旅

AIGC动态1年前 (2024)发布 almosthuman2014

2,848 0 0

文章摘要

2024年，AIGC领域特别是文生视频赛道呈现出显著的发展趋势，其中智象未来（HiDream.ai）作为国内专注于构建视觉多模态基础模型及应用的生成式AI初创公司，以其自主研发的模型和一站式AI图像及视频生成平台「Pixeling 千象」，引起了广泛关注。

智象大模型2.0的升级，基于中文原生的Diffusion Transformer（DiT）架构，不仅优化了底层架构、训练数据和策略，还在图像和视频生成上实现了质的飞跃。

升级后的模型在图像生成上更具美感和艺术性，同时在图像中文字嵌入和分钟级视频生成方面也展现了强大的能力。

智象大模型2.0在文生图技能上进行了显著的改进，生成的图像不仅美感和艺术性得到提升，相关性也更强，能够更好地满足用户需求。

在视频生成方面，智象大模型2.0支持的视频时长从15秒提升至分钟级，实现了业界较高水平。

此外，模型还支持可变时长和尺寸的视频生成，以及4K超清画质，使得生成的视频在动作流畅性、细节渲染上都有显著提升。

智象未来在多模态视觉生成领域的技术积累和创新，为其在AIGC赛道上奠定了坚实的基础。

公司不仅在C端获得了超过百万的单月访问量和千万的AI图像及视频生成总量，而且在B端与多家企业达成战略合作，将模型能力应用到多个行业中，发挥出模型的商业潜能。

智象大模型的持续迭代和实际体验的提升，展示了公司在视觉多模态生成方向上的快速发展和行业领导地位。

随着7月中旬文生视频功能的上线，智象未来有望进一步巩固其在AIGC领域的领先地位，并为用户带来更加丰富和高质量的视觉体验。

原文和模型

【原文链接】 阅读原文 [ 4628字 | 19分钟 ]
【原文作者】 机器之心
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

Moonshot AI

月之暗面是一家 AI 初创大模...

# AIGC动态 # 图像生成 # 大模型 # 视频生成 # AIGC趋势 # 智象未来 # 视觉多模态

文章版权归作者所有，未经允许请勿转载。

新年大礼！阿里刚开源视觉 AI Agent模型—Qwen2.5-VL

AIGC开放社区

1,471

HiDream CTO 姚霆：Sora 出圈，中国 AI 创业公司的机会在哪里？

Founder Park

2,054

大模型预测，下一个token何必是文字？

量子位

2,163

我们和8位“视听合伙人”聊了聊，如何让“好内容”直达你的客厅

硅星人Pro

1,161

下注端到端：一场具身智能的谨慎豪赌

AI科技评论

1,693

Jeff Dean回忆谷歌趣事：吴恩达激励自己继续研究，Hinton曾是最强「实习生」

机器之心

1,524

暂无评论

暂无评论...

更美图像生成、直出分钟级视频，国产自研DiT架构的越级之旅

文章摘要

原文和模型

WAIC上，高通这一波生成式AI创新，让我们看到了未来

马斯克豪掷40亿训Grok-3！红杉高盛大泼冷水，AI收支鸿沟或已达5000亿美元

相关文章

暂无评论

热门网址

热门文章

更美图像生成、直出分钟级视频，国产自研DiT架构的越级之旅

文章摘要

原文和模型

WAIC上，高通这一波生成式AI创新，让我们看到了未来

马斯克豪掷40亿训Grok-3！红杉高盛大泼冷水，AI收支鸿沟或已达5000亿美元

相关文章

暂无评论

Trac-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

热门网址

热门文章