今天起,汉字也能AI视频生成了!《滕王阁序》直接拿捏到位了

AIGC动态2天前发布 QbitAI
78 0 0
今天起,汉字也能AI视频生成了!《滕王阁序》直接拿捏到位了

 

文章摘要


【关 键 词】 视频生成AI技术物理规律多风格技术创新

阿里通义万相最近推出了两个新版本的视频生成模型,通义万相2.1极速版和通义万相2.1专业版,分别针对视频生成的速度和质量进行了优化。这两个模型在处理复杂运动、还原真实物理规律、提升影视质感和优化指令遵循方面表现出色,其性能在权威评测集VBench中以84.70%的成绩位居榜首。

新模型不仅能够生成复杂的汉字,还能生成英文单词,并带有各种视觉效果。它们能够理解并生成《滕王阁序》等文学作品的意境,以及精确还原切肉等动作的物理规律。此外,通义万相还能处理各种风格的视频,如中世纪真人写实风和卡通动画,并且用户可以自定义视频尺寸。

技术层面上,通义万相采用了VAE与DiT架构协同发力,通过视频VAE高效压缩视频信息并提取关键特征,而DiT则捕捉视频中的时空动态。团队还实现了超长序列训练的突破,运用4D并行策略,包括数据并行、全量分片数据并行、环形注意力机制和优化技术,以提升训练效率和稳定性。最后,团队通过自动化数据构建管线和多维度评估体系,驱动数据和评估的优化。

阿里通义万相的新版本不仅在技术创新上取得了进展,而且在实际体验上也走到了AI视频领域的前沿,能够生成汉字的能力在全球范围内也是独一无二的。现在,用户可以在线免费体验这些模型,或者通过阿里云百炼调用API来打造自己的专属应用。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 2285字 | 10分钟 ]
【原文作者】 量子位
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★☆☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...