文章摘要
【关 键 词】 AI视频、性能提升、物理模拟、语义理解、行业领先
近期,AI视频公司可灵推出了1.6版本,相较于之前的1.5版本,新版本在图生视频能力上取得了显著进步。尽管版本号仅提升了0.1,但性能提升显著,且价格保持不变,5秒高品质视频仍为35灵感一条。新版本的更新重点在于物理规律真实感、人物运动表演和语义理解三个方面。
在物理规律真实感方面,可灵1.6版本能够更准确地模拟切食物、倒茶等动作,甚至能够模拟跳舞等复杂动作。人物运动表演方面,1.6版本在表情细节和肢体动作上都有显著提升,能够更准确地模拟人物动作和表情变化。语义理解方面,1.6版本在连续动作测试中表现出色,能够准确识别和响应提示词,实现更自然的动作顺序和画面理解。
尽管可灵1.6版本在图生视频能力上取得了巨大进步,但仍有改进空间。例如,生成慢动作的概率较大,审美方面有待加强,以及在多人复杂场景下,人物手指等细节仍可能出现BUG。尽管如此,可灵1.6版本的表现在当前可用的AI视频中已是最佳之一。
自今年6月6日正式上线以来,可灵在短短半年时间内取得了显著进步,几乎改写了整个行业。期待可灵在未来的版本更新中继续带来更大的惊喜,从“中国的Sora”成长为“世界的可灵”。
原文和模型
【原文链接】 阅读原文 [ 2995字 | 12分钟 ]
【原文作者】 数字生命卡兹克
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★☆☆
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...