作者信息
【原文作者】 甲子光年
【作者简介】 甲子光年是一家科技智库,包含智库、社群、企业服务版块,立足中国科技创新前沿阵地,动态跟踪头部科技企业发展和传统产业技术升级案例,推动人工智能、大数据、物联网、云计算、新能源、新材料、信息安全、大健康等科技创新在产业中的应用与落地。
【微 信 号】 jazzyear
文章摘要
【关 键 词】 Sora、视频大模型、AI视频、国产模型、技术路线
在这篇文章中,作者赵健和王珽探讨了全球惊艳的Sora视频大模型与其他视频大模型之间的差距。通过将Sora的提示词分别给到Runway(Gen-2)、Pika(Pika 1.0)、爱诗科技(PixVerse)、HiDream.ai(Pixeling)四家AI视频公司的模型产品,作者们直观地展示了视频效果的对比。尽管Sora表现出了卓越的效果,但需要注意的是,Sora的官方视频案例可能经过了多次优化,而其他模型则是在默认参数下生成的效果。此外,Sora目前仅向OpenAI内部安全风控团队及少数视觉艺术家、设计师和电影制作人员提供访问权限。
文章还提到,Pika、PixVerse等模型即将更新版本,届时可能会有更好的表现。随着OpenAI公布技术路线,视频领域的竞争将变得更加激烈。文章通过六个方面的对比,包括时长对比、本文理解能力、3D一致性与运动效果、细节还原、图片生成视频以及数学理解与物理理解,展示了各个模型的表现。尽管Sora在某些方面表现出色,但其他模型在默认参数下的表现也相当接近。最后,作者强调,Sora的官方视频案例可能经过了多次优化,而其他模型则是在默认参数下一次生成的效果,因此本次对比仅供参考。其他视频模型也将很快迎来更新。
原文信息
【原文链接】 阅读原文
【原文字数】 2282
【阅读时长】 8分钟
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...