模型信息
【模型公司】 月之暗面
【模型名称】 moonshot-v1-32k
【摘要评分】 ★★☆☆☆
文章摘要
【关 键 词】 Sora、视频生成、技术挑战、物理特性、模型局限
在彭博社对OpenAI的Sora进行的测试中,Sora在将文本提示转换为视频方面表现出了一些技术局限性。
尽管Sora能够生成视频,但在处理复杂的场景时,如物体的物理特性和交互时,会出现一些不合理的动作,例如物体相互穿过、变形等。
OpenAI的研究科学家Bill Peebles承认了这些问题,并指出Sora在模拟现实世界时面临一系列挑战。
Sora的技术报告中提到了其主要局限,包括物理交互的准确性、对象状态变化的一致性、长期样本的连贯性、物体的自发出现、手部和身体部位的处理、计算资源的需求、模型的泛化能力以及视频编辑和扩展的能力。
尽管Sora采用了Diffusion transformer技术,类似于人类的认知过程,但其在处理复杂场景时仍需改进。
OpenAI表示,随着技术的突破,这些问题将得到解决。
原文信息
【原文链接】 阅读原文
【阅读预估】 1611 / 7分钟
【原文作者】 极客公园
【作者简介】 用极客视角,追踪你最不可错过的科技圈。欢迎关注播客(小宇宙App)👉开始连接LinkStart
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...