OpenAI「AI 视频」工具出炉：别争了，「视频 GPT」还是我的！

AIGC动态2年前 (2024)发布 geekpark

2,631 0 0

作者信息

【原文作者】 极客公园
【作者简介】 用极客视角，追踪你最不可错过的科技圈。欢迎关注播客（小宇宙App）👉开始连接LinkStart
【微信号】 geekpark

文章摘要

OpenAI 最近在其官方博客中介绍了一项名为 Sora 的新型 AI 模型，这是一个能够根据文本描述生成视频的模型。Sora 模型的亮点在于其能够生成长达 60秒 的视频，这些视频不仅视觉质量高，还能准确遵循用户的提示词，展现出清晰准确的角色和一致的主题。这一技术进步被视为通向 AGI（通用人工智能） 的重要里程碑。

Sora 模型的目标是「理解和模拟运动中的物理世界」。它能够生成包含多个角色、特定类型的运动以及在特定主题和背景下的精确细节的复杂场景视频。然而，尽管 Sora 的能力令人印象深刻，OpenAI 也承认该模型在模拟复杂场景下的物理世界和理解某些场景下的因果关系方面还存在不足。

OpenAI 没有立即公开 Sora 模型，而是选择与有限数量的外部人士分享，以便早期获得反馈和合作。此外，OpenAI 也在采取一些重要的安全措施，以防止 Sora 被滥用来制造错误信息或其他有害内容。

Sora 被称为「物理世界 GPT」，其背后的技术实现包括使用扩散模型和 Transformer 架构，这些都是其能够生成高质量视频的关键。OpenAI 认为，Sora 作为能够理解和模拟现实世界的模型基础，将是实现 AGI 的重要里程碑。

Sora 模型的发布对视频生成领域的影响是巨大的，它不仅对已经发布产品的初创公司形成了压力，也标志着基于上一代模型技术的产品比赛已经结束，开启了一场全新的技术比赛。