Sora刷屏三天：挖来谷歌的人才，用着谷歌的技术，抢走谷歌的热搜

AIGC动态2年前 (2024)发布 admin

2,377 0 0

作者信息

【原文作者】 新硅NewGeek
【作者简介】 追踪每一个硅基生命的动向
【微信号】 XinguiNewgeek

文章摘要

【关键词】 OpenAI、Sora、视频生成、Gemini 1.5 PRO、技术创新

近日，OpenAI的视频生成模型Sora引发了广泛关注，尽管尚未正式开放，但其演示视频在国内外社交平台上引起了热烈讨论。与此同时，谷歌发布的Gemini 1.5 PRO却未能引起同样的关注。OpenAI此举被认为是为了证明其在AI行业的领先地位，尤其是在谷歌发布Gemini 1.5 PRO几小时后。

Sora的发布引起了包括科技大佬、股民、影视从业人员在内的各界人士的广泛讨论。360总裁周鸿祎认为Sora的出现将大大缩短AGI实现的时间，而Meta首席AI科学家杨立昆则对Sora的实际理解能力表示怀疑。此外，股民对Sora的发布感到兴奋，认为下一个AI风口已经到来，而一些影视从业人员则担心自己的工作受到威胁。

Sora之所以能引起广泛讨论，主要是因为其生成的视频质量极高。技术上，Sora通过将扩散模型和transformer相结合，以及采用原生视频数据进行采样等创新，实现了高质量的视频生成。值得注意的是，Sora的视频生成模型框架很可能源自谷歌DeepMind之前的论文成果，而该项目的负责人William Peebles曾是该论文的作者之一。

OpenAI在Sora的开发上进行了多项技术创新，包括利用GPT训练模型将简短的用户prompts转换为更长的详细prompts，以及采用更加开放的训练数据采样方式等。这些创新使Sora在视频生成领域表现出色，但同时也暴露了OpenAI在技术上高度依赖谷歌的事实。

总的来说，Sora的发布不仅展示了OpenAI在视频生成技术上的进步，也引发了关于AI技术发展、应用前景以及对人类社会影响的广泛讨论。尽管OpenAI利用了谷歌的技术成果，但其在将这些技术商业化和推广方面显然更为成功。