作者信息
【原文作者】 新硅NewGeek
【作者简介】 追踪每一个硅基生命的动向
【微 信 号】 XinguiNewgeek
文章摘要
【关 键 词】 OpenAI、Sora、视频生成、Gemini 1.5 PRO、技术创新
近日,OpenAI的视频生成模型Sora引发了广泛关注,尽管尚未正式开放,但其演示视频在国内外社交平台上引起了热烈讨论。与此同时,谷歌发布的Gemini 1.5 PRO却未能引起同样的关注。OpenAI此举被认为是为了证明其在AI行业的领先地位,尤其是在谷歌发布Gemini 1.5 PRO几小时后。
Sora的发布引起了包括科技大佬、股民、影视从业人员在内的各界人士的广泛讨论。360总裁周鸿祎认为Sora的出现将大大缩短AGI实现的时间,而Meta首席AI科学家杨立昆则对Sora的实际理解能力表示怀疑。此外,股民对Sora的发布感到兴奋,认为下一个AI风口已经到来,而一些影视从业人员则担心自己的工作受到威胁。
Sora之所以能引起广泛讨论,主要是因为其生成的视频质量极高。技术上,Sora通过将扩散模型和transformer相结合,以及采用原生视频数据进行采样等创新,实现了高质量的视频生成。值得注意的是,Sora的视频生成模型框架很可能源自谷歌DeepMind之前的论文成果,而该项目的负责人William Peebles曾是该论文的作者之一。
OpenAI在Sora的开发上进行了多项技术创新,包括利用GPT训练模型将简短的用户prompts转换为更长的详细prompts,以及采用更加开放的训练数据采样方式等。这些创新使Sora在视频生成领域表现出色,但同时也暴露了OpenAI在技术上高度依赖谷歌的事实。
总的来说,Sora的发布不仅展示了OpenAI在视频生成技术上的进步,也引发了关于AI技术发展、应用前景以及对人类社会影响的广泛讨论。尽管OpenAI利用了谷歌的技术成果,但其在将这些技术商业化和推广方面显然更为成功。
原文信息
【原文链接】 阅读原文
【原文字数】 1929
【阅读时长】 7分钟