作者信息
【原文作者】 新智元
【作者简介】 智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
【微 信 号】 AI_era
文章摘要
【关 键 词】 威尔·史密斯、Sora、AI视频、Transformer、OpenAI
威尔·史密斯发布了一段视频,视频中的他吃意面,这段视频看起来如此逼真,以至于许多人认为这是AI生成的。然而,这段视频实际上是威尔·史密斯本人。这个“图灵测试”曾让其他AI视频生成工具如Runway和Pika等屡屡失败。Sora的出现,展示了AI视频生成技术的巨大进步,其技术路线早在今年1月就被前阿里AI专家预言。
Sora技术路线的预言与实现
李飞飞教授去年使用Transformer框架制作出了逼真的视频,而马毅教授的团队也在NeurIPS的论文中证实了Transformer可以实现diffusion和denosing。OpenAI的Sora技术路线,结合了Transformer对前后文的理解和强大的一致性,使得视频生成效果更加真实。
Sora站在前人肩膀上的创新
Sora的基础架构论文由William Peebles和谢赛宁提出,后被ICCV2023收录。William Peebles后来加入了OpenAI,领导了Sora的技术团队。Sora的时空Patch技术建立在Google DeepMind的研究之上,这项技术允许模型从更准确的世界表示中学习,赋予Sora近乎神奇的准确性。
OpenAI的资金与技术实力
OpenAI能够成功开发出Sora,除了技术上的创新,还得益于其背后大量的资金支持。在当前芯片+AI的科技浪潮中,没有足够的资金支持,就无法进行大规模的数据和算力投入,从而无法验证和实现技术突破。OpenAI的成功,再次证明了在科技领域,资金和技术实力的重要性。
原文信息
【原文链接】 阅读原文
【原文字数】 2412
【阅读时长】 9分钟