OpenAI王炸模型引爆科技圈，我们第一时间深读了官方技术报告

AIGC动态2年前 (2024)发布 admin

2,498 0 0

作者信息

【原文作者】 腾讯科技
【作者简介】 腾讯新闻旗下腾讯科技官方账号，在这里读懂科技！
【微信号】 qqtech

文章摘要

在2月16日凌晨，OpenAI发布了文生视频大模型 Sora，引起了科技圈的震惊和感叹。Sora具有多项强大功能，包括文本到视频生成能力、复杂场景和角色生成能力、语言理解能力、多镜头生成能力、从静态图像生成视频能力以及物理世界模能力。这标志着视频生成领域取得了重大突破，预示着一个全新的视觉叙事时代的到来。Sora的出现重新定义了人们与数字世界的互动方式，将想象力转化为生动的动态画面，文字的魔力转化为视觉的盛宴。

技术报告详细介绍了Sora的工作原理，包括将可视数据转换成数据包、视频压缩网络、时空包、用于视频生成的缩放Transformers等。Sora不仅能够生成视频，还能实现向前或向后的无限扩展，实现视频的无缝连接和编辑。此外，Sora还具有生成图像的能力，能够模拟现实世界中的物体、动物和环境等方面。

在业内人士的评价中，马斯克认为AI增强的人类将创造出最好的作品，而Jim Fan表示Sora是一个数据驱动的物理引擎。YouTube大V Paddy Galloway认为Sora将带来内容创作领域的巨大改变，而Takeoff AI的创始人则认为未来五年将能够生成完全沉浸式的世界。然而，也有人指出Sora存在一些物理故障，可能难以纠正。

总的来说，Sora的发布标志着视频生成技术的巨大进步，将对内容创作、艺术创作和教育领域带来深远影响，同时也引发了对技术局限性和未来发展的讨论。