全球首个开源类Sora猛升级，16秒720p画质电影感拉满！代码权重全开源

AIGC动态1年前 (2024)发布 AIera

2,331 0 0

文章摘要

【关键词】 开源、视频生成、高清、渲染、技术报告

潞晨Open-Sora团队在视频生成领域取得了显著突破，推出了支持16秒720p高清画质一键生成的模型，并且选择将权重代码全部开源。这一举措不仅展示了团队在技术上的领先地位，还为开源社区带来了新的震撼。

Open-Sora模型能够生成各种风格的高质量短片，包括逼真的人物肖像和赛博朋克风格的动画镜头，甚至可以实现电影级别的变焦效果。

Open-Sora模型的开源地址为：https://github.com/hpcaitech/Open-Sora。通过该模型的权重，用户可以生成如海浪与海螺的互动、深林秘境等酷炫短片。

美国科技独角兽LambdaLabs基于潞晨团队先前开源的Open-Sora模型权重，打造了一个数字乐高宇宙，为乐高迷们提供了极致的创意体验。

潞晨团队深知开源对于文生视频技术突破的重要性，不仅持续开源模型权重，还在GitHub上公开了技术路线。

潞晨Open-Sora团队的技术报告详细剖析了模型训练的核心和关键。在上一个版本的基础上，引入了视频压缩网络（Video Compression Network）、更优的扩散模型算法和更多的可控性。

创新的视频压缩网络（VAE）在空间和时间两个维度上分别进行压缩，首先在空间维度上进行了8×8倍的压缩，然后在时间维度上进一步压缩了4倍。

最新的扩散模型Stable Diffusion 3通过采用rectified flow技术替代DDPM，显著提升了图片和视频生成的质量。

这套训练方案包括简单易用的整流训练、用于训练加速的Logit-norm时间步长采样和基于分辨率和视频长度的时间步长采样。

潞晨Open-Sora的开源为文生视频的创新和发展注入了强劲的活力，使用户从被动的内容消费者转变为积极的内容创造者。

原文和模型

【原文链接】 阅读原文 [ 2209字 | 9分钟 ]
【原文作者】 新智元
【摘要模型】 gpt-4o
【摘要评分】 ★★★★★

OpenAI GPT-4

GPT-4是OpenAI公司开发的自然...

# AIGC动态 # 大模型 # 视频生成 # 开源

文章版权归作者所有，未经允许请勿转载。

单个4090就能跑，Mistral开源多模态小模型，开发者：用来构建推理模型足够香

机器之心

1,011

机器之心

1,389

靠”氛围编程”狂揽 2 亿美金，Supabase 成 AI 时代最性感的开源数据库

AI前线

1,000

一脑多机！智源的新发布，让不同机器人轻松协作

机器之心

1,178

3140参数Grok-1推理加速3.8倍，PyTorch+HuggingFace版来了

量子位

1,038

重磅！微软宣布开源Copilot！用 5000 万用户直接碾压 Cursor和Windsurf？

AI前线

920

暂无评论

暂无评论...

全球首个开源类Sora猛升级，16秒720p画质电影感拉满！代码权重全开源

文章摘要

原文和模型

还得是开源！潞晨Open-Sora技术路线公开，一键生成16秒720p视频，质量更高训练成本更低

黄仁勋提到的机器人世界，还需要AI数据来“调教” | CVPR 2024

相关文章

暂无评论

热门网址

热门文章

全球首个开源类Sora猛升级，16秒720p画质电影感拉满！代码权重全开源

文章摘要

原文和模型

还得是开源！潞晨Open-Sora技术路线公开，一键生成16秒720p视频，质量更高训练成本更低

黄仁勋提到的机器人世界，还需要AI数据来“调教” | CVPR 2024

相关文章

暂无评论

Trac-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

热门网址

热门文章