与Sora一样能生成视频、图像，还能一次解读100万数据！

AIGC动态2年前 (2024)发布 ai-front

2,712 0 0

模型信息

【模型公司】 月之暗面
【模型名称】 moonshot-v1-32k

作者信息

【原文作者】 AI前线
【作者简介】 面向AI爱好者、开发者和科学家，提供大模型最新资讯、AI技术分享干货、一线业界实践案例，助你全面拥抱AIGC。
【微信号】 ai-front

与Sora一样能生成视频、图像，还能一次解读100万数据！

文章摘要

【关键词】 大世界模型、LWM、多模态、Ring Attention、开源

本文介绍了加州大学伯克利分校研究人员开源的大世界模型（LWM），这是一种多模态自回归模型，具备文本、音频、图像和视频的生成与理解能力。

LWM能够一次性精准解答100万tokens的视频和文本，具有强大的检索和生成能力。

LWM的核心技术是Ring Attention，它通过环形注意力机制解决了长序列处理的内存和计算复杂度问题。

LWM的训练包括语言模型预训练和多模态预训练两个阶段，使用了大量公开数据集进行训练。

目前，LWM在GitHub上获得了超过6000颗星的关注。

原文信息

【原文链接】 阅读原文
【原文字数】 1456
【阅读时长】 5分钟

# AIGC动态 # 图像生成 # 大模型 # 视频生成 # 音频生成 # AI前线 # LWM # Ring Attention # 多模态 # 大世界模型 # 开源

文章版权归作者所有，未经允许请勿转载。

OpenAI呼吁美国政府禁止DeepSeek，网友：伪君子

admin

1,554

任意论文一键变播客，谷歌正式发布Illuminate，它能重构研究者的学习方式吗？

机器之心

2,268

刚刚，Qwen3 终于发布！混合推理模式、支持MCP，成本仅DeepSeek R1三分之一，网友喊话小扎：工程师要赶紧加班了

AI前线

1,466

“清华系Sora”全球上线，生成一段视频需30秒，每月支付58元｜钛媒体AGI

钛媒体AGI

2,851

RL训练总崩溃？R1-Reward稳定解锁奖励模型Long-Cot推理能力

机器之心

1,673

香港大模型公司Weitu AI首秀，打造多模态Native的技术和产品

量子位

3,673

暂无评论

暂无评论...

与Sora一样能生成视频、图像，还能一次解读100万数据！

模型信息

作者信息

文章摘要

原文信息

OpenAI 被微软 “绿” 了，法国 “小鲜肉” Mistral 上位！

仅用 53 秒，商汤办公小浣熊就能助你化身高级打工人

相关文章

暂无评论

热门网址

热门文章

与Sora一样能生成视频、图像，还能一次解读100万数据！

模型信息

作者信息

文章摘要

原文信息

OpenAI 被微软 “绿” 了，法国 “小鲜肉” Mistral 上位！

仅用 53 秒，商汤办公小浣熊就能助你化身高级打工人

相关文章

暂无评论

Trac-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

热门网址

热门文章