零一万物Yi-VL多模态大模型开源，MMMU、CMMMU两大权威榜单领先

AIGC动态2年前 (2024)发布 almosthuman2014

3,221 0 0

作者信息

【原文作者】 机器之心
【作者简介】 专业的人工智能媒体和产业服务平台
【微信号】 almosthuman2014

文章摘要

零一万物公司于1月22日发布了Yi-VL多模态语言大模型，该模型基于Yi语言模型开发，包括Yi-VL-34B和Yi-VL-6B两个版本。Yi-VL模型在英文数据集MMMU和中文数据集CMMMU上取得了领先成绩，展示了在复杂跨学科任务上的强大实力。

Yi-VL模型在MMMU数据集上的准确率为41.6%，仅次于GPT-4V的55.7%。在CMMMU数据集上，GPT-4V的准确率为43.7%，而Yi-VL-34B的准确率为36.5%，在现有的开源多模态模型中处于领先位置。

Yi-VL模型的架构设计基于开源LLaVA架构，包含Vision Transformer（ViT）、Projection模块和Yi-34B-Chat及Yi-6B-Chat大规模语言模型。训练方法分为三个阶段，旨在全面提升模型的视觉和语言处理能力。

目前，Yi-VL模型已在Hugging Face、ModelScope等平台上向公众开放，用户可通过这些平台亲身体验这款模型在图文对话等多元场景中的优异表现。

原文信息

【原文链接】 阅读原文
【原文字数】 1260
【阅读时长】 5分钟

# AIGC动态 # GPT-GPTs # 大模型 # Yi-VL # 多模态模型 # 性能测试 # 模型架构 # 语言大模型

文章版权归作者所有，未经允许请勿转载。

推理和RL加速GPT-5.5到来？奥特曼公开GPT-4.5已就绪，年底发布全自主智能体

机器之心

1,779

全球首个类Sora开源复现方案来了！全面公开所有训练细节和模型权重

量子位

1,950

Llama架构比不上GPT2？神奇token提升10倍记忆？

机器之心

2,156

亚马逊祭出地表最强全家桶，多模态Nova却败给Claude 3.5！

新智元

1,858

清华、中南开源3D交互实体AI Agent LEGENT

AIGC开放社区

1,468

谷歌发布旗下最强大模型Gemini Ultra，Bard更名Gemini、还有Gemini App和包月套餐

Founder Park

2,490

暂无评论

暂无评论...

零一万物Yi-VL多模态大模型开源，MMMU、CMMMU两大权威榜单领先

作者信息

文章摘要

原文信息

刚上线就崩了？字节版 GPTs 征战国内市场：无需编码，快速创建 AI 聊天机器人

广告人上手AI作图的那些痛，这个平台真懂了

相关文章

暂无评论

热门网址

热门文章

零一万物Yi-VL多模态大模型开源，MMMU、CMMMU两大权威榜单领先

作者信息

文章摘要

原文信息

刚上线就崩了？字节版 GPTs 征战国内市场：无需编码，快速创建 AI 聊天机器人

广告人上手AI作图的那些痛，这个平台真懂了

相关文章

暂无评论

Trac-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

热门网址

热门文章