全球首次!国产AI开源端侧GPT-4o海外爆火,8B参数iPad就能跑

AIGC动态2天前发布 QbitAI
86 0 0
全球首次!国产AI开源端侧GPT-4o海外爆火,8B参数iPad就能跑

 

文章摘要


【关 键 词】 AI模型多模态端侧优化开源模型视障友好

面壁智能最新推出的AI模型MiniCPM-o 2.6因其在多模态能力上的卓越表现而受到广泛关注。该模型仅8B的体量,就能在多模态任务中与GPT-4o相媲美,且能在iPad等移动设备上运行。MiniCPM-o 2.6能够精准识别声音,如翻书声、咳嗽声等,同时在视觉和语言方面也有出色表现,能够识别图像内容、进行自然语言对话,并模仿不同口音的英语。面壁智能公布的评测榜单成绩显示,MiniCPM-o 2.6在多个细分项目中超越了GPT-4o。

MiniCPM-o 2.6之所以能够实现精准的视觉和听觉识别,是因为它采用了端到端全模态架构,能够综合处理文本、图像、音频等不同类型数据,并通过交叉熵损失进行端到端训练。此外,为了适应流式输入输出,面壁智能对模型进行了优化,设计了时分复用的全模态流式信息处理机制(OTDM),使得模型能够实时处理多模态信息。

面壁智能专注于端侧算力场景的优化,旨在实现单设备服务的高效性。MiniCPM-o 2.6的模型架构就是为了在手机、iPad等端侧设备上实现快速、高效、节能的运行。面壁智能CEO李大海强调,AI原生应用和AI原生硬件是大模型时代的需求,而端侧的大模型尤为重要。MiniCPM-o 2.6的发布是面壁智能在端侧模型研究上的又一重要进展,它不仅提高了端侧模型的性能,还为视障人士友好出行等应用场景提供了便利。

MiniCPM-o 2.6已经在GitHub和Hugging Face平台开源,用户可以免费体验在线demo。面壁智能的这一举措,加上其他国产开源模型如DeepSeek和阿里Qwen的表现,显示了国产开源力量在大模型发展中的活跃和影响力。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 2840字 | 12分钟 ]
【原文作者】 量子位
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...