专访面壁曾国洋:踩过 1000 次大模型的坑后 ,造一个性能小钢炮
作者信息
【原文作者】 AI科技评论
【作者简介】 雷峰网旗下AI新媒体。聚焦AI前沿研究,关注AI工程落地。
【微 信 号】 aitechtalk
文章摘要
【关 键 词】 大模型、面壁智能、MiniCPM、OmniLMM、Agent
文章介绍了面壁智能发布的两个大模型:MiniCPM 2B和OmniLMM。MiniCPM 2B被称为”小钢炮”,在规模大小和性能上超越了Mistral-7B等大模型,展示了端侧大语言模型的潜力。面壁智能团队背后是国内顶尖AI科学家的探索和积累。
团队注重高效,通过全流程高效的Infra和模型沙盒实现以小搏大的策略。MiniCPM在语言、代码和多模态方面表现优秀,能够在手机上运行,具有商业意义。
团队还推出了Agent技术,探索新的应用形式。面壁团队在技术方向上经历了多次转型,积累了丰富的经验,致力于实现AGI。他们强调效率和在端侧应用的重要性,认为以小搏大是未来的趋势。
团队对Agent技术寄予厚望,认为Agent是模型能力的放大器,能让模型发挥更大的价值。整体而言,面壁智能在大模型领域持续探索,追求高效和创新,展现出强大的技术实力和前瞻性思维。
原文信息
【原文链接】 阅读原文
【原文字数】 5565
【阅读时长】 19分钟
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...