26 岁带着百人团队冲刺大模型,面壁智能天才 CTO:高效比参数更重要

AI-Agent2个月前发布 admin
223 0 0
26 岁带着百人团队冲刺大模型,面壁智能天才 CTO:高效比参数更重要

 

文章摘要


【关 键 词】 大模型技术面壁智能曾国洋人工智能开源战略

本文是InfoQ《大模型领航者》系列访谈的一部分,主要访谈了面壁智能CTO曾国洋,探讨了大模型技术的发展、应用以及面壁智能的公司战略和未来规划。以下是对文章内容的详细总结:

1. 面壁智能的起源与团队构成:面壁智能由清华大学计算机系副教授刘知远牵头成立,团队成员主要来自清华大学NLP实验室。CTO曾国洋以其在大模型领域的贡献而闻名。

2. 曾国洋的个人背景:曾国洋8岁开始学习编程,高中时在旷视实习,大二加入清华NLP实验室,成为面壁智能的技术领导者。

3. 面壁智能的公司化运作:2022年8月,面壁智能开始公司化运作,最初团队规模不到10人,后来逐渐扩大,设立了不同的团队以训练大模型。

4. 团队文化与管理:面壁智能不强调KPI管理,而是注重团队合作和创新。团队成员平均年龄28岁,80%来自清华北大,也有来自阿里、字节、百度等公司的骨干。

5. 大模型技术的发展:面壁智能意识到,单纯追求模型参数量并不可行,而是要突破模型的智能极限,提高模型性能。

6. MiniCPM模型的推出:面壁智能推出了MiniCPM模型,这是一个小尺寸端侧模型,能够在手机上运行,为大模型行业提供了新的技术方向。

7. 端侧模型的优势:端侧模型处理速度快,成本低廉,且能在无网络连接的情况下运行,适用于多种应用场景。

8. 技术发展与竞争:曾国洋认为,技术发展是循序渐进的,面壁智能会根据技术发展趋势调整研发路径,而不是盲目跟随市场热点。

9. 开源模型的战略:面壁智能坚持开源战略,认为开源模型在技术影响力建设方面具有重要作用,有助于提升人才吸引力和市场信心。

10. 商业化与融资:面壁智能完成了数亿元的融资,由春华创投、华为哈勃领投,知乎作为战略股东持续跟投。

11. Agent技术的应用:面壁智能认为Agent是大模型和通用人工智能之间的中间状态,能够处理更复杂的任务。

12. 大模型应用的未来:曾国洋提出了一种分工模式,即简单任务由小型特定领域模型处理,复杂任务由大型通用模型完成。

13. 面壁智能的长期目标:面壁智能致力于实现通用人工智能,有清晰的路线图,包括文本模态、多模态和具身智能的转变。

文章最后提到,面壁智能的目标是实现通用人工智能,团队有一个清晰的路线图,包括在文本模态上要达到的效果、未来向多模态和具身智能的转变等规划。2024年,面壁智能将继续专注于模型的研发和优化。

原文和模型


【原文链接】 阅读原文 [ 5161字 | 21分钟 ]
【原文作者】 InfoQ
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★☆

© 版权声明
讯飞星火大模型

相关文章

星火内容运营大师

暂无评论

暂无评论...