李沐老师回归B站!带着大模型创业成果填坑来了

AI-Agent7个月前发布 QbitAI
1,088 0 0
李沐老师回归B站!带着大模型创业成果填坑来了

 

文章摘要


【关 键 词】 人工智能创业公司大模型角色扮演AI技术

李沐,联合其导师Alex Smola创办的Boson AI公司,推出了专门为复杂场景角色扮演设计的大模型——Higgs-Llama-3-70B。这是Higgs开源系列大模型的第一个,基于Llama 3打造,并进行了完整的SFT、RLHF处理。该模型不仅在角色扮演任务上表现出色,同时在通用领域的指令遵循和推理方面也显示出竞争力。此外,市场传闻Boson AI已获得张一鸣的个人投资。

在两个新基准测试MMLU-Pro和Arena-hard上,Higgs-Llama-3-70B展现了其强大的能力,超越了谷歌推出的Gemini-1.5-Flash、Claude3家族的“中杯”Claude-3-Sonnet以及Llama3-70B-instruct等模型。团队特别强调,所有基准测试都已尽量排除过拟合的影响。尽管与GPT-4o相比还有差距,但团队指出这只是通用能力的基准测试,并未针对性地刷榜。

Boson AI致力于利用AI技术为企业赋能,革新故事讲述、知识学习和信息洞察的方式,协助客户开发能扮演多种角色的Agent,如游戏角色、语言教师、保险代理和金融顾问。公司的创始团队除了李沐和Alex Smola,还包括Shuai Zheng、施行健、Yi Zhu和Yizhi Liu等四位在AI和机器学习领域具有深厚背景的成员。

李沐,因其在小破站的传道授业,以及在亚马逊的工作经历,积累了很高的知名度。而Alex Smola则是一位在AI领域具有深远影响的大牛,其Google Scholar上的被引用次数超过17万次,被称为参数服务器之父。其他四位团队成员也在各自的领域有着杰出的贡献和经验。Boson AI的官网已更新Higgs-Llama-3-70B模型的信息,并展示了团队创始成员的简介。团队表示,Higgs-Llama-3-70B只是一个开始,未来将深入探讨角色扮演性能,并发布更多Higgs系列模型。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 2450字 | 10分钟 ]
【原文作者】 量子位
【摘要模型】 glm-4
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...