GPT-4 Turbo首次被击败!国产大模型拿下总分第一

AIGC动态6个月前发布 QbitAI
1,065 0 0
GPT-4 Turbo首次被击败!国产大模型拿下总分第一

 

文章摘要


【关 键 词】 SuperCLUE商汤科技日日新5.0榜首成绩技术进步

在中文大模型测评基准SuperCLUE的最新评测中,商汤科技日日新5.0(SenseChat V5)以总分80.03分荣登榜首,超过此前长期领先的GPT-4 Turbo。

具体来看,SenseChat V5在文科领域以82.20分位居国内第一,理科领域虽低于GPT-4 Turbo,但依旧在国内大模型中位列首位。

商汤科技对SenseChat V5的打造,技术上主要围绕三大方面:采用MoE架构、基于超过10TB tokens的大规模训练,以及推理上下文窗口达到200K。

此外,通过实际测试,SenseChat V5展现了其在逻辑推理、数学问题解决、中文理解等方面的应用能力

这一系列成就的背后,是商汤科技在数据层面的创新,包括使用大量高质量数据和生成数千亿tokens的思维链数据,从而激发了大模型的深度推理能力

豆包-智能助手

原文和模型


【原文链接】 阅读原文 [ 3274字 | 14分钟 ]
【原文作者】 量子位
【摘要模型】 glm-4
【摘要评分】 ★★★★☆

© 版权声明

相关文章

暂无评论

暂无评论...