GPT-4 Turbo首次被击败！国产大模型拿下总分第一

AIGC动态1年前 (2024)发布 QbitAI

2,768 0 0

GPT-4 Turbo首次被击败！国产大模型拿下总分第一

文章摘要

【关键词】 SuperCLUE、商汤科技、日日新5.0、榜首成绩、技术进步

在中文大模型测评基准SuperCLUE的最新评测中，商汤科技的日日新5.0（SenseChat V5）以总分80.03分荣登榜首，超过此前长期领先的GPT-4 Turbo。

具体来看，SenseChat V5在文科领域以82.20分位居国内第一，理科领域虽低于GPT-4 Turbo，但依旧在国内大模型中位列首位。

商汤科技对SenseChat V5的打造，技术上主要围绕三大方面：采用MoE架构、基于超过10TB tokens的大规模训练，以及推理上下文窗口达到200K。

此外，通过实际测试，SenseChat V5展现了其在逻辑推理、数学问题解决、中文理解等方面的应用能力。

这一系列成就的背后，是商汤科技在数据层面的创新，包括使用大量高质量数据和生成数千亿tokens的思维链数据，从而激发了大模型的深度推理能力。

原文和模型

【原文链接】 阅读原文 [ 3274字 | 14分钟 ]
【原文作者】 量子位
【摘要模型】 glm-4
【摘要评分】 ★★★★☆

智谱AI是一家国内的AI大模型...

# AIGC动态 # GPT-GPTs # 大模型 # SuperCLUE # 商汤科技 # 技术进步 # 日日新5.0 # 榜首成绩

© 版权声明

文章版权归作者所有，未经允许请勿转载。

“绘蛙”

相关文章

商汤CVPR「最佳论文」上车！数千行代码实现端到端智驾，“留给传统自动驾驶公司时间不多了”

admin

2,007

CIS，新竞赛

admin

1,925

八英寸晶圆厂，何去何从？

admin

1,794

AI卷翻科研！DeepMind 36页报告：全球实验室被「AI科学家」指数级接管

新智元

1,970

腾讯研发了快一年的混元文生图模型，说开源就开源了？

admin

2,439

2024年启航：多模态大模型+垂直领域

admin

2,489

“极客训练营”

暂无评论

暂无评论...