文章摘要
【关 键 词】 SuperCLUE、商汤科技、日日新5.0、榜首成绩、技术进步
在中文大模型测评基准SuperCLUE的最新评测中,商汤科技的日日新5.0(SenseChat V5)以总分80.03分荣登榜首,超过此前长期领先的GPT-4 Turbo。
具体来看,SenseChat V5在文科领域以82.20分位居国内第一,理科领域虽低于GPT-4 Turbo,但依旧在国内大模型中位列首位。
商汤科技对SenseChat V5的打造,技术上主要围绕三大方面:采用MoE架构、基于超过10TB tokens的大规模训练,以及推理上下文窗口达到200K。
此外,通过实际测试,SenseChat V5展现了其在逻辑推理、数学问题解决、中文理解等方面的应用能力。
这一系列成就的背后,是商汤科技在数据层面的创新,包括使用大量高质量数据和生成数千亿tokens的思维链数据,从而激发了大模型的深度推理能力。
原文和模型
【原文链接】 阅读原文 [ 3274字 | 14分钟 ]
【原文作者】 量子位
【摘要模型】 glm-4
【摘要评分】 ★★★★☆
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...