GPT-4现场被端侧小模型“暴打”,商汤日日新5.0:全面对标GPT-4 Turbo

AIGC动态8个月前发布 QbitAI
725 0 0
GPT-4现场被端侧小模型“暴打”,商汤日日新5.0:全面对标GPT-4 Turbo

 

文章摘要


【关 键 词】 人工智能商汤科技模型比较多模态性能提升

SenseChat Lite:轻量级端侧大模型

1. 性能对比:在《街头霸王》游戏中,SenseChat Lite与GPT-4进行了一场PK,展示了其快速反应能力。尽管GPT-4还在决策中,SenseChat Lite已经迅速出拳。

2. 离线模式:商汤CEO徐立展示了SenseChat Lite在离线模式下的能力,包括生成员工请假申请和对长段文字进行快速总结。

3. 性能水平:SenseChat Lite在同等尺度性能上达到了SOTA(State of the Art)水平,在多项测试中击败了Llama2-7B和13B。

4. 速度优势:采用端云“联动”的MoE框架,SenseChat Lite在端侧推理中表现出色,中等性能手机上达到18.3字/秒,高端手机上达到78.3字/秒。

5. 多模态能力:除了文本生成,SenseChat Lite还展示了其在图像处理方面的能力,如快速扩图和自由扩图。

SenseNova 5.0:全面升级的大模型

1. 定位:商汤将SenseNova 5.0定位为全面对标GPT-4 Turbo的模型。

2. 逻辑推理:SenseNova 5.0在处理“弱智吧”问题时表现出了强大的逻辑推理能力,能够精准回答问题。

3. 自然语言生成:在2022年高考作文题目的测试中,SenseNova 5.0生成的文章具有诗意,句子工整对仗,能够引经据典。

4. 数学能力:在解决数学问题时,SenseNova 5.0展现了比GPT-4更强的数学推理能力。

5. 数据和算力:商汤通过使用超过10T的tokens和数千亿tokens的思维链数据,以及算法和算力设施的联合优化,提升了SenseNova 5.0的性能。

6. 多模态领域:SenseNova 5.0在多模态领域的核心指标中取得了领先成绩,包括图像理解和生成效果。

文章最后提到,商汤科技的这两款新模型在逻辑推理、自然语言生成、数学能力和多模态处理等方面均展现出了强大的能力,预示着商汤在人工智能领域的进一步发展。

原文和模型


【原文链接】 阅读原文 [ 6116字 | 25分钟 ]
【原文作者】 量子位
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★☆☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...