GPT-4现场被端侧小模型“暴打”，商汤日日新5.0：全面对标GPT-4 Turbo

AIGC动态1年前 (2024)发布 QbitAI

1,795 0 0

GPT-4现场被端侧小模型“暴打”，商汤日日新5.0：全面对标GPT-4 Turbo

文章摘要

【关键词】 人工智能、商汤科技、模型比较、多模态、性能提升

SenseChat Lite：轻量级端侧大模型

1. 性能对比：在《街头霸王》游戏中，SenseChat Lite与GPT-4进行了一场PK，展示了其快速反应能力。尽管GPT-4还在决策中，SenseChat Lite已经迅速出拳。

2. 离线模式：商汤CEO徐立展示了SenseChat Lite在离线模式下的能力，包括生成员工请假申请和对长段文字进行快速总结。

3. 性能水平：SenseChat Lite在同等尺度性能上达到了SOTA（State of the Art）水平，在多项测试中击败了Llama2-7B和13B。

4. 速度优势：采用端云“联动”的MoE框架，SenseChat Lite在端侧推理中表现出色，中等性能手机上达到18.3字/秒，高端手机上达到78.3字/秒。

5. 多模态能力：除了文本生成，SenseChat Lite还展示了其在图像处理方面的能力，如快速扩图和自由扩图。

SenseNova 5.0：全面升级的大模型

1. 定位：商汤将SenseNova 5.0定位为全面对标GPT-4 Turbo的模型。

2. 逻辑推理：SenseNova 5.0在处理“弱智吧”问题时表现出了强大的逻辑推理能力，能够精准回答问题。

3. 自然语言生成：在2022年高考作文题目的测试中，SenseNova 5.0生成的文章具有诗意，句子工整对仗，能够引经据典。

4. 数学能力：在解决数学问题时，SenseNova 5.0展现了比GPT-4更强的数学推理能力。

5. 数据和算力：商汤通过使用超过10T的tokens和数千亿tokens的思维链数据，以及算法和算力设施的联合优化，提升了SenseNova 5.0的性能。

6. 多模态领域：SenseNova 5.0在多模态领域的核心指标中取得了领先成绩，包括图像理解和生成效果。

文章最后提到，商汤科技的这两款新模型在逻辑推理、自然语言生成、数学能力和多模态处理等方面均展现出了强大的能力，预示着商汤在人工智能领域的进一步发展。

原文和模型

【原文链接】 阅读原文 [ 6116字 | 25分钟 ]
【原文作者】 量子位
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★☆☆

Moonshot AI

月之暗面是一家 AI 初创大模...

# AIGC动态 # GPT-GPTs # 图像生成 # 大模型 # 人工智能 # 商汤科技 # 多模态 # 性能提升 # 模型比较

文章版权归作者所有，未经允许请勿转载。

微软Phi-4家族新增两位成员，5.6B多模态单任务超GPT-4o，3.8B小模型媲美千问7B

机器之心

1,581

1+1>2：复旦大学团队“硅基-二维”异质嵌入式DRAM，开创二维半导体应用新篇章

admin

960

75万元奖金池+心动offer，启元实验室2025重磅赛事来袭，三大赛道，等你来战！

机器之心

510

对话Kyligence联合创始人李扬：AI 数据分析准确率超过95%，企业旧SaaS时代是否已死？｜钛媒体AGI

钛媒体AGI

36,061

ControlNet作者搞起大模型：让天下没有难写的生图提示词，一句话变构图小作文

量子位

2,778

“大模型六虎”阶跃星辰3月将开源图生视频模型｜钛媒体AGI

钛媒体AGI

1,614

暂无评论

暂无评论...

GPT-4现场被端侧小模型“暴打”，商汤日日新5.0：全面对标GPT-4 Turbo

文章摘要

原文和模型

股价久违飙涨，商汤要用自己的Scaling law挑战GPT4

生成式 AI 抢滩生死战：全球云计算巨头怎么打

相关文章

暂无评论

热门网址

热门文章

GPT-4现场被端侧小模型“暴打”，商汤日日新5.0：全面对标GPT-4 Turbo

文章摘要

原文和模型

股价久违飙涨，商汤要用自己的Scaling law挑战GPT4

生成式 AI 抢滩生死战：全球云计算巨头怎么打

相关文章

暂无评论

Trac-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

热门网址

热门文章