文章摘要
【关 键 词】 人工智能、商汤科技、模型比较、多模态、性能提升
SenseChat Lite:轻量级端侧大模型
1. 性能对比:在《街头霸王》游戏中,SenseChat Lite与GPT-4进行了一场PK,展示了其快速反应能力。尽管GPT-4还在决策中,SenseChat Lite已经迅速出拳。
2. 离线模式:商汤CEO徐立展示了SenseChat Lite在离线模式下的能力,包括生成员工请假申请和对长段文字进行快速总结。
3. 性能水平:SenseChat Lite在同等尺度性能上达到了SOTA(State of the Art)水平,在多项测试中击败了Llama2-7B和13B。
4. 速度优势:采用端云“联动”的MoE框架,SenseChat Lite在端侧推理中表现出色,中等性能手机上达到18.3字/秒,高端手机上达到78.3字/秒。
5. 多模态能力:除了文本生成,SenseChat Lite还展示了其在图像处理方面的能力,如快速扩图和自由扩图。
SenseNova 5.0:全面升级的大模型
1. 定位:商汤将SenseNova 5.0定位为全面对标GPT-4 Turbo的模型。
2. 逻辑推理:SenseNova 5.0在处理“弱智吧”问题时表现出了强大的逻辑推理能力,能够精准回答问题。
3. 自然语言生成:在2022年高考作文题目的测试中,SenseNova 5.0生成的文章具有诗意,句子工整对仗,能够引经据典。
4. 数学能力:在解决数学问题时,SenseNova 5.0展现了比GPT-4更强的数学推理能力。
5. 数据和算力:商汤通过使用超过10T的tokens和数千亿tokens的思维链数据,以及算法和算力设施的联合优化,提升了SenseNova 5.0的性能。
6. 多模态领域:SenseNova 5.0在多模态领域的核心指标中取得了领先成绩,包括图像理解和生成效果。
文章最后提到,商汤科技的这两款新模型在逻辑推理、自然语言生成、数学能力和多模态处理等方面均展现出了强大的能力,预示着商汤在人工智能领域的进一步发展。
原文和模型
【原文链接】 阅读原文 [ 6116字 | 25分钟 ]
【原文作者】 量子位
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★☆☆