告别AI“跷跷板”，商汤“换道超车”

1,259 0 0

文章摘要

商汤科技推出的“日日新”融合大模型在AI领域实现了重大突破，该模型能够整合文字、图像、声音等多种信息，形成对世界的认知与理解，高效解决实际问题。在OpenCompass多模态评测中，“日日新”超越GPT-4o、Claude 3.5 Sonnet等，获得第一名。在SuperCLUE发布的《中文大模型基准测评2024年度报告》中，“日日新”以总分68.3的成绩，与DeepSeek V3并列国内榜首。这一成就标志着“日日新”融合大模型在图文场景、纯语言、推理等场景达到业内优秀水平，解决了多模态AI领域的“跷跷板效应”，即技术局限导致模型只能在一个方向维度上保持高水平的问题。

商汤科技联合创始人林达华指出，商汤攻克了融合模态数据合成和融合任务增强训练两项关键技术点，通过高质量、多样化的数据积累和创新性的数据再生产合成，以及构建跨模态桥梁，解决了数据和融合问题。全球顶尖研究机构如OpenAI和Google也在努力攻克单一模型体系融合多种模态处理能力的方向，力求打破AI的“感知盲区”。

“日日新”融合大模型的应用场景广泛，包括智能硬件、在线教育、具身智能机器人等，实现跨模态交互，提升交互体验。在教育场景中，该模型能准确识别手写数学题并给出解题推导过程及正确答案。在文化领域，它能理解抽象玩偶的颜色、材质和设计背后的文化内涵。在宏观经济图表解读中，它通过逻辑推理，提供具有实际参考价值的分析支持。

商汤“日日新”融合大模型的问世，不仅让AI大模型摆脱了“盲人摸象”的局限，成为能够理解世界、服务生活的有力助手，更将为企业级应用带来更多变革。凭借在大模型和多模态领域的技术积累，以及工程化优势，商汤找到了适合自身发展的关键路径，还将引领中国AI行业迈上原生融合发展新台阶，实现“换道超车”。AI需要变得越来越“全能”，把不同模态的能力整合起来，才能解锁更多的想象空间，真正开始有能力去解决现实世界里那些复杂的问题，让AI产生价值。