文章摘要
【关 键 词】 人工智能、多模态、商汤科技、日日新、技术突破
商汤科技在人工智能领域取得了重大突破,推出了「日日新」原生融合大模型,实现了多模态融合,标志着AI从大语言模型和多模态模型分立的现状迈向了「大一统」时代。这一模型不仅能够「看」和「想」,还能帮助解决更多复杂问题,如识别模糊字体、分析数据图表、文学创作、游戏决策等。
「日日新」融合大模型在实际任务中表现出色,能够识别并翻译不同语言的手写诗歌,辅助学生作业,解读小学生作文的幽默之处,分析画作特点,识别历史人物和典故,分析电脑配置,解读代码实现的功能,领会表情包要点等。在评测中,「日日新」融合大模型在语言和多模态两个榜单上均获得冠军,展现了其在文科和理科任务上的均衡和领先表现。
商汤科技的技术路线是「原生融合多模态」,即在一个统一的模型框架内同时处理文本、图像、视频、音频等多种模态信息。这一路线与OpenAI、Anthropic、谷歌等公司的技术路径相呼应。商汤科技通过融合模态数据合成和融合任务增强训练两项关键技术,实现了多模态的交互与深度融合,使模型在跨模态任务中表现出色。
「日日新」融合大模型的应用前景广阔,在办公、金融、自动驾驶、视频交互、城市治理等领域均有突破性成果。商汤科技的「大模型、大装置和应用」三位一体战略,将推动AI技术的进一步发展和应用。随着融合模态技术路径的走通,商汤科技将探索更多范畴,为AI的未来带来更多可能性。
原文和模型
【原文链接】 阅读原文 [ 3869字 | 16分钟 ]
【原文作者】 新智元
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★☆☆
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...