标签:多模态模型

原生融合多模态上的突破,让商汤大模型打破Scaling Laws撞墙「魔咒」

下一代AI发展遭遇瓶颈,大型语言模型竞赛中各实验室似乎同时撞墙。OpenAI的GPT-5模型发布多次延迟,至今仍未达到可发布水平。大型模型训练成本高昂,耗时数月...

卖身、豪赌Killer App的AI 厂商:被“吊”麻了,明年咋活?

自ChatGPT发布以来,AI行业的大模型领域经历了快速增长,但随着应用落地,市场对大模型的热情有所降温,资本也趋于理性。AI行业经历了剧烈洗牌,创企寻求收购...

MiniMax震撼开源,突破传统Transformer架构,4560亿参数,支持400万长上下文

2025年被AI业界领袖视为AI Agent的关键年份,预计将对公司生产力产生重大影响。在这一背景下,MiniMax开源了两个新模型:基础语言模型MiniMax-Text-01和视觉...

独家丨前微软亚研院视觉专家胡瀚加入腾讯,负责混元多模态大模型

胡瀚,前微软亚洲研究院视觉计算组首席研究员,已加入腾讯,接替刘威负责多模态大模型研发。胡瀚清华大学本科及博士学位,师从周杰教授,博士论文获2016年中...

李飞飞、谢赛宁等探索MLLM「视觉空间智能」,网友:2025有盼头了

纽约大学、耶鲁大学和斯坦福大学的研究者们提出了VSI-Bench,这是一个基于视频的基准测试,旨在评估多模态大语言模型(MLLM)在视觉空间智能方面的表现。VSI-...

中国AI竞争加剧:苹果或与腾讯字节合作,新增46万张GPU芯片、豆包语言模型排名第一|钛媒体AGI

苹果公司正在与中国的腾讯和字节跳动进行谈判,考虑将这两家公司的AI模型整合到在中国销售的iPhone中。字节跳动的豆包大模型和腾讯的混元模型在评测中表现突...

OpenAI深夜被狙,谷歌Gemini 2.0掀翻牌桌!最强智能体组团击毙o1

谷歌DeepMind宣布了新一代原生多模态模型Gemini 2.0 Flash的正式发布,标志着智能体时代的进一步发展。Gemini 2.0 Flash在性能上超越了前代1.5 Pro,速度提升...

亚马逊祭出地表最强全家桶,多模态Nova却败给Claude 3.5!

亚马逊最近推出了Nova系列多模态模型,其中Nova Pro在多项基准测试中超越了GPT-4o,仅次于Gemini 1.5 Pro和Claude 3.5 Sonnet。Nova系列以其低廉的价格和高性...

视觉模型智能涌现后, Scaling Law 不会到头

近期,哈佛大学的一篇论文《Scaling Laws for Precision》引发了关于自然语言处理领域Scaling Law可能达到瓶颈的讨论。该论文指出,当前语言模型在大量数据上...

国产3D虚拟人版《Her》「杀向」迪拜

在GITEX GLOBAL展会上,中国公司Soul展示了其在AI社交领域的最新进展。Soul的展位设有三个互动屏幕,分别用于体验与3D数字人互动、创建多语言交流的3D数字人...
1 2 3 6