标签:多模态模型

推理延展到真实物理世界,英伟达Cosmos-Reason1:8B具身推理表现超过OpenAI ο1

在基于物理世界的真实场景中进行视觉问答时,现有的AI模型往往无法识别出参考选项中没有最佳答案的情况。例如,当问题要求预测车辆接下来的行动时,预设选项...

最大参数 300 亿!阶跃星辰与吉利联合开源两款多模态大模型

阶跃星辰与吉利汽车集团联合宣布,将Step系列多模态大模型向全球开发者开源。此次开源包含参数量达300亿的Step-Video-T2V视频生成模型,以及产品级开源语音交...

清华、中南开源3D交互实体AI Agent LEGENT

清华大学与中南大学联合研发的LEGENT模型,通过构建可视化3D交互实体AI代理系统,突破了传统AI Agent无实体交互的局限。该系统由场景、智能体与界面三大核心...

全球最大开源视频模型,现在也Created in China了,阶跃出品

阶跃星辰与吉利汽车集团联合开源两款多模态大模型——Step-Video-T2V和Step-Audio,引发行业关注。Step-Video-T2V是目前全球参数量最大的开源视频生成模型,采...

CLIP 后门样本检测:揭示网络数据集中的后门风险丨ICLR 2025

多模态模型的安全问题因后门投毒风险引发关注,尤其是CLIP模型在视觉-语言对齐任务中的广泛应用。研究表明,攻击者仅需对0.01%的训练数据投毒即可植入后门,...

推理和RL加速GPT-5.5到来?奥特曼公开GPT-4.5已就绪,年底发布全自主智能体

在东京大学举行的OpenAI高管对话中,Sam Altman与Kevin Weil透露了公司技术路线图的核心进展与未来规划。OpenAI内部已实现GPT-4.5模型,并确认通过推理模型与...

阿里挖来AI大牛许主洪,接下来目标明确:要靠多模态打通AI应用了

随着AI技术竞争加剧,消费市场成为科技公司争夺的核心战场。阿里巴巴近期通过引入顶尖人才和重组业务线,加速布局AI To C领域。人工智能科学家许主洪教授的加...

全球顶级AI科学家许主洪加盟阿里!IEEE Fellow,五万被引论文数,曾任Salesforce集团副总裁

许主洪的加入标志着阿里在AI To C业务上的重要布局。作为一名IEEE Fellow和新加坡管理大学终身教授,他凭借深厚的学术积累与产业实践经验,将推动阿里的多模...

原生融合多模态上的突破,让商汤大模型打破Scaling Laws撞墙「魔咒」

下一代AI发展遭遇瓶颈,大型语言模型竞赛中各实验室似乎同时撞墙。OpenAI的GPT-5模型发布多次延迟,至今仍未达到可发布水平。大型模型训练成本高昂,耗时数月...

卖身、豪赌Killer App的AI 厂商:被“吊”麻了,明年咋活?

自ChatGPT发布以来,AI行业的大模型领域经历了快速增长,但随着应用落地,市场对大模型的热情有所降温,资本也趋于理性。AI行业经历了剧烈洗牌,创企寻求收购...
1 2 3 6