标签:多模态

支付宝被AI调用,一句话运营小红书!国内最大MCP社区来了,开发者狂欢

国内最大的MCP中文社区正式上线,标志着AI开发门槛的进一步降低。魔搭ModelScope推出的「MCP广场」汇集了近1500款MCP服务,覆盖搜索、地图、支付、开发者工具...

刚刚,OpenAI发布GPT-4.1,性能暴涨、100万上下文

OpenAI在凌晨1点发布了最新模型GPT-4.1,同时推出的还有GPT 4.1-Mini和GPT 4.1-Nano两款模型。这些模型在多模态处理、代码能力、指令遵循和成本方面实现了显...

永别了,GPT-4!

OpenAI宣布GPT-4将从ChatGPT中移除,并由GPT-4o完全取代,标志着这一曾经引领全球AI大模型发展的标志性模型正式退出历史舞台。GPT-4于2023年3月14日发布,作...

原生多模态大模型也能强化学习,思维链长达几万字,商汤日日新V6来了

商汤推出的「日日新 SenseNova V6」大模型在多模态推理与交互能力上展现了行业领先水平。该模型通过多模态长思维链训练、全局记忆、强化学习等技术突破,显著...

AI看柯南2分钟揪真凶,商汤600B多模态MoE推理封神!交互记忆全线升级

商汤科技最新发布的第六代大模型SenseNova V6,标志着多模态大模型技术的重大突破。该模型不仅在文本、图像和视频的原生融合上实现了全面升级,还展现了强大...

阿里开源R1-Omni,多模态情感识别

阿里巴巴通义实验室的研究人员开源了多模态情感识别模型R1-Omni,该模型首次将强化学习与可验证奖励(RLVR)应用于多模态大模型,显著提升了情感识别任务中的...

四个维度深入剖析「 Test-Time Scaling 」!首篇系统综述,拆解推理阶段扩展的原理与实战

随着大模型训练成本的急剧攀升和优质数据的逐渐枯竭,推理阶段扩展(Test-Time Scaling, TTS)技术迅速成为后预训练时代的关键突破口。与传统的“堆数据、堆参...

CLIP被淘汰了?LeCun谢赛宁新作,多模态训练无需语言监督更强!

视觉自监督学习(SSL)在多模态任务中的潜力得到了验证,研究表明,通过扩展模型和数据规模,SSL能够媲美甚至超越语言监督方法(如CLIP)。这项研究由杨立昆...

1000万上下文!新开源多模态大模型,单个GPU就能运行

今年2月初,谷歌发布的Gemini 2.0 Pro支持200万上下文,震惊了整个大模型领域。然而,仅过了2个月,Meta最新开源的Llama 4 Scout就将上下文扩展至1000万,整...

1000万上下文+2880亿参数的Llama4,却让DeepSeek们松了一口气

Meta于4月5日发布了Llama4系列开源模型,包括Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth。这三种模型分别针对不同的使用需求,展示了Meta在人工智能...
1 2 3 29