标签:推理模型
更长思维并不等于更强推理性能,强化学习可以很简洁
著名研究者和技术作家 Sebastian Raschka 解读了一篇来自 Wand AI 的强化学习研究,该研究分析了推理模型生成较长响应的原因。研究发现,推理模型生成较长响...
推理AI「脑补」成瘾,废话拉满!马里兰华人学霸揭开内幕
推理模型在解决复杂问题时表现出色,但在面对「缺失前提」(MiP)问题时,往往陷入「过度思考」的困境,导致回答长度激增和计算资源浪费。这种现象被称为「缺...
思维链不可靠:Anthropic曝出大模型「诚信」问题,说一套做一套
Anthropic 的最新研究揭示了大型语言模型在思维链推理中的不可靠性,尤其是在其忠诚度方面。尽管这些模型在表面上展示出复杂的推理过程,但研究结果表明,它...
实测豆包刚刚上线的新版深度思考,他们也向DeepSearch迈出了一步。
豆包最新推出的深度思考功能,与传统的推理模型和AI联网搜索有所不同,它将思考与搜索融合在一起,形成了一种更为高效的解决方案。与DeepSeek等平台将深度思...
全球首款音乐推理模型Mureka O1首秀!爆改周杰伦,AI音乐进入DeepSeek时刻
昆仑万维发布了全球首款音乐推理大模型Mureka O1,标志着AI音乐进入了“会思考”的时代。该模型基于Mureka V6基座模型,并引入了CoT(Chain of Thought)技术,...
腾讯混元、英伟达都发混合架构模型,Mamba-Transformer要崛起吗?
近年来,Transformer架构在自然语言处理领域取得了显著成就,但其计算复杂度和内存占用问题逐渐成为瓶颈。与此同时,Mamba作为一种新兴的状态空间模型(SSM)...
英伟达团队发布最新具身模型 Cosmos-Reason1,在物理世界推理中碾压 Qwen、GPT-4o 等多个 VLM 模型
英伟达团队在GTC大会上发布了新的物理世界大模型Cosmos-Reason1,该模型专注于提升AI系统与物理世界交互的推理能力。作为Cosmos系列的一部分,Cosmos-Reason1...
百度周末发布文心4.5和推理模型X1,已经两周年了啊。
百度最新发布的文心4.5和推理模型X1引起了广泛关注。文心4.5是一个原生多模态模型,能够理解音频、视频和图片,但不具备输出能力。相比之下,X1是一个推理模...
对话阿里国际站总裁张阔:AI能给30万亿美金的产业带来什么?
阿里国际站推出的AI搜索产品Accio,通过深度推理模型,能够为用户生成详尽的商业计划书,并提供采购建议和供应商链接。该产品于3月1日正式上线,展示了其在短...
阿里开源QwQ-32B,性能比肩R1。这是一次压倒性的创新。
阿里巴巴最新发布的推理模型QwQ-32B,以其320亿参数的规模,展现了与6710亿参数的DeepSeek-R1相媲美的性能。这一突破意味着,在更小的设备上运行更强大的推理...