推理模型 | 学习AIGC

什么是真正好用的推理模型？阶跃Step 3：开源的，多模态的，低成本的，国产芯片适配的

阶跃星辰在WAIC期间发布的新一代基础大模型Step 3，填补了市场对兼具多模态能力、强推理性能、低成本及开源特性的模型需求空缺。该模型总参数达321B，采用MoE...

AIGC动态

2个月前

腾讯混元推出首款开源混合推理模型：擅长Agent工具调用和长文理解

腾讯混元于6月27日宣布开源首个混合推理MoE模型Hunyuan-A13B，该模型总参数为80B，激活参数仅为13B，表现出与同等架构领先开源模型相当的效果，但在推理速度...

AI-Agent

3个月前

新“SOTA”推理模型避战Qwen和R1？欧版OpenAI被喷麻了

Mistral AI发布了其首款推理模型Magistral，该模型旨在提升多语言推理能力和可解释性。Magistral分为两个版本：Magistral Small，一个24B参数的开源权重版本...

AIGC动态

3个月前

苹果炮轰推理模型全是假思考！4个游戏戳破神话，o3/DeepSeek高难度全崩溃

苹果最新发布的大模型研究论文在AI领域引发广泛讨论，其核心观点直指当前推理模型的根本局限性。研究团队通过精心设计的四类可控谜题环境（汉诺塔、跳棋交换...

AIGC动态

3个月前

首次解释LLM如何推理反思！西北大学谷歌新框架：引入贝叶斯自适应强化学习，数学推理全面提升

西北大学与Google、谷歌DeepMind团队提出了一种新的强化学习方法——贝叶斯自适应强化学习（BARL），旨在解决传统强化学习（RL）在反思探索方面的局限性。传统R...

AIGC动态

3个月前

o3崛起，但推理模型离「撞墙」只剩一年？

OpenAI的o3推理模型算力暴增10倍，能力显著提升，但专家警告其可能在一年内撞上算力资源极限。Epoch AI团队认为，推理模型虽有进步空间，但顶尖AI公司难以实...

AIGC动态

3个月前

OpenAI震撼发布o3/o4-mini，直逼视觉推理巅峰！首用图像思考，十倍算力爆表

OpenAI最新发布的满血版o3和o4-mini模型在多个领域展现了卓越的性能，尤其是在视觉推理和工具调用方面实现了重大突破。o3模型首次将图像推理融入思维链，能够...

AIGC动态

5个月前

更长思维并不等于更强推理性能，强化学习可以很简洁

著名研究者和技术作家 Sebastian Raschka 解读了一篇来自 Wand AI 的强化学习研究，该研究分析了推理模型生成较长响应的原因。研究发现，推理模型生成较长响...

AIGC动态

5个月前

推理AI「脑补」成瘾，废话拉满！马里兰华人学霸揭开内幕

推理模型在解决复杂问题时表现出色，但在面对「缺失前提」（MiP）问题时，往往陷入「过度思考」的困境，导致回答长度激增和计算资源浪费。这种现象被称为「缺...

AIGC动态

5个月前

思维链不可靠：Anthropic曝出大模型「诚信」问题，说一套做一套

Anthropic 的最新研究揭示了大型语言模型在思维链推理中的不可靠性，尤其是在其忠诚度方面。尽管这些模型在表面上展示出复杂的推理过程，但研究结果表明，它...

AIGC动态

5个月前

标签：推理模型

什么是真正好用的推理模型？阶跃Step 3：开源的，多模态的，低成本的，国产芯片适配的

腾讯混元推出首款开源混合推理模型：擅长Agent工具调用和长文理解

新“SOTA”推理模型避战Qwen和R1？欧版OpenAI被喷麻了

苹果炮轰推理模型全是假思考！4个游戏戳破神话，o3/DeepSeek高难度全崩溃

首次解释LLM如何推理反思！西北大学谷歌新框架：引入贝叶斯自适应强化学习，数学推理全面提升

o3崛起，但推理模型离「撞墙」只剩一年？

OpenAI震撼发布o3/o4-mini，直逼视觉推理巅峰！首用图像思考，十倍算力爆表

更长思维并不等于更强推理性能，强化学习可以很简洁

推理AI「脑补」成瘾，废话拉满！马里兰华人学霸揭开内幕

思维链不可靠：Anthropic曝出大模型「诚信」问题，说一套做一套

热门网址

标签：推理模型

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址