标签:推理模型

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

xAI团队发布了Grok-3系列模型及配套工具,标志着大规模算力与模型能力结合的新里程碑。该模型在20万块GPU集群上完成训练,成为首个突破10万GPU同步训练规模的...

DeepSeek 颠覆了什么?学习不靠“人盯”,AI自己“卷”自己

DeepSeek 在近期推出的 R1 模型及其 Zero 研究,通过纯强化学习路线实现了推理模型的突破性进展。其核心创新在于证明无需过程监督数据,仅依靠结果控制即可训...

DeepSeek R1 之后,重新理解推理模型

对推理模型的技术发展与行业应用分析显示,这类模型通过多步骤生成和中间思考过程解决复杂任务,其核心优势体现在解谜、数学证明与编码挑战等场景。“推理”被...

Sebastian Raschka:关于DeepSeek R1和推理模型,我有几点看法

著名AI研究者Sebastian Raschka基于DeepSeek技术报告,系统阐述了增强大语言模型推理能力的四大核心方法。_推理模型被定义为擅长处理需要多步骤中间推导的复...

成本不到150元!李飞飞等26分钟训出个推理模型,媲美o1和R1,秘诀:用蒸馏

通过蒸馏技术,研究团队成功训练出一个性能可媲美DeepSeek-R1和OpenAI o1的推理模型s1,其成本不到150元人民币。这一成果由李飞飞、斯坦福大学、华盛顿大学及...

o3-mini 碾压DeepSeek R1?一条python程序引发近400万围观

OpenAI最近推出了新的推理模型系列o3-mini,这是其推理模型系列中最新、最具成本效益的模型,相比之前的o1系列,成本降低了15倍。o3-mini的推出引起了广泛关...

首个OpenAI免费推理模型o3-mini发布!DeepSeek让奥特曼反思:不开源我们错了

OpenAI最近发布了o3-mini系列推理模型,旨在推动低成本推理的边界。该系列包含三个版本:low、medium和high,其中o3-mini和o3-mini-high已上线。o3系列模型针...

超全推理语言模型蓝图来了!揭开o1、o3、DeepSeek-V3神秘面纱

ETH Zurich等机构的研究人员提出了推理语言模型(RLM)的蓝图,旨在克服最先进RLM的高昂成本和专有特性带来的可访问性和公平性问题。RLM被视为AI领域的革命性...

DeepSeek的提示词技巧,就是没有技巧。

DeepSeek-R1是由中国公司深度求索开发的AI大模型,其背后的支持者为量化私募幻方基金。自2023年7月17日成立以来,深度求索陆续发布了多个AI大模型,包括DeepS...

Search版o1:推理过程会主动查资料,整体性能优于人类专家,清华人大出品

中国人民大学和清华大学联合推出了名为Search-o1的最新Agentic搜索增强推理模型框架,该框架在博士级别的科学问答、数学和代码能力的11项评测中表现出色,赢...
1 2 3 4