标签:数学能力
国产推理大模型决战2025考研数学,看看谁第一个上岸?
随着2025年研究生考试的结束,考研数学真题成为了测试大语言模型,尤其是推理模型深度思考能力的重要工具。过去,大语言模型在数学问题上的表现并不理想,但...
清华团队靠强化学习让 7B 模型打败GPT-4o数学推理
清华大学NLP实验室联合上海AI Lab、清华大学电子系及OpenBMB社区提出了一种新的强化学习方法PRIME(Process Reinforcement through IMplicit REwards),该方...
考研数学得126分、还能编写小游戏,智谱首个推理模型来了,人人免费用
智谱GLM模型家族在2024年最后一天推出了GLM-Zero-Preview,这是一家专注于深度思考与推理的新成员。GLM-Zero-Preview在处理数理逻辑、代码和需要深度推理的复...
苹果一篇论文得罪大模型圈?Transformer不会推理,只是高级模式匹配器!所有LLM都判死刑
苹果研究者的最新研究对大型语言模型(LLM)的推理能力提出了质疑。研究发现,无论是闭源的OpenAI GPT-4o和o1模型,还是开源的Llama、Phi、Gemma和Mistral等...
OpenAI o1模型问世,五级AGI再突破!推理极限超博士,清北复旦华人立功
OpenAI最近推出了o1系列模型,包括o1-preview和o1-mini,这些模型在复杂推理、数学和编程问题上展现出了显著的性能提升。o1-preview模型将向ChatGPT的Plus和T...
谷歌数学版Gemini破解奥赛难题,堪比人类数学家!
在谷歌I/O大会上, Gemini 1.5 Pro的发布引起了广泛关注。该模型的数学专业版本在多项基准测试中展现出了卓越性能,特别是数学能力,其成绩甚至与人类专家水...