数学能力 | 学习AIGC

国产推理大模型决战2025考研数学，看看谁第一个上岸？

随着2025年研究生考试的结束，考研数学真题成为了测试大语言模型，尤其是推理模型深度思考能力的重要工具。过去，大语言模型在数学问题上的表现并不理想，但...

AIGC动态

1周前

清华大学NLP实验室联合上海AI Lab、清华大学电子系及OpenBMB社区提出了一种新的强化学习方法PRIME（Process Reinforcement through IMplicit REwards），该方...

AIGC动态

2周前

智谱GLM模型家族在2024年最后一天推出了GLM-Zero-Preview，这是一家专注于深度思考与推理的新成员。GLM-Zero-Preview在处理数理逻辑、代码和需要深度推理的复...

AIGC动态

3周前

苹果研究者的最新研究对大型语言模型（LLM）的推理能力提出了质疑。研究发现，无论是闭源的OpenAI GPT-4o和o1模型，还是开源的Llama、Phi、Gemma和Mistral等...

AIGC动态

3个月前

OpenAI最近推出了o1系列模型，包括o1-preview和o1-mini，这些模型在复杂推理、数学和编程问题上展现出了显著的性能提升。o1-preview模型将向ChatGPT的Plus和T...

AIGC动态

4个月前

在谷歌I/O大会上， Gemini 1.5 Pro的发布引起了广泛关注。该模型的数学专业版本在多项基准测试中展现出了卓越性能，特别是数学能力，其成绩甚至与人类专家水...

AIGC动态

8个月前