数学推理 | 学习AIGC

7B模型数学推理击穿o1，直逼全美20%尖子生！四轮进化，微软华人新作爆火

微软亚研院的全华人团队提出了一种名为rStar-Math的新算法，该算法通过三项技术创新，使得小型语言模型（SLM）在数学推理能力上取得了突破性进展，甚至超越了...

AIGC动态

2周前

让7B千问模型超越o1，微软rStar-Math惊艳登场，网友盛赞

微软亚洲研究院的研究团队提出了一种名为rStar-Math的小型语言模型（SLM），在数学推理能力上表现出色，能够媲美甚至超越OpenAI的o1模型。rStar-Math通过自我...

AIGC动态

2周前

重大突破！微软发布“自我进化”，帮小模型超OpenAI-o1

微软亚洲研究院近期发布了一项名为rStar-Math的创新算法，该算法通过结合代码增强的Chain-of-Thought（CoT）和蒙特卡洛树搜索（MCTS）技术，显著提升了小参数...

AIGC动态

2周前

斯坦福打脸大模型数学水平：题干一改就集体降智，强如o1也失准，能力涌现怕不是检索题库

斯坦福大学的研究揭示了大型语言模型（LLMs）在数学推理任务中的一个显著弱点：仅通过改变题目中的变量名称和取值范围，就能显著降低模型的准确率。这一发现...

AIGC动态

2周前

OpenAI o1是真有实力！港大权威AB测试，国家队奥数题照样拿下

香港大学研究人员对OpenAI的Orion-1（o1）模型进行了严格的AB测试，以评估其数学推理能力。研究者通过比较o1在国际数学奥林匹克（IMO）和中国国家队训练营（C...

AIGC动态

1个月前

微软：两个AI相互纠错，数学再涨5分

加州大学和微软研究院的研究者们提出了一种名为Flow-DPO的新方法，旨在提升大型语言模型（LLM）在数学问题解答中的推理能力。该方法通过在线学习流（Flow）和...

AIGC动态

2个月前

AI做数学学会「动脑子」！ UCL等发现LLM「程序性知识」，推理绝不是背答案

最近，UCL和Cohere等机构的研究人员发现，在执行推理任务时，大型语言模型（LLM）表现出一种“程序性知识”。这项研究挑战了人们对于LLM仅通过简单检索来推理的...

AIGC动态

2个月前

国产模型炸裂登场，国外赞不绝口！OpenAI-o1级性能，免费使用

国产大模型平台DeepSeek最近发布了其全新推理模型DeepSeek-R1-Lite预览版，该模型以深度思维链推理为特色，在数学、代码和复杂推理任务上表现出色，能够生成...

AIGC动态

2个月前

连OpenAI都推不动Scaling Law了？MIT把「测试时训练」系统研究了一遍，发现还有路

近期，AI社区对The Information的一篇文章反响强烈，该文章指出OpenAI下一代旗舰模型的质量提升可能不及前两款，原因是高质量文本和其他数据供应减少，原本的...

AIGC动态

2个月前

Llama版o1来了，来自上海AI Lab，强化学习代码已开源，基于AlphaGo Zero范式

上海AI Lab团队发布了LLaMA版o1项目，旨在复刻OpenAI的o1推理大模型。该项目采用了蒙特卡洛树搜索、Self-Play强化学习、PPO以及AlphaGo Zero的双重策略范式。...

AIGC动态

3个月前

标签：数学推理

7B模型数学推理击穿o1，直逼全美20%尖子生！四轮进化，微软华人新作爆火

让7B千问模型超越o1，微软rStar-Math惊艳登场，网友盛赞

重大突破！微软发布“自我进化”，帮小模型超OpenAI-o1

斯坦福打脸大模型数学水平：题干一改就集体降智，强如o1也失准，能力涌现怕不是检索题库

OpenAI o1是真有实力！港大权威AB测试，国家队奥数题照样拿下

微软：两个AI相互纠错，数学再涨5分

AI做数学学会「动脑子」！ UCL等发现LLM「程序性知识」，推理绝不是背答案

国产模型炸裂登场，国外赞不绝口！OpenAI-o1级性能，免费使用

连OpenAI都推不动Scaling Law了？MIT把「测试时训练」系统研究了一遍，发现还有路

Llama版o1来了，来自上海AI Lab，强化学习代码已开源，基于AlphaGo Zero范式

热门网址

标签：数学推理

白日梦AI-视频创作

极客训练营-扫码领取免费材料

豆包MarsCode

有言AI-视频创作

热门网址