标签:数学推理
7B模型数学推理击穿o1,直逼全美20%尖子生!四轮进化,微软华人新作爆火
微软亚研院的全华人团队提出了一种名为rStar-Math的新算法,该算法通过三项技术创新,使得小型语言模型(SLM)在数学推理能力上取得了突破性进展,甚至超越了...
让7B千问模型超越o1,微软rStar-Math惊艳登场,网友盛赞
微软亚洲研究院的研究团队提出了一种名为rStar-Math的小型语言模型(SLM),在数学推理能力上表现出色,能够媲美甚至超越OpenAI的o1模型。rStar-Math通过自我...
重大突破!微软发布“自我进化”,帮小模型超OpenAI-o1
微软亚洲研究院近期发布了一项名为rStar-Math的创新算法,该算法通过结合代码增强的Chain-of-Thought(CoT)和蒙特卡洛树搜索(MCTS)技术,显著提升了小参数...
斯坦福打脸大模型数学水平:题干一改就集体降智,强如o1也失准,能力涌现怕不是检索题库
斯坦福大学的研究揭示了大型语言模型(LLMs)在数学推理任务中的一个显著弱点:仅通过改变题目中的变量名称和取值范围,就能显著降低模型的准确率。这一发现...
OpenAI o1是真有实力!港大权威AB测试,国家队奥数题照样拿下
香港大学研究人员对OpenAI的Orion-1(o1)模型进行了严格的AB测试,以评估其数学推理能力。研究者通过比较o1在国际数学奥林匹克(IMO)和中国国家队训练营(C...
微软:两个AI相互纠错,数学再涨5分
加州大学和微软研究院的研究者们提出了一种名为Flow-DPO的新方法,旨在提升大型语言模型(LLM)在数学问题解答中的推理能力。该方法通过在线学习流(Flow)和...
AI做数学学会「动脑子」! UCL等发现LLM「程序性知识」,推理绝不是背答案
最近,UCL和Cohere等机构的研究人员发现,在执行推理任务时,大型语言模型(LLM)表现出一种“程序性知识”。这项研究挑战了人们对于LLM仅通过简单检索来推理的...
国产模型炸裂登场,国外赞不绝口!OpenAI-o1级性能,免费使用
国产大模型平台DeepSeek最近发布了其全新推理模型DeepSeek-R1-Lite预览版,该模型以深度思维链推理为特色,在数学、代码和复杂推理任务上表现出色,能够生成...
连OpenAI都推不动Scaling Law了?MIT把「测试时训练」系统研究了一遍,发现还有路
近期,AI社区对The Information的一篇文章反响强烈,该文章指出OpenAI下一代旗舰模型的质量提升可能不及前两款,原因是高质量文本和其他数据供应减少,原本的...
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,基于AlphaGo Zero范式
上海AI Lab团队发布了LLaMA版o1项目,旨在复刻OpenAI的o1推理大模型。该项目采用了蒙特卡洛树搜索、Self-Play强化学习、PPO以及AlphaGo Zero的双重策略范式。...