标签:推理能力

英伟达开源新王登基!70B刷爆SOTA,击败GPT-4o只服OpenAI o1

英伟达最近开源了一款名为Nemotron-70B的AI模型,该模型在多个基准测试中超越了包括GPT-4和Claude 3.5 Sonnet在内的140多个开闭源模型,仅次于OpenAI的o1模型...

LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和

OpenAI最近发布的o1模型在通用推理能力方面取得了显著进展,但在规划能力方面仍有待提升。亚利桑那州立大学(ASU)的研究团队通过PlanBench基准测试评估了当...

万字推演OpenAI o1 self-play RL 技术路线

曹宇在其文章中深入分析了OpenAI的新型自我博弈强化学习(RL)模型o1,该模型在数理推理领域取得了显著成绩,并提出了训练时计算(train-time compute)和测...

o1 研发团队完整采访:Ilya早期曾参与,灵感源于AlphaGo

OpenAI的o1模型自问世以来,以其卓越的推理能力在人工智能领域引起了广泛关注。o1不仅在数学奥林匹克竞赛中表现出色,甚至在博士级别的科学问答中超越了人类...

万字长文解析OpenAI o1 Self-Play RL技术路线

OpenAI最近推出的Self-Play RL新模型o1在数理推理领域取得了显著成绩,并提出了train-time compute和test-time compute两个新的RL Scaling Law。o1是一个多模...

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

CoT(Chain of Thought)作为一种新兴的人工智能技术,已经在自然语言处理(NLP)领域引起了广泛关注。CoT的核心思想是通过在模型的输入和输出之间插入一系列...

让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻

新智元报道了一项在人工智能领域的重要进展,即360公司采用的CoE(Collaboration of Experts)架构与OpenAI的o1模型在技术上的相似之处。o1模型以其卓越的推...

北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式

机器之心AIxiv专栏致力于发布学术和技术内容,已报道2000多篇涵盖全球顶级实验室的文章,促进了学术交流。OpenAI的o1模型在数学、代码和长程规划等领域取得显...

实测OpenAI的o1:真没吹牛,奥数题高考题都能信手拈来了?

OpenAI于2024年9月13日推出了全新的AI模型系列——OpenAI o1,也被称为“Strawberry模型”。这一系列模型专为解决复杂问题而设计,其性能在多个平台上超越了以往...

o1完整思维链成OpenAI头号禁忌!问多了等着封号吧

OpenAI最近推出了一款名为o1的新型大模型,该模型在发布后不久便引发了用户和开发者社区的广泛关注和讨论。o1模型因其能够提供类似于人类思维过程的推理链而...
1 3 4 5 6 7