推理能力 | 第 5 页

大模型步入「推理Scaling」时代，SambaNova如何挑战英伟达的霸主地位？

OpenAI发布的o1模型在AI领域引起了巨大震动，它不仅能够处理复杂问题，还具备出色的通用推理能力。o1模型无需专门训练即可在数学奥赛中获得金牌，并在博士级...

AIGC动态

10个月前

英伟达开源新王登基！70B刷爆SOTA，击败GPT-4o只服OpenAI o1

英伟达最近开源了一款名为Nemotron-70B的AI模型，该模型在多个基准测试中超越了包括GPT-4和Claude 3.5 Sonnet在内的140多个开闭源模型，仅次于OpenAI的o1模型...

AIGC动态

10个月前

LLM仍然不能规划，刷屏的OpenAI o1远未达到饱和

OpenAI最近发布的o1模型在通用推理能力方面取得了显著进展，但在规划能力方面仍有待提升。亚利桑那州立大学（ASU）的研究团队通过PlanBench基准测试评估了当...

AIGC动态

10个月前

万字推演OpenAI o1 self-play RL 技术路线

曹宇在其文章中深入分析了OpenAI的新型自我博弈强化学习（RL）模型o1，该模型在数理推理领域取得了显著成绩，并提出了训练时计算（train-time compute）和测...

AIGC动态

10个月前

o1 研发团队完整采访：Ilya早期曾参与，灵感源于AlphaGo

OpenAI的o1模型自问世以来，以其卓越的推理能力在人工智能领域引起了广泛关注。o1不仅在数学奥林匹克竞赛中表现出色，甚至在博士级别的科学问答中超越了人类...

AIGC动态

10个月前

万字长文解析OpenAI o1 Self-Play RL技术路线

OpenAI最近推出的Self-Play RL新模型o1在数理推理领域取得了显著成绩，并提出了train-time compute和test-time compute两个新的RL Scaling Law。o1是一个多模...

AIGC动态

11个月前

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

CoT（Chain of Thought）作为一种新兴的人工智能技术，已经在自然语言处理（NLP）领域引起了广泛关注。CoT的核心思想是通过在模型的输入和输出之间插入一系列...

AIGC动态

11个月前

让OpenAI o1逆天的慢思考，360两月前就做出来了？周鸿祎CoE媲美CoT，应用太前瞻

新智元报道了一项在人工智能领域的重要进展，即360公司采用的CoE（Collaboration of Experts）架构与OpenAI的o1模型在技术上的相似之处。o1模型以其卓越的推...

AIGC动态

11个月前

北大对齐团队独家解读：OpenAI o1开启「后训练」时代强化学习新范式

机器之心AIxiv专栏致力于发布学术和技术内容，已报道2000多篇涵盖全球顶级实验室的文章，促进了学术交流。OpenAI的o1模型在数学、代码和长程规划等领域取得显...

AIGC动态

11个月前

实测OpenAI的o1：真没吹牛，奥数题高考题都能信手拈来了？

OpenAI于2024年9月13日推出了全新的AI模型系列——OpenAI o1，也被称为“Strawberry模型”。这一系列模型专为解决复杂问题而设计，其性能在多个平台上超越了以往...

AIGC动态

11个月前

标签：推理能力

大模型步入「推理Scaling」时代，SambaNova如何挑战英伟达的霸主地位？

英伟达开源新王登基！70B刷爆SOTA，击败GPT-4o只服OpenAI o1

LLM仍然不能规划，刷屏的OpenAI o1远未达到饱和

万字推演OpenAI o1 self-play RL 技术路线

o1 研发团队完整采访：Ilya早期曾参与，灵感源于AlphaGo

万字长文解析OpenAI o1 Self-Play RL技术路线

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

让OpenAI o1逆天的慢思考，360两月前就做出来了？周鸿祎CoE媲美CoT，应用太前瞻

北大对齐团队独家解读：OpenAI o1开启「后训练」时代强化学习新范式

实测OpenAI的o1：真没吹牛，奥数题高考题都能信手拈来了？

热门网址

标签：推理能力

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址