推理能力 | 第 3 页

Transformer能否推理引争议，DeepMind连夜更新论文开源数据集：Transformer真的很强

DeepMind最近的研究在人工智能领域引起了广泛关注，他们训练了一个仅270M大小的Transformer模型，该模型在下棋任务中展现出了大师级的表现，且无需依赖搜索算...

AIGC动态

4个月前

我们能够让开源小模型变得比人类更聪明吗

本文由安全研究员Harish SG撰写，旨在探讨如何提升开源大语言模型（LLM）的推理能力，以期达到或超越闭源模型的性能。Harish SG是德克萨斯大学达拉斯分校网络...

AIGC动态

4个月前

苹果一篇论文得罪大模型圈？Transformer不会推理，只是高级模式匹配器！所有LLM都判死刑

苹果研究者的最新研究对大型语言模型（LLM）的推理能力提出了质疑。研究发现，无论是闭源的OpenAI GPT-4o和o1模型，还是开源的Llama、Phi、Gemma和Mistral等...

AIGC动态

4个月前

大模型步入「推理Scaling」时代，SambaNova如何挑战英伟达的霸主地位？

OpenAI发布的o1模型在AI领域引起了巨大震动，它不仅能够处理复杂问题，还具备出色的通用推理能力。o1模型无需专门训练即可在数学奥赛中获得金牌，并在博士级...

AIGC动态

4个月前

英伟达开源新王登基！70B刷爆SOTA，击败GPT-4o只服OpenAI o1

英伟达最近开源了一款名为Nemotron-70B的AI模型，该模型在多个基准测试中超越了包括GPT-4和Claude 3.5 Sonnet在内的140多个开闭源模型，仅次于OpenAI的o1模型...

AIGC动态

4个月前

LLM仍然不能规划，刷屏的OpenAI o1远未达到饱和

OpenAI最近发布的o1模型在通用推理能力方面取得了显著进展，但在规划能力方面仍有待提升。亚利桑那州立大学（ASU）的研究团队通过PlanBench基准测试评估了当...

AIGC动态

5个月前

万字推演OpenAI o1 self-play RL 技术路线

曹宇在其文章中深入分析了OpenAI的新型自我博弈强化学习（RL）模型o1，该模型在数理推理领域取得了显著成绩，并提出了训练时计算（train-time compute）和测...

AIGC动态

5个月前

o1 研发团队完整采访：Ilya早期曾参与，灵感源于AlphaGo

OpenAI的o1模型自问世以来，以其卓越的推理能力在人工智能领域引起了广泛关注。o1不仅在数学奥林匹克竞赛中表现出色，甚至在博士级别的科学问答中超越了人类...

AIGC动态

5个月前

万字长文解析OpenAI o1 Self-Play RL技术路线

OpenAI最近推出的Self-Play RL新模型o1在数理推理领域取得了显著成绩，并提出了train-time compute和test-time compute两个新的RL Scaling Law。o1是一个多模...

AIGC动态

5个月前

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

CoT（Chain of Thought）作为一种新兴的人工智能技术，已经在自然语言处理（NLP）领域引起了广泛关注。CoT的核心思想是通过在模型的输入和输出之间插入一系列...

AIGC动态

5个月前

标签：推理能力

Transformer能否推理引争议，DeepMind连夜更新论文开源数据集：Transformer真的很强

我们能够让开源小模型变得比人类更聪明吗

苹果一篇论文得罪大模型圈？Transformer不会推理，只是高级模式匹配器！所有LLM都判死刑

大模型步入「推理Scaling」时代，SambaNova如何挑战英伟达的霸主地位？

英伟达开源新王登基！70B刷爆SOTA，击败GPT-4o只服OpenAI o1

LLM仍然不能规划，刷屏的OpenAI o1远未达到饱和

万字推演OpenAI o1 self-play RL 技术路线

o1 研发团队完整采访：Ilya早期曾参与，灵感源于AlphaGo

万字长文解析OpenAI o1 Self-Play RL技术路线

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

热门网址

标签：推理能力

白日梦AI-视频创作

极客训练营-扫码领取免费材料

豆包MarsCode

有言AI-视频创作

热门网址