标签:推理能力
万字推演OpenAI o1 self-play RL 技术路线
曹宇在其文章中深入分析了OpenAI的新型自我博弈强化学习(RL)模型o1,该模型在数理推理领域取得了显著成绩,并提出了训练时计算(train-time compute)和测...
o1 研发团队完整采访:Ilya早期曾参与,灵感源于AlphaGo
OpenAI的o1模型自问世以来,以其卓越的推理能力在人工智能领域引起了广泛关注。o1不仅在数学奥林匹克竞赛中表现出色,甚至在博士级别的科学问答中超越了人类...
万字长文解析OpenAI o1 Self-Play RL技术路线
OpenAI最近推出的Self-Play RL新模型o1在数理推理领域取得了显著成绩,并提出了train-time compute和test-time compute两个新的RL Scaling Law。o1是一个多模...
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对
CoT(Chain of Thought)作为一种新兴的人工智能技术,已经在自然语言处理(NLP)领域引起了广泛关注。CoT的核心思想是通过在模型的输入和输出之间插入一系列...
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
新智元报道了一项在人工智能领域的重要进展,即360公司采用的CoE(Collaboration of Experts)架构与OpenAI的o1模型在技术上的相似之处。o1模型以其卓越的推...
北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式
机器之心AIxiv专栏致力于发布学术和技术内容,已报道2000多篇涵盖全球顶级实验室的文章,促进了学术交流。OpenAI的o1模型在数学、代码和长程规划等领域取得显...
实测OpenAI的o1:真没吹牛,奥数题高考题都能信手拈来了?
OpenAI于2024年9月13日推出了全新的AI模型系列——OpenAI o1,也被称为“Strawberry模型”。这一系列模型专为解决复杂问题而设计,其性能在多个平台上超越了以往...
o1完整思维链成OpenAI头号禁忌!问多了等着封号吧
OpenAI最近推出了一款名为o1的新型大模型,该模型在发布后不久便引发了用户和开发者社区的广泛关注和讨论。o1模型因其能够提供类似于人类思维过程的推理链而...
刚刚!OpenAI发布全新o1系列两款模型,o1-mini价格暴降80%,即日起全面上线|钛媒体AGI
美国OpenAI公司近期推出了两款新型AI模型:OpenAI o1-preview和o1-mini,这些模型在处理复杂任务方面表现出色,特别是在推理数学、编程和科学问题上。o1-prev...
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
OpenAI在9月13日宣布了其最新AI大模型系列的发布,这标志着大模型技术发展的新起点。新模型专门设计用于解决复杂问题,能够执行复杂推理,超越了以往科学、代...