标签:推理能力

OpenAI官宣o3系列王者模型:能解最难的数学题,单个任务最高花费数千美元,越贵越好用!

OpenAI在“OpenAI 12 天”活动的尾声发布了两款新模型:o3和o3-mini,作为o1和o1-mini的继任者。o3系列模型在编码、数学和科学掌握、以及推理能力上表现出色,...

刚刚,OpenAI放出最后大惊喜o3,高计算模式每任务花费数千美元

OpenAI最近发布了新的推理系列模型o3和o3-mini,作为o1系列模型的继任者,这些模型在回答问题前会花费更多时间进行思考以提高准确率。o3系列模型在ARC-AGI基...

免费o1替代品来了!谷歌新发“王炸”推理大模型:思考速度碾压其他大模型,水平堪比理科博士

谷歌在其“Gemini 2.0 Flash Thinking”模型上取得了新进展,该模型以其卓越的推理能力而受到关注,能够通过“明确地展示自己的思维”来解决复杂问题,其水平与物...

Ilya Sutskever 在 NeurIPS 2024 的演讲:预训练时代已经结束了

在NeurIPS 2024会议上,Safe SuperIntelligence实验室创始人、原OpenAI联合创始人兼首席科学家Ilya Sutskever发表了题为《Sequence to sequence learning wit...

田渊栋团队论文火了!连续思维链优于CoT,打开LLM推理新范式

在认知科学领域,关于语言是否用于思考或交流的辩论一直存在。随着大型语言模型(LLM)和思维链(Chain of Thought, CoT)的兴起,语言已成为机器推理的默认...

很快OpenAI能证明陶哲轩错了?陶哲轩一句话,被OpenAI高管怼回去

OpenAI的最新o1模型在数学和代码能力上取得了显著提升,其中数学性能提升了36%。菲尔兹奖得主陶哲轩在与OpenAI研究高级副总Mark Chen的访谈中,讨论了o1推理...

OpenAI狂飙突进!仅12个例子就能打造专属AI专家,核心技术竟来自字节?

OpenAI在其“12天”活动的第二天发布了强化微调(Reinforcement Fine-Tuning)技术,并展示了ChatGPT Pro。这项技术允许企业用户通过极少的数据定制o1 mini模型...

第一个国产中文o1来了,直接数学竞赛题伺候!

昆仑万维的Skywork o1系列模型因其出色的推理能力而备受关注。该系列包括Skywork o1 Open、Skywork o1 Lite和Skywork o1 Preview三个细分模型,分别具备解决...

OpenAI怒斥Scaling撞墙论!o1已产生推理直觉潜力巨大

OpenAI高级研究副总裁Mark Chen在一次炉边谈话中反驳了关于Scaling Law(规模法则)撞墙的观点。他强调,OpenAI通过o系列和GPT系列模型,成功维持了模型的Sca...

震撼预警:满血版o1倒计时!奥特曼完整专访流出:o系列疯狂迭代,马上起飞

OpenAI即将推出的满血版o1模型在科技圈引起了广泛关注。该模型预计将具备函数调用、开发者消息、结构化输出和流式传输等能力,可能成为OpenAI历史上的重大突...
1 2 3 5