刚刚,OpenAI上线Deep Research!人类终极考试远超DeepSeek R1
文章摘要
【关 键 词】 智能搜索、数据分析、AI推理、知识发现、效率提升
OpenAI最新推出的智能体产品「Deep Research」,旨在通过推理综合在线信息,完成多步骤研究任务,以助用户进行深入复杂的信息查询与分析。Pro用户已可使用,未来将扩展至Plus和Team用户。Deep Research能在ChatGPT中快速完成人类需数小时才能完成的工作,独立为用户服务,根据提示查找、分析和综合数百个在线资源,创建综合报告。该产品由o3模型支持,针对网页浏览和数据分析优化,利用推理搜索、解释和分析互联网上的文本、图像和PDF,并根据信息调整。
Deep Research的推出是OpenAI朝开发AGI(人工通用智能)目标的重要一步,标志着AI进入自我发现新知识的新阶段。产品专为金融、科学、政策和工程等领域用户设计,也适用于需要超个性化推荐的购物者。每个输出都经过完整记录,附有引文和思路摘要,便于引用和验证。Deep Research在查找小众、非直观信息方面特别有效,加快复杂网络研究,释放用户时间。
使用Deep Research时,在ChatGPT中选择deep research并输入查询,可附加文件或电子表格。Deep Research需5到30分钟完成工作,期间用户可处理其他任务,完成后会收到通知,结果以报告形式出现。未来几周内,OpenAI将为报告添加图像、数据可视化等分析输出。
Deep Research通过端到端强化学习训练,学会规划和执行多步骤轨迹,找到所需数据,并实时响应信息。它能浏览用户上传的文件,使用Python工具绘制和迭代图表,嵌入响应中的图表和网站图像,并引用来源中的特定句子或段落。在「人类终极考试」评估中,支持Deep Research的模型以26.6%的准确率创下新高。在GAIA基准测试中,该模型达到新的SOTA水平,位居榜首。
Deep Research目前对计算资源需求高,Pro用户优化版本每月最多可进行100次查询。功能已在ChatGPT网页版上线,将逐步推广到移动和桌面应用程序。未来将连接更多专业数据源。Deep Research能进行异步在线查找,与Operator结合,使ChatGPT能执行更复杂任务。尽管仍处于早期阶段,存在局限性,但随着使用和时间推移,问题将迅速改善。
原文和模型
【原文链接】 阅读原文 [ 2592字 | 11分钟 ]
【原文作者】 机器之心
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★