刚刚，OpenAI上线Deep Research！人类终极考试远超DeepSeek R1

AIGC动态7个月前发布 almosthuman2014

1,596 0 0

刚刚，OpenAI上线Deep Research！人类终极考试远超DeepSeek R1

文章摘要

OpenAI最新推出的智能体产品「Deep Research」，旨在通过推理综合在线信息，完成多步骤研究任务，以助用户进行深入复杂的信息查询与分析。Pro用户已可使用，未来将扩展至Plus和Team用户。Deep Research能在ChatGPT中快速完成人类需数小时才能完成的工作，独立为用户服务，根据提示查找、分析和综合数百个在线资源，创建综合报告。该产品由o3模型支持，针对网页浏览和数据分析优化，利用推理搜索、解释和分析互联网上的文本、图像和PDF，并根据信息调整。

Deep Research的推出是OpenAI朝开发AGI（人工通用智能）目标的重要一步，标志着AI进入自我发现新知识的新阶段。产品专为金融、科学、政策和工程等领域用户设计，也适用于需要超个性化推荐的购物者。每个输出都经过完整记录，附有引文和思路摘要，便于引用和验证。Deep Research在查找小众、非直观信息方面特别有效，加快复杂网络研究，释放用户时间。

使用Deep Research时，在ChatGPT中选择deep research并输入查询，可附加文件或电子表格。Deep Research需5到30分钟完成工作，期间用户可处理其他任务，完成后会收到通知，结果以报告形式出现。未来几周内，OpenAI将为报告添加图像、数据可视化等分析输出。

Deep Research通过端到端强化学习训练，学会规划和执行多步骤轨迹，找到所需数据，并实时响应信息。它能浏览用户上传的文件，使用Python工具绘制和迭代图表，嵌入响应中的图表和网站图像，并引用来源中的特定句子或段落。在「人类终极考试」评估中，支持Deep Research的模型以26.6%的准确率创下新高。在GAIA基准测试中，该模型达到新的SOTA水平，位居榜首。

Deep Research目前对计算资源需求高，Pro用户优化版本每月最多可进行100次查询。功能已在ChatGPT网页版上线，将逐步推广到移动和桌面应用程序。未来将连接更多专业数据源。Deep Research能进行异步在线查找，与Operator结合，使ChatGPT能执行更复杂任务。尽管仍处于早期阶段，存在局限性，但随着使用和时间推移，问题将迅速改善。