等不到 OpenAI 开源了！5 个工程师 24 小时手撸免费版 Deep Research，效果直追正主、过程全公开

1,399 0 0

文章摘要

OpenAI推出的Deep Research功能因其强大的自主研究能力受到关注，但仅限ChatGPT Pro订阅用户使用。对此，Hugging Face的团队在24小时内开发出一个免费开源版本“Open Deep Research”，向公众提供类似功能。这一项目通过GitHub开源，并详细公开了开发过程和核心技术架构。该团队利用OpenAI的o1模型与自研的开源代理框架结合，使系统能够执行多步骤任务，例如网页滚动、文件处理以及复杂信息整合。

Hugging Face的核心创新之一是采用“代码智能体”技术，以代码形式表达复杂的行动序列，从而提高任务完成效率。他们还借助微软Magentic-One智能体工具集实现了简化开发，并计划进一步改进文件处理、浏览器功能等核心模块。此外，为验证概念，团队从简单文本浏览器入手，未来则希望开发基于视觉的图形用户界面（GUI）智能体，以实现更复杂的交互操作。

在模型选择方面，团队测试了多种大语言模型，最终选用性能较优的o1模型作为核心，但也表示将探索如DeepSeek R1等开放权重模型的可能性。代理层设计被认为是关键创新点，GAIA基准测试显示，通过代理框架加持，Open Deep Research在复杂任务处理中的得分显著优于无代理的GPT-4o模型。尽管如此，与原版Deep Research相比，开源版本在性能上仍有差距。

该项目的意义在于快速重现并开放专有AI功能，促进了开发者社区对先进AI技术的研究与改进。测试结果表明，Open Deep Research在GAIA基准上的得分为54%，尽管低于OpenAI版本的67.36%，但已展现了令人瞩目的潜力。社区反响热烈，大量贡献者加入项目，推动其持续优化。面对开源AI的发展压力，OpenAI亦做出反应，宣布向所有用户开放ChatGPT搜索功能，进一步加剧了竞争态势。这反映出开源运动对专有AI服务的挑战及其对行业生态的深远影响。