![等不到 OpenAI 开源了!5 个工程师 24 小时手撸免费版 Deep Research,效果直追正主、过程全公开](https://www.xuexiaigc.com/wp-content/uploads/article-images/6e6fa87b6ea5780ee9.webp)
文章摘要
【关 键 词】 开源AI、模型对比、技术创新、社区贡献、行业竞争
OpenAI推出的Deep Research功能因其强大的自主研究能力受到关注,但仅限ChatGPT Pro订阅用户使用。对此,Hugging Face的团队在24小时内开发出一个免费开源版本“Open Deep Research”,向公众提供类似功能。这一项目通过GitHub开源,并详细公开了开发过程和核心技术架构。该团队利用OpenAI的o1模型与自研的开源代理框架结合,使系统能够执行多步骤任务,例如网页滚动、文件处理以及复杂信息整合。
Hugging Face的核心创新之一是采用“代码智能体”技术,以代码形式表达复杂的行动序列,从而提高任务完成效率。他们还借助微软Magentic-One智能体工具集实现了简化开发,并计划进一步改进文件处理、浏览器功能等核心模块。此外,为验证概念,团队从简单文本浏览器入手,未来则希望开发基于视觉的图形用户界面(GUI)智能体,以实现更复杂的交互操作。
在模型选择方面,团队测试了多种大语言模型,最终选用性能较优的o1模型作为核心,但也表示将探索如DeepSeek R1等开放权重模型的可能性。代理层设计被认为是关键创新点,GAIA基准测试显示,通过代理框架加持,Open Deep Research在复杂任务处理中的得分显著优于无代理的GPT-4o模型。尽管如此,与原版Deep Research相比,开源版本在性能上仍有差距。
该项目的意义在于快速重现并开放专有AI功能,促进了开发者社区对先进AI技术的研究与改进。测试结果表明,Open Deep Research在GAIA基准上的得分为54%,尽管低于OpenAI版本的67.36%,但已展现了令人瞩目的潜力。社区反响热烈,大量贡献者加入项目,推动其持续优化。面对开源AI的发展压力,OpenAI亦做出反应,宣布向所有用户开放ChatGPT搜索功能,进一步加剧了竞争态势。这反映出开源运动对专有AI服务的挑战及其对行业生态的深远影响。
原文和模型
【原文链接】 阅读原文 [ 2618字 | 11分钟 ]
【原文作者】 AI前线
【摘要模型】 qwen-max-latest
【摘要评分】 ★★★★☆