等不到 OpenAI 开源了!5 个工程师 24 小时手撸免费版 Deep Research,效果直追正主、过程全公开

AI-Agent24小时前发布 ai-front
99 0 0
等不到 OpenAI 开源了!5 个工程师 24 小时手撸免费版 Deep Research,效果直追正主、过程全公开

 

文章摘要


【关 键 词】 开源AI模型对比技术创新社区贡献行业竞争

OpenAI推出的Deep Research功能因其强大的自主研究能力受到关注,但仅限ChatGPT Pro订阅用户使用。对此,Hugging Face的团队在24小时内开发出一个免费开源版本“Open Deep Research”,向公众提供类似功能。这一项目通过GitHub开源,并详细公开了开发过程和核心技术架构。该团队利用OpenAI的o1模型与自研的开源代理框架结合,使系统能够执行多步骤任务,例如网页滚动、文件处理以及复杂信息整合。

Hugging Face的核心创新之一是采用“代码智能体”技术,以代码形式表达复杂的行动序列,从而提高任务完成效率。他们还借助微软Magentic-One智能体工具集实现了简化开发,并计划进一步改进文件处理、浏览器功能等核心模块。此外,为验证概念,团队从简单文本浏览器入手,未来则希望开发基于视觉的图形用户界面(GUI)智能体,以实现更复杂的交互操作。

在模型选择方面,团队测试了多种大语言模型,最终选用性能较优的o1模型作为核心,但也表示将探索如DeepSeek R1等开放权重模型的可能性。代理层设计被认为是关键创新点,GAIA基准测试显示,通过代理框架加持,Open Deep Research在复杂任务处理中的得分显著优于无代理的GPT-4o模型。尽管如此,与原版Deep Research相比,开源版本在性能上仍有差距。

该项目的意义在于快速重现并开放专有AI功能,促进了开发者社区对先进AI技术的研究与改进。测试结果表明,Open Deep Research在GAIA基准上的得分为54%,尽管低于OpenAI版本的67.36%,但已展现了令人瞩目的潜力。社区反响热烈,大量贡献者加入项目,推动其持续优化。面对开源AI的发展压力,OpenAI亦做出反应,宣布向所有用户开放ChatGPT搜索功能,进一步加剧了竞争态势。这反映出开源运动对专有AI服务的挑战及其对行业生态的深远影响。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 2618字 | 11分钟 ]
【原文作者】 AI前线
【摘要模型】 qwen-max-latest
【摘要评分】 ★★★★☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...