Manus爆火的秘密武器Browser Use融资1700万美元！让AI「读懂」网页

1,421 0 0

文章摘要

随着AI 智能体的快速发展，Browser Use凭借其独特的技术优势迅速崛起，成为AI应用领域的热门工具。该工具通过将网页的交互元素（如按钮、表单等）转化为智能体易于理解的格式，使AI能够自动化执行复杂的浏览器操作，例如填写表单、搜索信息或导航网页。Browser Use的核心价值在于其能够帮助智能体更高效地“读懂”网站，从而自主完成任务，显著降低了传统视觉系统在处理网页时的高成本和低效率问题。这一创新不仅吸引了大量开发者和投资人的关注，也使其成为众多AI公司实现智能体与网站无缝交互的底层技术。

Browser Use的创始团队由Magnus Müller和Gregor Zunic组成，他们通过苏黎世联邦理工学院的创业加速器启动了这一项目。Müller在网页抓取工具领域的研究经验与Zunic的数据科学背景相结合，催生了将网页抓取与数据科学融合的想法，最终开发出Browser Use的初始版本。该工具在短短五周内完成原型并迅速走红，随后团队决定将其开源，进一步推动了其普及。目前，Browser Use在GitHub上已获得超过47k个Star，并被广泛应用于多个项目中。

Browser Use的成功也得益于其与智能体生态的深度融合。例如，Manus智能体集成了Browser Use的功能，使其能够实时显示思考过程并提供友好的用户界面，从而迅速吸引了大量用户。这种集成不仅提升了Manus的实用性，也直接推动了Browser Use的知名度。此外，Browser Use的开源策略和创始团队的创新理念也为其赢得了投资者的青睐。Felicis的Astasia Myers表示，Browser Use的创始团队及其开源优先的策略彻底打动了她，她认为网页AI智能体是下一个前沿技术，能够实现人类任务的端到端自动化。

在技术层面，Browser Use的崛起与智能体领域的其他重要进展密切相关。例如，Anthropic提出的“模型上下文协议”（MCP）为AI模型与外部工具和服务的交互提供了通用接口，类似于USB-C在设备连接中的作用。MCP的引入使得AI助手不仅能够“读懂”代码，还能“理解”团队讨论和文档等外部信息，从而提供更加精准的回答。与此同时，OpenAI推出的Operator工具展示了AI智能体在网络任务自动化中的潜力，尽管它仍需要用户在复杂界面或验证码出现时介入。

总体而言，Browser Use的爆火标志着AI智能体在网页交互和任务自动化领域的重大突破。通过将网页元素转化为智能体可理解的格式，Browser Use不仅提高了智能体的执行效率，也为AI应用的广泛普及奠定了基础。随着越来越多的公司采用这一技术，Browser Use有望成为推动AI智能体发展的关键力量。