Claude 官方发文:如何给 Agent 构建一个好用的工具?

AI-Agent20小时前发布 Founder Park
83 0 0
Claude 官方发文:如何给 Agent 构建一个好用的工具?

 

文章摘要


【关 键 词】 Claude功能智能体工具工具编写编写原则工具进化

Claude 新增创建和编辑主流办公文件的功能,拓展了 AI 应用场景。Anthropic 分享了开发和优化智能体工具的经验与方法论。

转变设计思维:要为不确定、会推理的 AI 设计直观易用的工具,而非仅考虑输入输出。评估要基于真实复杂任务,构建整合工作流的工具,精心设计工具描述。

工具的定义与特点:工具是确定性系统与非确定性智能体间的新型软件契约。编写时要为智能体量身设计,目标是扩大其解决任务的有效范围,且顺手的工具对人类也直观易懂。

编写工具的方法
构建原型:先快速搭建原型,为 Claude 提供相关文档。将工具包装在本地 MCP 服务器或桌面扩展中进行测试,也可传入 API 测试,并收集用户反馈。
运行评估:生成大量基于现实用途的评估任务,避免简单“沙盒”环境。每个任务要有可验证的响应,避免使用过严的验证器。通过直接调用 LLM API 程序化运行评估,收集顶层准确率等指标。
分析结果:智能体可帮助发现问题,观察其困惑之处,分析工具调用指标,读懂其反馈中的言外之意。
与智能体协作:让智能体分析结果并改进工具,依靠留出测试集避免过拟合。

编写高效工具的原则
选择合适工具:构建少数精心设计、针对特定工作流程的工具,避免简单封装现有功能,确保工具目的明确,减少功能重叠。
划分命名空间:用命名空间为工具划定界限,减少智能体选择工具的困惑,降低其犯错风险。
返回有意义上下文:工具应返回高信息量信号,优先考虑上下文相关性,可通过暴露参数控制响应详细程度,根据评估选择最佳响应结构。
优化 Token 效率:对可能占用大量上下文的响应实施分页等操作,设置合理默认参数,用有帮助的指令引导智能体。
进行提示工程:对工具描述和规范进行提示工程,明确输入输出,避免歧义,小改进也可能带来显著性能提升。

未来,智能体与世界互动机制会演变,需用系统性、评估驱动的方法改进工具,使其与智能体共同进化。

原文和模型


【原文链接】 阅读原文 [ 6466字 | 26分钟 ]
【原文作者】 Founder Park
【摘要模型】 doubao-1-5-pro-32k-250115
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...