Claude 官方发文：如何给 Agent 构建一个好用的工具？

83 0 0

文章摘要

Claude 新增创建和编辑主流办公文件的功能，拓展了 AI 应用场景。Anthropic 分享了开发和优化智能体工具的经验与方法论。

转变设计思维：要为不确定、会推理的 AI 设计直观易用的工具，而非仅考虑输入输出。评估要基于真实复杂任务，构建整合工作流的工具，精心设计工具描述。

工具的定义与特点：工具是确定性系统与非确定性智能体间的新型软件契约。编写时要为智能体量身设计，目标是扩大其解决任务的有效范围，且顺手的工具对人类也直观易懂。

编写工具的方法
– 构建原型：先快速搭建原型，为 Claude 提供相关文档。将工具包装在本地 MCP 服务器或桌面扩展中进行测试，也可传入 API 测试，并收集用户反馈。
– 运行评估：生成大量基于现实用途的评估任务，避免简单“沙盒”环境。每个任务要有可验证的响应，避免使用过严的验证器。通过直接调用 LLM API 程序化运行评估，收集顶层准确率等指标。
– 分析结果：智能体可帮助发现问题，观察其困惑之处，分析工具调用指标，读懂其反馈中的言外之意。
– 与智能体协作：让智能体分析结果并改进工具，依靠留出测试集避免过拟合。

编写高效工具的原则
– 选择合适工具：构建少数精心设计、针对特定工作流程的工具，避免简单封装现有功能，确保工具目的明确，减少功能重叠。
– 划分命名空间：用命名空间为工具划定界限，减少智能体选择工具的困惑，降低其犯错风险。
– 返回有意义上下文：工具应返回高信息量信号，优先考虑上下文相关性，可通过暴露参数控制响应详细程度，根据评估选择最佳响应结构。
– 优化 Token 效率：对可能占用大量上下文的响应实施分页等操作，设置合理默认参数，用有帮助的指令引导智能体。
– 进行提示工程：对工具描述和规范进行提示工程，明确输入输出，避免歧义，小改进也可能带来显著性能提升。

未来，智能体与世界互动机制会演变，需用系统性、评估驱动的方法改进工具，使其与智能体共同进化。