2024/01/18

Agent 的错误处理设计

#agent#error-handling#reliability

Agent 系统的错误处理比传统软件难很多，因为： 1. Agent 的行为有不确定性，同一个输入可能产生不同输出 2. 错误可能发生在执行、推理、工具调用等多个环节 3. 某些"错误"其实是合理的探索行为一个实用的分层错误处理： **快速失败**：明显的无效输入、无权限操作等，立即返回错误，不浪费 context。 **可重试失败**：网络超时、API 限流等，可以重试几次。 **降级策略**：当某个工具不可用时，尝试备选方案或给出部分结果。 **人工介入**：当系统判断无法继续时，生成清晰的上下文摘要，交给人工处理。关键是**错误信息要有足够的上下文**，让决策者（另一个 agent 或人）能做出合理判断。