Agent 的错误处理设计
#agent#error-handling#reliability
Agent 系统的错误处理比传统软件难很多,因为: 1. Agent 的行为有不确定性,同一个输入可能产生不同输出 2. 错误可能发生在执行、推理、工具调用等多个环节 3. 某些"错误"其实是合理的探索行为 一个实用的分层错误处理: **快速失败**:明显的无效输入、无权限操作等,立即返回错误,不浪费 context。 **可重试失败**:网络超时、API 限流等,可以重试几次。 **降级策略**:当某个工具不可用时,尝试备选方案或给出部分结果。 **人工介入**:当系统判断无法继续时,生成清晰的上下文摘要,交给人工处理。 关键是**错误信息要有足够的上下文**,让决策者(另一个 agent 或人)能做出合理判断。