Deep Agents: The Harness Behind Claude Code, Codex, Manus, and OpenClaw
摘要
AI代理性能飙升:仅优化工具链(不改模型)就让LangChain团队在Terminal Bench 2.0的排名从30开外跃居前5,准确率提升13.7个百分点。实战案例揭示:某营销优化代理看似完美的架构(数据输入-推荐生成-预算调整-效果监控循环)在长时任务中暴露致命缺陷——系统卡顿、流程中断、结果漂移。核心教训:代理系统必须像接力赛设计,每个环节都要预设断点续跑和状态恢复能力。