开放世界中的多智能体协作与博弈(打造最高效的“ AI 团队” )

如果无法正常显示，请先停止浏览器的去广告插件。

1. 开放世界中的多智能体协作与博弈 (打造最高效的“ AI 团队” ) Raphael Shu

2. 目录 01 开场与破题：Magnetic - One System 案例 02 LLM 给多智能体系统带来了什么？ 03 企业落地：协作效果评估与打造高效 AI 团队 04 开放世界的多智能体协作 05 总结与展望

4. 个人简介 Raphael Shu • 2020 年东京大学博士。赴纽约大学Lecun实验室访问研究。 • 2021 年加入 AWS AI Lab，Amazon Bedrock Science 技术负责人。 • 2022 年主导AWS 首个基于LLM的智能代理系统 (Dialog2API) • 2023年负责 Amazon Titan（现 Amazon Nova）的 Agent能力训练。 • 2024 年带领设计 Bedrock 多智能体协作系统（Bedrock Multi- Agent Collaboration），于年底上线。 • 组织 WMAC 2025 / WMAC 2026（Workshop on Advancing LLM-based Multi-Agent Collaboration）。 • Acenta AI创始人

5. 01 从 Magnetic One 系统看MAS

6. 微软Magentic - One 多智能体系统由 Orchestrator和四个Sub Agent 构成: ❑ ❑ ❑ ❑ 1. FileSurfer 2. WebSurfer 3. Coder 4. Computer Terminal

8. Magentic - One 多智能体系统 ❑ 拓扑结构（Topology） ❑ 中心化结构 ❑ 编排 x 1 + 子代理 x 4 ❑ 行为发起者（Initiative Taker）: ❑ 编排 ❑ 决策者（Decision Maker）: ❑ 编排 ❑ 协调机制（Coordination Process） ❑ 分治

9. 异步多智能体系统的四大组件典型的异步多智能体系统（Async MAS）架构： ❑ 事件循环 / 调度器（event loop / scheduler） ❑ 编排/协调器 (Orchestrator) ❑ 任务状态/记忆系统（shared ledger or memory） ❑ Agent池（ agent pool ）

10. 多智能体协作的意义难以同时处理规划 + 执行 + 评估的复合任务单 Agent 系统的局限上下文窗口 / Token 限制无全局视角，导致局部最优分工协作：将复杂问题拆解成可独立求解的子任务。多 Agent协作的价值并行执行：降低推理延迟，提高系统吞吐。群体自治：具备互评、协商与动态任务重构能力。核心洞察多智能体协作并非单纯追求更强大模型，而是打造更有效的组织结构

11. 多智能体协作的意义主流厂商生态布局 Framework 层 Service 层 Google → Gemini Agents, Agent Space LangGraph / AutoGen / OpenAI Agents SDK / Strands / CrewAI / AG2 / Camel / … AWS Bedrock Agents / AWS AgentCore / ByteDance Coze / AgentSpace / Vertex Agent Builder / Microsoft AI Foundry / OpenAI AgentKit / … Protocol 层 Collaboration 层 FIPA / CNP / MCP / A2A / ACP / ACNBP / LangChain AP / … OpenAgents Microsoft → Autogen、AI Foundry Agent Service、Copilot 生态 OpenAI → OpenAI Agents SDK AWS → Bedrock Agents、AgentCore ByteDance → Coze 初创生态 → LangGraph、CrewAI、AG2, Camel等

12. 02 LLM 给多智能体系统带来了什么？

13. MAS 的发展历程 1990年代智能体兴起 Agent系统和早期 MAS 探索协作机制多智能体强化学习（ MARL） Deep MARL / LLM- Based Agents 以Actor Model为基础基本确定Agent定义 / 强调智能体的自治和环境感知能力 / MAS 初步发展 2000初期 Agent系统 (JADE, GAIA, Troops) 出现 / 探讨Planning & Cooperation / 2002年第一届 AAMAS大会 2003 – 2008 学术界开始探索组织架构和协作机制。出现了以博弈为核心的 MAS。 MARL作为MAS的重要技术，利用强化学习方法使多个智能体在动态环境中学习协作策略，实现更高效的群体决策和任务完成 MARL与深度学习结合 (StarCraft II, OpenAI Five)。 LLM-based Agents获得关注之后，出现了例如 MetaGPT的LLM driven MAS系统 • GAIA (Wooldridge, Jennings & Kinny, 2000) • Team theory and Joint Intentions Theory (Cohen & Levesque） • • Wooldridge & Jennings (1995) – “Intelligent Agents: Theory and Practice” Georgeff et al. (1998) – BDI Agent Architecture • • Market-based MAS Coalition and Team Formation - Shehory & Kraus Normative MAS (Boella & van der Torre, 2003). Game-theoretic MAS (Shoham & Leyton- Brown, 2008) • • • • • MADDPG (Lowe et al., 2017) QMIX (Rashid et al., 2018) COMA (Foerster et al., 2018) Swarm Intelligence （ Bonabeau, Dorigo, Theraulaz） Social Simulation and Economics • • • • • • QMIX (Rashid et al., ICML 2018) MAPPO (Yu et al., 2022) MetaGPT (Hong et al., 2023) CAMEL (Li et al., 2023) AutoGen (Wu et al., 2023) AgentVerse (Chen et al., 2023)

14. 多智能体系统（MAS ）是一个社会系统 Agents（智能体） Environment（环境） Infrastructure（基础设施）个体智能实体，具备自主感知、决策与行智能体所感知和交互的空间，包含物理和支撑系统运行的底层资源与技术，包括消动能力，是系统的基本执行单元。虚拟环境，提供任务上下文与约束条件。息路由、调度器、存储等关键组件。 Organization（组织结构） Communication（通信） Coordination（协调机制）智能体之间的信息交换机制，涵盖语言、系统内部的结构与角色分配，定义智能体资源分配与任务协同的策略和方法，确保信号、协议等形式，保障协作信息流通。的职责、权限和协作规范，形成社会化体各智能体高效配合，实现目标一致性。系。

15. LLM 给多智能体带来了什么使用语言进行感知+行动语义丰富的信息交互与协商通过自然语言进行反馈与学习智能体直接使用非结构化语言进行感知与行动。智能体使用语言完成复杂的协商与动态任务编排。智能体通过自然语言反馈进行在线学习。

16. LLM 给多智能体带来了什么使用语言进行感知+行动语义丰富的信息交互与协商通过自然语言进行反馈与学习智能体直接使用非结构化语言进行感知与行动。智能体使用语言完成复杂的协商与动态任务编排。智能体通过自然语言反馈进行在线学习。 1000 (收到) 1011 (前方减速)

17. LLM 给多智能体带来了什么使用语言进行感知+行动语义丰富的信息交互与协商通过自然语言进行反馈与学习智能体直接使用非结构化语言进行感知与行动。智能体使用语言完成复杂的协商与动态任务编排。智能体通过自然语言反馈进行在线学习。 1000 (收到) 等下，前面有车有点急事，让我先过去 1011 (前方减速)

18. LLM 给多智能体带来了什么使用语言进行感知+行动语义丰富的信息交互与协商通过自然语言进行反馈与学习智能体直接使用非结构化语言进行感知与行动。智能体使用语言完成复杂的协商与动态任务编排。智能体通过自然语言反馈进行在线学习。 1000 (收到) 有车闯红灯，危险等下，前面有车谢谢，马上紧急制动有点急事，让我先过去 1011 (前方减速)

19. LLM 给多智能体带来了什么使用语言进行感知+行动语义丰富的信息交互与协商通过自然语言进行反馈与学习智能体直接使用非结构化语言进行感知与行动。智能体使用语言完成复杂的协商与动态任务编排。智能体通过自然语言反馈进行在线学习。 1000 (收到) 已经减速，可安全通过有车闯红灯，危险等下，前面有车谢谢，马上紧急制动车上有急诊病人，借过下有点急事，让我先过去 1011 (前方减速)

20. LLM 给多智能体带来了什么使用语言进行感知+行动语义丰富的信息交互与协商通过自然语言进行反馈与学习智能体直接使用非结构化语言进行感知与行动。智能体使用语言完成复杂的协商与动态任务编排。智能体通过自然语言反馈进行在线学习。 1000 (收到) 已经减速，可安全通过有车闯红灯，危险等下，前面有车谢谢，马上紧急制动车上有急诊病人，借过下有点急事，让我先过去 1011 (前方减速)

21. LLM 给多智能体带来了什么使用语言进行感知+行动语义丰富的信息交互与协商通过自然语言进行反馈与学习智能体直接使用非结构化语言进行感知与行动。智能体使用语言完成复杂的协商与动态任务编排。智能体通过自然语言反馈进行在线学习。 1000 (收到) 已经减速，可安全通过有车闯红灯，危险等下，前面有车谢谢，马上紧急制动车上有急诊病人，借过下有点急事，让我先过去 1011 (前方减速) 好的，我加速过去并道，我马上减速，你先过

22. LLM 给多智能体带来了什么使用语言进行感知+行动语义丰富的信息交互与协商通过自然语言进行反馈与学习智能体直接使用非结构化语言进行感知与行动。智能体使用语言完成复杂的协商与动态任务编排。智能体通过自然语言反馈进行在线学习。 1000 (收到) 已经减速，可安全通过有车闯红灯，危险等下，前面有车谢谢，马上紧急制动车上有急诊病人，借过下有点急事，让我先过去好的，我加速过去我减速，你加速过去 1011 (前方减速) 我要从左侧出去我也减速

23. 04 企业落地 – 评估协作效果与打造高效的AI团队

24. 如何量化协作？端到端指标体系 Task Completion Rate (TCR) End-to-end Latency 任务完成率端到端延迟 Collaboration Overhead Collaboration Efficiency 协作开销协作效率

25. 端到端评价体系第一阶段: 任务模拟 ❑ Agent Profiles ❑ Task Profiles ❑ User Simulation ❑ Action Simulation 第二阶段: 成功率评价 ❑ Assertions

26. 案例

27. 案例

28. 案例最终评价： F T T T F

29. 实测结果：Bedrock Agents 公开数据 Setting 数据集成功率平均通信开销 (s) Supervisor: Sonnet 3.5 (20241022) Specialists: Haiku 3.5 Travel Mortgage Software 0.80 0.83 0.87 12.95 11.03 36.65 Single-agent: Sonnet 3.5 (20241022) Travel Mortgage Software 0.60 0.80 0.53 — — —

30. 打造高效的AI团队 – 常见瓶颈问题现象影响分析 • 速度瓶颈：多智能体任务响应和处理速度不足，导致整体协作延迟。 • 任务完成时间延长，影响系统实时性和用户体验。 • Token限制：模型调用受限于Token数量，限制了信息交流和任务复杂度。 • 多轮复杂对话受阻，降低智能体间信息传递的完整性。 • 无效合作：部分智能体间协作重复、冲突，降低资源利用效率。 • 资源浪费，增加计算成本，影响整体协作效果。

31. Artifact Caching的重要性 ❑ 积极缓存（Artifact Caching）指的是在多智能体系统中重用之前产生的工具输出、网络抓取结果、嵌入表示和函数调用结果。 ❑ 减少了重复计算和数据请求，降低了系统的响应延迟和资源消耗。 ❑ 通过缓存共享，智能体可以快速访问已有信息，支持更高效的协作和决策过程。 ❑ Artifact Caching 是提升多智能体系统执行速度和稳定性的关键技术手段。

32. 05 从封闭任务到开放世界

33. 从封闭任务到开放世界：协作与博弈的边界变化 • 封闭世界 • Workflow Engineering • 开放世界 • Ecosystem Engineering • 任务边界清晰、Agent 固定、奖励函数稳定 • 任务不确定、成员不固定、目标冲突，存在博弈

34. 为什么要探索开放世界的协同合作(Open Collaboration)？ ❑ 探索群体智能需要更大规模的智能体合作 ❑ 现实世界的挑战 ❑ 任务边界模糊化（企业、科研等任务难以清晰定义） ❑ 生态复杂（多方系统，异质系统/模型，跨协议） ❑ 适应性需求（外部执行环境瞬息万变） ❑ 开放世界的协同合作挑战 ❑ 复杂度随规模爆炸式增长 ❑ 高不确定性

35. 开放式协作的问题点与发展方向 ➢ 内部 ➢ 外部黑盒问题高速网络层多智能体上下文认知通信/交易协议通信-协作速度协作用工具/共享环境心智理论安全防护措施

36. OpenAgents – 为开放世界设计打造的网络层框架 https://github.com/openagents - org/openagents

37.

38. OpenAgents 架构 https://github.com/openagents - org/openagents

39. 06 总结

40. 总结与展望 LLM+多智能体企业应用开放世界协作：群体智能时代 LLM 带来了前所未有的变化。多智能建立端到端指标体系: 1/ 任务模拟面对未知任务与动态Agent加入，传统体系统无需训练，使用自然语言可以 2/ 成功率评价。在应用中降低协作开协作模式面临挑战。需要从workflow 完成行动，交互和反馈闭环。销。 engineering转变为ecosystem engineering。

41.

42. THANKS 大模型正在重新定义软件 Large Language Model Is Redefining The Software 论文投稿截止： 10/31 https://multiagents.org