CodeArts Doer 全流程多 Agent 协同，驱动研发全流程效能跃升

如果无法正常显示，请先停止浏览器的去广告插件。

相关话题： #AI Agent

1. CodeArts Doer 演讲人：侯凡 Agent

2. 侯凡 2010年加入华为华为云PaaS产品部前端开发团队Leader 华为云PaaS产品部首席前端架构 JavaScript语言标准组织ECMA TC39成员开源项目DEVUI负责人华为JavaScript语言可信认证组专家 / 前端AI专项组目前负责华为云PaaS产品部的整体前端架构设计、产品业务交付以及前端架构演进与看护工作。在前端AI代码实践、前端工程化、大型Web架构设计、前端性能优化、用户体验等领域有丰富的实践经验。

4. • Sequoia Capital AI Agent Economy • AI METR Agent 30s The Trillion-Dollar Opportunity Agents 7 2025 Agent 2022 coding ChatGPT 2029 coding 1

5. 人（Human）——决策与创造的中心工具（Tools）——专业化能力的延伸大模型（LLM）——认知与推理的基础设施 Agent——人与技术的“中介执行者”

6. 维度 AI-Native 大模型+Agent+工具任务类型开放域、非结构化问题封闭域、专业化任务结果可靠性低（依赖模型概率生成）高（工具验证结果）开发成本低（仅需Prompt工程）高（需工具集成与测试）可解释/追溯性差（黑箱生成）较强（工具链可追溯）长尾问题处理优（泛化能力强）劣（依赖工具覆盖度）

7. 传统软件开发流程提示驱动开发流程开发者接收需求开发者接收需求开发者审核Agent生成的代码开发者在本地IDE中迭代修改代码架构设计/技术选型/模块拆分/规则制定开发者提交所有变更进行审核开发者提交代码变更进行审核开发者将需求与设计分解为一系列提示另一位开发者审核并合并变更另一位开发者审核并合并变更 Agent生成代码敏捷开发下一个需求

8. 开发者启示 • Agent的局限性：环境感知不足、安全漏洞、性能问题、连锁bug、幻觉且固执、过度工程化、重复造轮子。一个仅仅靠 Agent 开发的系统，几乎是不可维护的！ • 开发者核心价值：批判性思维、准确定义问题，给 Agent 提供丰富的上下文、制定规则、小步迭代、人机协作/知道何时亲自动手。 • 最佳实践：Agile 版本迭代模式，每次做一个能稳定运行的完整版本，而不是一次性完成一个庞大无法维护的半成品。 Source: Andrew Miller

9. Single Agent Multiple Agents Cognition：单智能体上下文一致、架构简单、可靠性高 Anthropic：多智能体可并行化、突破上下文窗口限制、适合开放式复杂任务 CodeArts Doer Basic CodeArts Doer Pro CodeArts Doer Enterprise 开发者启示 • 多Agent -> 单Agent：所有 Agent 共享同一上下文（长对话）、Agent之间存在大量依赖关系的任务（编程），则需要合并为一个 Agent。 • 单Agent -> 多Agent：当可拆解为多个并行任务，或单 Agent 难以执行复杂指令、经常选择错误工具时，则需要进一步细分引入多 Agent。 • 生产落地实践：优先挖掘单 Agent 能力，做好上下文管理；开放式复杂任务逐步引入多 Agent，重点设计各 Agent 分工、优化提示词、并行工具调用、错误恢复机制、token管理等。

10. 核心竞争力端到端研发效率漏洞感知修复代码采纳率 • Agent接管研发工具，帮助每个角色工作“更快” 软件研发 70% 时间在非编码环节，智能化需覆盖全流程。7×24 小时智全链路协同动态自进化能协同贯穿需求、开发、测试、发布全流程，助力企业端到端研发效率自愈工作流高安全合规提升。团队助手 Committer 助手开发助手产品助手 • 测试助手项目助手沉淀总结项目知识，让每个Agent做得“更准” 大模型的幻觉最怕“说得漂亮、做得跑偏”。内置动态认知进化引擎。沉淀华为近百亿行编码实践，独创 ArchRAG 关联知识仓库与动机性遗忘机制，持续精炼项目知识，让代码生成更符合用户需求，AI生成代码开发 Req Board Repo IDE For Check IDE For IDE For IDE Python Java Online C/C++ 构建测试 Buil d Pipelin e SBOM 发布/部署 Defect TestPlan PerfTest APITest APIMock ATGen Deplo Artifac y t Release 采纳率持续提升！ • 多重安全防护，Agent自愈工作流，端到端交付“更稳” 线上问题修复成本是开发阶段数十倍。集成业界2倍深度安全防护机制，构筑全链路防线，叠加自愈工作流——任何 Agent 一旦发现问题，强大研发知识库近百亿行代码实践 CodeArts 智能助手先进记忆算法分级记忆机制 + 动机性遗忘机制即刻自主修复并自动回归验证，确保风险在进入生产环境前被精准拦截！

11. 从研发工具到研发队友，赋能研发各角色研发工具研发队友 Software as Tool 需求分析效率提升 CodeArts研发生产线产品管理系统设计开发构建测试时间占比15% 开源漏洞 Board Modeling Repo Check Build Defect TestPlan Governance SCA Deploy API IDE Online IDE For C/C++ Pipeline APIMock PerfTest Inspector 开源中心仓 Artifact CodeArts Doer IDE For Java SBOM IDE For Python ATGen APITest APPSec Release 编码效率提升问题修复效率提升时间占比30% 需求发布/部署更快 Req 软件研发效率提升 Software as Co-worker 开发时间占比15% 构建用例生成效率提升时间占比30% 测试运维效率提升时间占比10% 发布/部署工程师 Agents 产品经理 Agent 开发工程师 Agent 代码评审 Agent CodeArts Doer 构建工程师 Agent 测试工程师 Agent 运维工程师 Agent

12. 内置动态认知进化引擎，独创 ArchRAG 关联知识仓库与动机性遗忘机制，持续精炼项目知识，让Agent更懂项目分层规划拆解用户需求，确保研发目标精准落地代码采纳率自主学习创新管理动机性遗忘算法经验复盘多角色按流程验证，确保任务按要求完成开发验证组合管理解决方案开发路标开发洞察管理 CodeArts Doer 记忆宫殿-ArchRAG 代码纠错准确率产品 Agent 1.2亿代码仓/980PB战备资料 /470亿行实战代码打造基础模型知识沉淀测试行覆盖率开发产品&平台开发概念计划开发验证技术开发需求管理发布生命周期测试验证产品验收遇到编译、测试、检查问题，尝试不同解法项目Agent 服务产品开发代码检查解法1 失败解法2 失败解法N 对每个代码文件修改修进行PDCA循环，确保修改正确规划执行反思观察长期研究华为IPD流程开发 Agent 测试 Agent 成功

13. 研发实践沉淀，全流程无断点，端到端安全合规全流程无断点端到端安全合规 IDE 代码生成上线前业务逻辑问题拦截率提升 CodeArts Doer 需求管理规范代码续写需求设计规范代码编程规范代码入库门禁规范源代码管理规范流水线构建管理规封闭规范范更稳开发阶段计划需求阶段代码重构错误检查 • 需求智能总结 • 需求描述润色 • 需求设计需求分析 Story 设计设计文档生成 • 设计优化 • 运维阶段 • 自动生成合并请求 • 测试脚本生成 • 自动生成检视意见 • 测试用例生成 • 自动修复检视意见 • 测试日志分析编码任务自动分解分配任务分解 • 流水线软件包软件包软件包部署环境运行态运行规范管理规范部署规范防篡改规合规检查漏洞检查范检查代码合入编译构建 • 代码生成 • 工程自动生成 • 单元测试自动生 • 错误智能诊断设计生成代码 • • 成测试 • 部署脚本生 • 事件单关联成发布 • 部署错误定部署监控位 • 代码注释生成代码自动修复需求设计规范代码安全制品安全软件供应链安全数据安全软件包安全运行运维安全故障预测反馈

14. 人机协作产品管理工程师 AI助手 Team Leader Agent 开发审核优化需求描述生成创建 PLM Agent 需求开发构建审核合入补全修改 Dev Agent 构建修复检视修复 Committer agent 测试发布/部署问题审核审核发布执行构建 CIE Agent 节约70%工时节约50%工时节约40%工时节约40%工时节约55%工时脑图生成用例生成 Test Agent 审核调整部署发布 SRE Agent

15. CodeArts智能版 14万+ 4100万+ 40%+ 5万+ 62%+ 879万+ 研发人员使用采纳代码行代码接纳率采纳测试用例数量测试代码接纳率知识问答次数需求（开发） 10% 编码（开发） ①②③ 17% 检查&合入 ④ 11% 构建执行测试设计（测试） ⑤ 19% 分析 7% 问题发现 ⑥ 7% 问题定位 ⑥ 7% 其他活动 ⑦ 14% 识别7大价值场景，覆盖70%研发作业流，端到端提升30%研发效率 ReqMate 需求智能助手 DesignMate 设计智能助手 CodeMate 编码智能助手 TestMate 测试智能助手 DevMate：研发端到端智能助手（问答/公共调度） AI Copilot 模型微调提示词工程检索增强 + AI Agent 规划反思长短记忆研发大模型（多场景模型+多尺寸模型, 1300万经典技术文档+760亿行精选代码）工具调用

16. 1.5万亿 Token海量研发数据* 500亿 Token精品研发数据 *开源研发数据：8600万个代码仓、1500亿行代码、1300万篇技术博客 1套研发工具流水线 20多年ICT研发经验，研发工具链链沉淀华为研发元数据需求管理代码开发 Metadata.Req&Arch 建模元数据 3项规则基本法 1000+代码检查规则、100+准入门禁、5+编程语言Clean Code白皮书、 30+项工具清洗规则 2个自动化工具《华为研发大模型语料质量基本法V1.0》代码托管 CleanCode.info 编码规范代码检查编译构建 git.info 门禁 Build.info 构建CREATE 《华为研发大模型数据清洗基本法V1.0》自动化数据清洗平台自动化模型评测平台测试 Test.info 测试元数据发布 Security.info 红线/checklist/ICSL 部署与运维 Release.all.info 发布元数据《华为研发大模型评测基本法V1.0》

17. 知识碎片化，人工阅读查找答案效率低，数据孤岛、页面跳转多、数据获取不及时场景适配性差、稳定性不足、响应速度慢传统文档学习效率低作业界面指令直达知识精准获取知识问答分钟级-> 秒级多模型灵活切换多模型切换业务辅助查询作业路径缩短 20%+ 准确率提升 60%+

18. 需求量大，全局查找困难需求格式不规范，一句话需求多，需求分解依赖长期经验积累，需求内容质量不高上手门槛高，分解耗时长大模型加持的需求管理系统支持大型产品高效协作、高质量交付自然语言理解，精准查询需求查找步骤 7+ 次 1 次需求润色，内容增强写作效率提升 60% 需求分解，一键完成分解耗时小时级分钟级

19. 代码生成研发知识问答单元测试用例生成代码注释代码调试代码翻译代码解释代码检查

20. 项目架构复杂，动态依赖混乱人工审查效率低，依赖专家经验，修复耗时长，技术门槛高，维护难，管理成本高潜在风险难发现难以统一标准，易出错全局理解、代码解释一目了然智能代码审查，精准高效项目级跨文件理解，动态依赖关系可视化全维度质量守护，缺陷实时定位，风险即时阻断一键修复问题代码、精准智优智能合规调整，一键自动修复，无缝提升效能

21. 报告繁杂、详尽无遗、理解费时专业术语、难以理解、太技术化报告智能解读提纲挈领快速解读报告效率低下、编写复杂、工作量大问题智能修复问题智能解释一目了然加速找到问题症结一键修复修复效率提升 30%+

22. 需求内容多、关联项多、理解耗时场景多、经验少、覆盖不全测试意图智能分析需求理解天级-> 分钟级时间紧张、编写复杂、工作量大测试点智能生成测试覆盖覆盖度提升 20%+ 测试（文本）用例智能生成用例编写效率提升 80%+

23. 流水线繁琐，搭建耗时久言构流水，智简繁程 30+ 流水线模板精准匹配支持自然语言描述，搭建复杂流水线业务脚本复杂，编码门槛高问题定位困难，解决效率低降槛增效，易构速成智析故障，迅定乾坤智能生成 10+ 主流开发语言和脚本内置 5万+ 海量经典案例覆盖 1000+ 错误场景问题定位

24.

25. IDE MarketPlace Business Service WorkspaceX（工作空间管理、权限管理） Plugin Req Modeling Repo Check Build Artifact TestPlan Deploy Pipeline Plugins Extension s Agent （Cloud Side） AgentCenter SnapEngine （认证鉴权、请求路由、流量控制、License、敏感词/小语种过滤、OpenAPI、运营打点、Session管理） Tool Center 业务Agents Teamleader Agent （Agent元数据、Agent注册信息） CodeAgent ChatAgent Req业务 Agents Repo业务 Agents Check业务 Agents (OpenAPI、Widget、 Function Call、 Sandbox、 MCP Server、Web Search、知识检索等） Memory Service （短期记忆&记忆摘要、长期记忆Profile）数据开发服务数据生产线模型运行 Prompt Center Knowledge Repo Inference Service （多Agents/Tools检索、租户/用户级鉴权）（模型注册&管理、3 rd 模型 API/ckpt）

26. Agent : 1 一键生成脚手架代码 Multi-Agent Multi-Agent 协同协同 2 重载AI原子能力 A2A通信 3 重载推理模式协作策略引擎 4 设计人设Prompt 知识共享状态同步 By Order模式 React模式 5 构建知识库 6 设置工具列表任务分解与协同 Plan & Act模式 7 注册/发布Agent 资源访问控制 Plan & React模式 Agent 推理模式 3 工作模式编排 AI原子 AI 原子能力能力 2 Agent Center 7 任务规划 Plan 任务执行 Act 慢思考 Think 反思 Reflection 反应式行动 React 记忆管理 Memory DDD建模 + 代码生成 DevSpore Data 1 DataSource(+MAS) SpringCloud Huawei Discovery SpringBoot Huawei 基础依赖及漏洞管理 26 DCS(+MAS) Auth Spring DDS(+MAS) Probe I18n Spring Framework Spring Boot AI 生态协议 AI生态协议 CSS(+MAS) Config DMS OLC Storage ClientControl HttpLog Junit CIC Jackson Swagger + doc jacoco Huawei Proprietary - Restricted Distribution 环境感知 Observe Security Mock 4 5 知识管理 Prompt 管理 6 MCP 接口信息共享 LLM 接口 A2A 接口 Google Guava Slf4j + Log4j Knowledge Repo Prompt Center Tools Memory Service LLM推理服务 Other Agents

27. 挑战一：前后端开发范式变化前端由确定性页面交互变为模型数据驱动交互，页面交互需要根据模型行为动态适配响应。构建前端AI交互范式和前端智能化交互框架，基于Agent ID交互差异和共通特性，构建了基于消息驱动的多Agent交互架构。挑战二：智能化场景多，多个团队同步开发和部署构建统一的Agent SDK开发框架和统一的运行底座Agent Runner，，基于SSE打造长连接联动能力，为各业务agent提供原子能力及统一的运行托管，使能业务Agent快速创新、迭代开发和高效部署运行挑战三：多agent场景长上下文统一记忆挑战四：多agent交互场景复杂构建公共的Memory Service服务提供短期记忆、记忆摘要、长期记忆profile等能力，满足多角色Agent会话历史共享和记忆提取，并高效支持Codearts Doer时光机、思维链、回退等高级特性引入业界最新主流协议A2A协议和MCP协议构建多agent协作机制和工具集成能力，基于SSE打造长连接联动能力，配置不同阶段超时策略支持探活、保活、多活、前端连接通道共享等能力，解决agent断链、前后端配合、消息延迟问题等40+多Agent交互场景特有的稳定性问题

28. 类别后续演进方向展望 ①大模型能力、性能成本 1. 2. 3. 4. 大小模型协同；引入业界SOTA模型；多模态；优化推理性能、解决并发问题；扩大上下文窗口；通过压缩上下文窗口解决受限问题 ②Agent安全、大模型安全 1. Agent护栏； 2. 引入业界大模型内容安全； 3. 意图识别，研发领域隔离 ③Agent生态接入 1. 内外部业界Agent的接入，构建Agent生态； ④Agent效果评测 1. 对Agent任务执行效果进行有效测评，包括任务成功率、运行时长、Token消耗等，并支持大模型的强化学习 ⑤华为软件工程经验提炼和沉淀 1. 将华为多年积累的软件工程经验更好的提炼和注入到各业务角色Agent，提升产品能力和竞争力 ⑥MCP工具生态 1. 内外部MCP服务的接入，构建生态； 2. 构建轻量化沙箱（含代码解释器）、Web Search、知识检索、Computer use等内置工具 ⑦多Agent并行工作 1. 支持多Agent并行工作，前端支持多Agent并行交互； 2. 端云Agent协同 ⑧Agent长短期记忆 1. 长期记忆、短期纪要摘要、记忆提取 2. 上下文压缩、情景隔离

29. AI 能力维度具体表现 AI依赖度架构与领域知识指导AI，并在AI方案中选择最优解，并将业务转化为机器可理解的概念中提示工程如何提问精确控制AI输出质量高价值判断对AI的方案进行判断与决策，并在必要的时候能够接管低风险评估确保AI方案的可解释、可追溯识别AI方案中的各种潜在危害低人机协作管理与Agent协同，并分配任务给AI代理并监督高

30.

31.