CodeArts Doer 全流程多 Agent 协同,驱动研发全流程效能跃升

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1. CodeArts Doer 演讲人:侯凡 Agent
2. 侯凡 2010年加入华为 华为云PaaS产品部前端开发团队Leader 华为云PaaS产品部首席前端架构 JavaScript语言标准组织ECMA TC39成员 开源项目DEVUI负责人 华为JavaScript语言可信认证组专家 / 前端AI专项组 目前负责华为云PaaS产品部的整体前端架构设计、产品业务交付以及前端架构演进与看护工作。 在前端AI代码实践、前端工程化、大型Web架构设计、前端性能优化、用户体验等领域有丰富的 实践经验。
3.
4. • Sequoia Capital AI Agent Economy • AI METR Agent 30s The Trillion-Dollar Opportunity Agents 7 2025 Agent 2022 coding ChatGPT 2029 coding 1
5. 人(Human)——决策与创造的中心 工具(Tools)——专业化能力的延伸 大模型(LLM)——认知与推理的基础设施 Agent——人与技术的“中介执行者”
6. 维度 AI-Native 大模型+Agent+工具 任务类型 开放域、非结构化问题 封闭域、专业化任务 结果可靠性 低(依赖模型概率生成) 高(工具验证结果) 开发成本 低(仅需Prompt工程) 高(需工具集成与测试) 可解释/追溯性 差(黑箱生成) 较强(工具链可追溯) 长尾问题处理 优(泛化能力强) 劣(依赖工具覆盖度)
7. 传统软件开发流程 提示驱动开发流程 开发者接收需求 开发者接收需求 开发者审核Agent生成的代码 开发者在本地IDE中迭代修改代码 架构设计/技术选型/模块拆分/规则制定 开发者提交所有变更进行审核 开发者提交代码变更进行审核 开发者将需求与设计分解为一系列提示 另一位开发者审核并合并变更 另一位开发者审核并合并变更 Agent生成代码 敏捷开发下一个需求
8. 开发者启示 • Agent的局限性:环境感知不足、安全漏洞、性能问题、连锁bug、幻觉且固执、过度工程化、重复造轮子。一个仅仅靠 Agent 开发的系统,几乎是不可维护的! • 开发者核心价值:批判性思维、准确定义问题,给 Agent 提供丰富的上下文、制定规则、小步迭代、人机协作/知道何时亲自动手。 • 最佳实践:Agile 版本迭代模式,每次做一个能稳定运行的完整版本,而不是一次性完成一个庞大无法维护的半成品。 Source: Andrew Miller
9. Single Agent Multiple Agents Cognition:单智能体上下文一致、架构简单、可靠性高 Anthropic:多智能体可并行化、突破上下文窗口限制、适合开放式复杂任务 CodeArts Doer Basic CodeArts Doer Pro CodeArts Doer Enterprise 开发者启示 • 多Agent -> 单Agent:所有 Agent 共享同一上下文(长对话)、Agent之间存在大量依赖关系的任务(编程),则需要合并为一个 Agent。 • 单Agent -> 多Agent:当可拆解为多个并行任务,或单 Agent 难以执行复杂指令、经常选择错误工具时,则需要进一步细分引入多 Agent。 • 生产落地实践:优先挖掘单 Agent 能力,做好上下文管理;开放式复杂任务逐步引入多 Agent,重点设计各 Agent 分工、优化提示词、并行工具调用、错误恢复机制、token管 理等。
10. 核心竞争力 端到端研发效率 漏洞感知修复 代码采纳率 • Agent接管研发工具,帮助每个角色工作“更快” 软件研发 70% 时间在非编码环节,智能化需覆盖全流程。7×24 小时智 全链路 协同 动态 自进化 能协同贯穿需求、开发、测试、发布全流程,助力企业端到端研发效率 自愈 工作流 高安全 合规 提升 。 团队助手 Committer 助 手 开发助手 产品助手 • 测试助手 项目助手 沉淀总结项目知识,让每个Agent做得“更准” 大模型的幻觉最怕“说得漂亮、做得跑偏”。内置动态认知进化引擎。 沉淀华为近百亿行编码实践,独创 ArchRAG 关联知识仓库与动机性遗 忘机制,持续精炼项目知识,让代码生成更符合用户需求,AI生成代码 开发 Req Board Repo IDE For Check IDE For IDE For IDE Python Java Online C/C++ 构建 测试 Buil d Pipelin e SBOM 发布/部 署 Defect TestPlan PerfTest APITest APIMock ATGen Deplo Artifac y t Release 采纳率持续提升! • 多重安全防护,Agent自愈工作流,端到端交付“更稳” 线上问题修复成本是开发阶段数十倍。集成业界2倍深度安全防护机制 ,构筑全链路防线,叠加自愈工作流——任何 Agent 一旦发现问题, 强大研发知识库 近百亿行代码实践 CodeArts 智能助手 先进记忆算法 分级记忆机制 + 动机性遗忘机 制 即刻自主修复并自动回归验证,确保风险在进入生产环境前被精准拦截 !
11. 从研发工具到研发队友,赋能研发各角色 研发工具 研发队友 Software as Tool 需求分析效率提升 CodeArts研发生产线 产品管理 系统设计 开发 构建 测试 时间占比15% 开源漏洞 Board Modeling Repo Check Build Defect TestPlan Governance SCA Deploy API IDE Online IDE For C/C++ Pipeline APIMock PerfTest Inspector 开源中心仓 Artifact CodeArts Doer IDE For Java SBOM IDE For Python ATGen APITest APPSec Release 编码效率提升 问题修复效率提升 时间占比30% 需求 发布/部署 更快 Req 软件研发效率提升 Software as Co-worker 开发 时间占比15% 构建 用例生成效率提升 时间占比30% 测试 运维效率提升 时间占比10% 发布/部署 工程师 Agents 产品经理 Agent 开发工程师 Agent 代码评审 Agent CodeArts Doer 构建工程师 Agent 测试工程师 Agent 运维工程师 Agent
12. 内置动态认知进化引擎,独创 ArchRAG 关联知识仓库与动机性遗忘机制,持续精炼项目知识,让Agent更懂项目 分层规划拆解用户需求,确保研发目标精准落地 代码采纳率 自主 学习 创 新 管 理 动机性遗忘算法 经验 复盘 多角色按流程验证,确保任务按要求完成 开发验证 组合管理 解决方案 开发 路 标 开 发 洞 察 管 理 CodeArts Doer 记忆宫殿-ArchRAG 代码纠错准确率 产品 Agent 1.2亿代码仓/980PB战备资料 /470亿行实战代码打造基础模型 知识 沉淀 测试行覆盖率 开 发 产品&平台开 发 概 念 计 划 开 发 验 证 技术开发 需 求 管 理 发 布 生 命 周 期 测试验证 产品验收 遇到编译、测试、检查问题,尝试不同解法 项目Agent 服务产品 开发 代码检查 解法1 失败 解法2 失败 解法N 对每个代码文件修改修进行PDCA循环,确保修改正确 规划 执行 反思 观察 长期研究 华为IPD流程 开发 Agent 测试 Agent 成功
13. 研发实践沉淀,全流程无断点,端到端安全合规 全流程无断点 端到端安全合规 IDE 代码生成 上线前业务逻辑问题拦截率提升 CodeArts Doer 需求 管理规范 代码续写 需求 设计规范 代码 编程规范 代码入库 门禁规范 源代码 管理规范 流水线 构建 管理规 封闭规范 范 更稳 开发阶段 计划需求阶段 代码重构 错误检查 • 需求智能总结 • 需求描述润色 • 需求 设计 需求 分析 Story 设计 设计文档生成 • 设计优化 • 运维阶段 • 自动生成合并请求 • 测试脚本生成 • 自动生成检视意见 • 测试用例生成 • 自动修复检视意见 • 测试日志分析 编码 任务自动分解分配 任务 分解 • 流水线 软件包 软件包 软件包 部署环境 运行态 运行规范 管理规范 部署规范 防篡改规 合规检查 漏洞检查 范检查 代码 合入 编译 构建 • 代码生成 • 工程自动生成 • 单元测试自动生 • 错误智能诊断 设计生成代码 • • 成 测试 • 部署脚本生 • 事件单关联 成 发布 • 部署错误定 部署 监控 位 • 代码注释生成 代码自动修复 需求设计规范 代码安全 制品安全 软件供应链安全 数据安全 软件包安全 运行运维安全 故障预测 反馈
14. 人机协作 产品管理 工程师 AI助手 Team Leader Agent 开发 审 核 优 化 需 求 描 述 生 成 创 建 PLM Agent 需 求 开 发 构建 审 核 合 入 补 全 修 改 Dev Agent 构 建 修 复 检 视 修 复 Committer agent 测试 发布/部署 问 题 审 核 审 核 发 布 执 行 构 建 CIE Agent 节约70%工时 节约50%工时 节约40%工时 节约40%工时 节约55%工时 脑 图 生 成 用 例 生 成 Test Agent 审 核 调 整 部 署 发 布 SRE Agent
15. CodeArts智能版 14万+ 4100万+ 40%+ 5万+ 62%+ 879万+ 研发人员使用 采纳代码行 代码接纳率 采纳测试用例数量 测试代码接纳率 知识问答次数 需求(开发) 10% 编码(开发) ①②③ 17% 检查&合入 ④ 11% 构 建 执 行 测试设计(测试) ⑤ 19% 分析 7% 问题发现 ⑥ 7% 问题定位 ⑥ 7% 其他活动 ⑦ 14% 识别7大价值场景,覆盖70%研发作业流,端到端提升30%研发效率 ReqMate 需求智能助手 DesignMate 设计智能助手 CodeMate 编码智能助手 TestMate 测试智能助手 DevMate:研发端到端智能助手(问答/公共调度) AI Copilot 模型微调 提示词工程 检索增强 + AI Agent 规划反思 长短记忆 研发大模型(多场景模型+多尺寸模型, 1300万经典技术文档+760亿行精选代码) 工具调用
16. 1.5万亿 Token海量研发数据* 500亿 Token精品研发数据 *开源研发数据:8600万个代码仓、1500亿行代码、1300万篇技术博客 1套 研发工具 流水线 20多年ICT研发经验,研发工具链 链 沉淀华为研发元数据 需求管理 代码开发 Metadata.Req&Arch 建模元数据 3项 规则基本法 1000+代码检查规则、100+准入门 禁、5+编程语言Clean Code白皮书、 30+项工具清洗规则 2个 自动化工具 《华为研发大模型语 料质量基本法V1.0》 代码托管 CleanCode.info 编码规范 代码检查 编译构建 git.info 门禁 Build.info 构建CREATE 《华为研发大模型数 据清洗基本法V1.0》 自动化数据清洗平台 自动化模型评测平台 测试 Test.info 测试元数据 发布 Security.info 红线/checklist/ICSL 部署与运维 Release.all.info 发布元数据 《华为研发大模型 评测基本法V1.0》
17. 知识碎片化,人工阅读查找答案效率低, 数据孤岛、页面跳转多、数据获取不及时 场景适配性差、稳定性不足、响应速度慢 传统文档学习效率低 作业界面指令直达 知识精准获取 知识问答 分钟级-> 秒级 多模型灵活切换 多模型切换 业务辅助查询 作业路径缩短 20%+ 准确率提升 60%+
18. 需求量大,全局查找困难 需求格式不规范,一句话需求多, 需求分解依赖长期经验积累, 需求内容质量不高 上手门槛高,分解耗时长 大模型加持的需求管理系统支持大型产品高效协作、高质量交付 自然语言理解,精准查询需求 查找步骤 7+ 次 1 次 需求润色,内容增强 写作效率 提升 60% 需求分解,一键完成 分解耗时 小时 级 分钟 级
19. 代码生成 研发知识问答 单元测试用例生成 代码注释 代码调试 代码翻译 代码解释 代码检查
20. 项目架构复杂,动态依赖混乱 人工审查效率低,依赖专家经验, 修复耗时长,技术门槛高, 维护难,管理成本高 潜在风险难发现 难以统一标准,易出错 全局理解、代码解释一目了然 智能代码审查,精准高效 项目级跨文件理解,动态依赖关系可视化 全维度质量守护,缺陷实时定位,风险即时阻断 一键修复问题代码、精准智优 智能合规调整,一键自动修复,无缝提升效能
21. 报告繁杂、详尽无遗、理解费时 专业术语、难以理解、太技术化 报告智能解读 提纲挈领 快速解读报告 效率低下、编写复杂、工作量大 问题智能修复 问题智能解释 一目了然 加速找到问题症结 一键修复 修复效率提升 30%+
22. 需求内容多、关联项多、理解耗时 场景多、经验少、覆盖不全 测试意图智能分析 需求理解 天级-> 分钟级 时间紧张、编写复杂、工作量大 测试点智能生成 测试覆盖 覆盖度提升 20%+ 测试(文本)用例智能生成 用例编写 效率提升 80%+
23. 流水线繁琐,搭建耗时久 言构流水,智简繁程 30+ 流水线模板精准匹配 支持 自然语言 描述,搭建复杂流水线 业务脚本复杂,编码门槛高 问题定位困难,解决效率低 降槛增效,易构速成 智析故障,迅定乾坤 智能生成 10+ 主流开发语言和脚本 内置 5万+ 海量经典案例 覆盖 1000+ 错误场景问题定位
24.
25. IDE MarketPlace Business Service WorkspaceX(工作空间管理、权限管理) Plugin Req Modeling Repo Check Build Artifact TestPlan Deploy Pipeline Plugins Extension s Agent (Cloud Side) AgentCenter SnapEngine (认证鉴权、请求路由、流量控制、License、敏感词/小语种过滤、OpenAPI、运营打点、Session管理) Tool Center 业务Agents Teamleader Agent (Agent元数据、Agent注 册信息) CodeAgent ChatAgent Req业务 Agents Repo业务 Agents Check业务 Agents (OpenAPI、Widget、 Function Call、 Sandbox、 MCP Server、Web Search、知识检索等) Memory Service (短期记忆&记忆摘要、长期记忆Profile) 数据开发服务 数据生产线 模型运行 Prompt Center Knowledge Repo Inference Service (多Agents/Tools检索、租户/用户 级鉴权) (模型注册&管理、3 rd 模型 API/ckpt)
26. Agent : 1 一键生成脚手架代码 Multi-Agent Multi-Agent 协同 协同 2 重载AI原子能力 A2A通信 3 重载推理模式 协作策略引擎 4 设计人设Prompt 知识共享 状态同步 By Order模式 React模式 5 构建知识库 6 设置工具列表 任务分解与协同 Plan & Act模式 7 注册/发布Agent 资源访问控制 Plan & React模式 Agent 推理模式 3 工作模式 编排 AI原子 AI 原子能力 能力 2 Agent Center 7 任务规划 Plan 任务执行 Act 慢思考 Think 反思 Reflection 反应式行动 React 记忆管理 Memory DDD建模 + 代码生成 DevSpore Data 1 DataSource(+MAS) SpringCloud Huawei Discovery SpringBoot Huawei 基础依赖及漏洞管理 26 DCS(+MAS) Auth Spring DDS(+MAS) Probe I18n Spring Framework Spring Boot AI 生态协议 AI生态协议 CSS(+MAS) Config DMS OLC Storage ClientControl HttpLog Junit CIC Jackson Swagger + doc jacoco Huawei Proprietary - Restricted Distribution 环境感知 Observe Security Mock 4 5 知识 管理 Prompt 管理 6 MCP 接口 信息 共享 LLM 接口 A2A 接口 Google Guava Slf4j + Log4j Knowledge Repo Prompt Center Tools Memory Service LLM推理服务 Other Agents
27. 挑战一:前后端开发范式变化 前端由确定性页面交互变为模型数据驱动交互,页面交 互需要根据模型行为动态适配响应。构建前端AI交互范 式和前端智能化交互框架,基于Agent ID交互差异和共 通特性,构建了基于消息驱动的多Agent交互架构。 挑战二:智能化场景多,多个团队同步开发和部署 构建统一的Agent SDK开发框架和统一的运行底座Agent Runner,,基于SSE打造长连接联动能力,为各业务agent提 供原子能力及统一的运行托管,使能业务Agent快速创新、迭 代开发和高效部署运行 挑战三:多agent场景长上下文统一记忆 挑战四:多agent交互场景复杂 构建公共的Memory Service服务提供短期记忆、记忆摘 要、长期记忆profile等能力,满足多角色Agent会话历史 共享和记忆提取,并高效支持Codearts Doer时光机、思 维链、回退等高级特性 引入业界最新主流协议A2A协议和MCP协议构建多agent协作机 制和工具集成能力,基于SSE打造长连接联动能力,配置不同阶 段超时策略支持探活、保活、多活、前端连接通道共享等能力, 解决agent断链、前后端配合、消息延迟问题等40+多Agent交 互场景特有的稳定性问题
28. 类别 后续演进方向展望 ①大模型能力、性能成本 1. 2. 3. 4. 大小模型协同;引入业界SOTA模型;多模态; 优化推理性能、解决并发问题; 扩大上下文窗口; 通过压缩上下文窗口解决受限问题 ②Agent安全、大模型安全 1. Agent护栏; 2. 引入业界大模型内容安全; 3. 意图识别,研发领域隔离 ③Agent生态接入 1. 内外部业界Agent的接入,构建Agent生态; ④Agent效果评测 1. 对Agent任务执行效果进行有效测评,包括任务成功率、运行时长、Token消耗等,并支持大模型的强化学习 ⑤华为软件工程经验提炼和沉淀 1. 将华为多年积累的软件工程经验更好的提炼和注入到各业务角色Agent,提升产品能力和竞争力 ⑥MCP工具生态 1. 内外部MCP服务的接入,构建生态; 2. 构建轻量化沙箱(含代码解释器)、Web Search、知识检索、Computer use等内置工具 ⑦多Agent并行工作 1. 支持多Agent并行工作,前端支持多Agent并行交互; 2. 端云Agent协同 ⑧Agent长短期记忆 1. 长期记忆、短期纪要摘要、记忆提取 2. 上下文压缩、情景隔离
29. AI 能力维度 具体表现 AI依赖度 架构与领域知识 指导AI,并在AI方案中选择最优解, 并将业务转化为机器可理解的概念 中 提示工程 如何提问 精确控制AI输出质量 高 价值判断 对AI的方案进行判断与决策,并在 必要的时候能够接管 低 风险评估 确保AI方案的可解释、可追溯 识别AI方案中的各种潜在危害 低 人机协作管理 与Agent协同,并分配任务给AI代理 并监督 高
30.
31.

首页 - Wiki
Copyright © 2011-2025 iteam. Current version is 2.146.0. UTC+08:00, 2025-10-22 16:57
浙ICP备14020137号-1 $访客地图$