阿里云客户服务领域Agent在业务提效上的思考与创新实践

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1. 阿里云客户服务领域Agent在业务 提效上的思考与创新实践 演讲人:姜剑(飞樰) 阿里云 / 算法专家
2. 个人简介 姜剑(飞樰) 阿里云 算法专家 负责阿里云服务领域 Agent 智能体平台的算法架构设计。曾负 责阿里云智能客服机器人整体算法架构设计、服务领域大模型训 练、对话机器人链路体系的构建等。在阿里云服务领域深耕7年,逐 步建设起了阿里云服务领域的算法技术体系,曾主导构建了云计算 服务领域的问答系统、知识图谱、推荐系统等。曾多次在行业技术 会议中做 LLM、Agent 等相关技术分享。
3. Agent的技术本质与常见模式 01 Agent给客户服务领域带来的价值增益 目录 02 阿里云服务领域的业务背景与挑战 03 阿里云服务领域Agent的设计方法论 04 阿里云服务领域Agent平台的设计与落地 05
4. Agent的技术本质与常见模式
5. Agent的技术本质 Agent本质上是让大模型“代理”「人」的行为,使用某些“工具”来完成某些“任务”的能力 词典中Agent的释义 Agent的组成 (来源:有道词典) (来源:The Rise and Potential of Large Language Model Based Agents: A Survey)
6. Agent常见模式 LLM自主规划类 Start Planning Action Observation Workflow预编排类 灵活性:高(动态适应) 灵活性:低(预定义流程) 可控性:低(黑盒决策) 可控性:高(透明流程) 容错率:高(参考为主) 容错率:低(稳定为主) 开发成本:低(模型驱动) 开发成本:高(需人工编排) 模型要求:高(强推理能力) 模型要求:低(符合需求即可) 适用场景:探索化场景、复杂问题 适用场景:标准化场景、重复任务 Start Step 1 Step 2 Branch 1 Branch 2 ... Final Answer Step N Finish Finish
7. Multi-Agent常见模式 Multi-Agent本质上是让多个Agent “代理”「一群人」的行为,其中每个Agent可以“各司其职”完成某类“任务” 转交模式(Handoff) 嵌套模式(Nested) 主代理模式(Master) Agent 1 Agent 1 子Agent 1 群聊模式(Group Chat) User Task Agent 1 Agent 2 Agent 2 Agent 3 Agent 3 主Agent 子Agent 2 子Agent 3 Agent 2 Agent 3
8. Agent给客户服务领域带来的 价值增益
9. Agent带来服务需求研发范式的变革 Agent技术可以在满足服务领域各类场景服务要求的同时,又能降低开发成本,实现“人人都是开发者”
10. Agent简化复杂业务流程 服务领域许多处理流程,传统方式要进行复杂代码编排或变量转换,Agent可以通过大模型能力简化处理流程 传统编排 API Tools 调用流程 大模型 API Tools 调用流程 输入参数 输入参数 转换 API 入参 调用 API 大模型调用API 解析 API 大模型输出结果 输出结果
11. Agent交互方式多样性 纯LUI交互的大模型对话体验其实并不都是太友好,结合GUI交互的Agent的可读性和体验会好很多 LUI交互的Agent GUI交互的Agent (案例来源:Microsoft Blogs. New Autonomous Agents Scale Your Team Like Never Before)
12. 阿里云服务领域的业务背景与挑战
13. 阿里云服务领域业务背景介绍 阿里云客户服务过程中主要的智能化场景包括: • 智能问答:以通义千问大模型为底座,结合服务领域知识面向公共云客户提供大模型智能对话机器人服务,提 升客户快速自助解决问题能力,降低服务成本 • 智能调度:通过产品及场景智能识别,精准理解客户意图,为工单精准调度提供支持,协助提升工单一次性解 决率 • 智能辅助:通过统一搜索、智能对话、工具等多种手段为一线客服提供智能辅助Copilot服务,深度集成客服业 务流程,协助客服提升工单解决效率
14. 阿里云服务领域问题的特性 问题维度 产品维度 阿里云多数产品是技术属性较强的产品,例 如: • 弹性计算:ECS、轻量服务器、弹性裸金 属服务器 • 人工智能、大数据:百炼大模型平台、 PAI人工智能平台、 MaxCompute • 存储、网络:块存储、OSS对象存储、负 载均衡、网关、专有网络 • 容器:ACK容器、弹性容器实例ECI • 更多:云安全、物联网、域名、邮箱等... 意图表达 根据问题属性主要分为以下两种情况: 从意图表达层面,分以下几种情况: • 咨询类: • 意图清晰、聚焦:比如“ECS无法远程 比如“订单查询、开发票、退款”等常 见的财务类问题;“ECS是否支持 VPC、通义千问支持多模态吗”这类的 产品特性、功能特性相关的问题 • 技术类: 如 “ECS服务器无法远程连接、调用 API报错出现InvalidParameter”等技 术属性较强的问题,通常需要深入诊 断和排查 连接”、“域名实名认证失败”等直接描 述了问题的核心、关键内 • 意图复杂:有较多的报错log或者细节 描述,没有直接描述核心、有效的重 点,有许多干扰信息 • 意图模糊:比如“认证问题”、“连接不 上”,产品信息、核心要素都有所缺 失,导致意图模糊、不完整,存在歧义
15. 阿里云服务领域场景的业务痛点 痛点一 痛点二 痛点三 云计算技术复杂性高 需求研发效率低 个性化需求较多 场景复杂:不同于其它客户服 工具需求多:云产品种类、细 个性化流程:在技术复杂的场 务领域,除了FAQ式问题,云 分场景较多,目前客服辅助或 景下,不同的售后工程师在排 计算领域问题很多是复杂场景 客户自助解决问题都需要依赖 查问题、解决问题的过程中会 大量的服务诊断工具 产生很多个性化的诊断流程, 诊断复杂:需要通过多轮次对 但是研发团队很难定制开发 话、各种诊断工具查询用户的 研发成本高:这导致工具需求 产品状态、 诊断出现的问题根 研发成本较高、研发效率相对 领域经验沉淀:同时这些领域 因,才能制定出对应问题的解 低,大量需求无法及时快速开 经验存放在各处,很难系统化 决方案 发跟进 的沉淀或赋能他人
16. 阿里云服务领域Agent的 设计方法论
17. 应用Agent的过程中你是否遇到过这些挑战? 挑战一:运行效果问题 • 提示词难书写、调整 构建 规划 • Agent运行不稳定 挑战二:规划如何平衡 • 自主规划的流程不符合预期 • Workflow的编排复杂度太高 Agent 落地问题 挑战三:领域信息集成 • 领域先验知识如何注入 • 领域特定流程如何遵循 领域 性能 挑战四:Agent响应速度 • 大参数的模型生成慢 • 小参数模型效果不佳
18. 让提示词更稳定的运行 从定义结构化提示词模板,再到AI辅助生成提示词,都在致力于让提示词运行更稳定 直接写提示词 结构化提示词模板 AI辅助生成提示词 ## 角色 请你帮我排查某用户服务器端口不通问题的具 体原因,调用端口工具来回答问题 你是____任务专家,你能够专业的完成____相关的任务 我需要根据实例ID查询端口不通... ## 任务要求 1.此____任务的目标是为了完成____的处理 你需要输出哪些关键信息? 2.请根据用户问题,调用____工具来完成____信息的查询 3. 完成工具调用后,请寻找可以回答用户问题的答案总结出来 提示词容易出现的问题: ## 输出格式 • 提示词过短,任务要求主体不明、表意 ... 不明、模糊不清 • 提示词过长,注意力失焦、重点遗忘 • 提示词中存在歧义、冲突、矛盾等情况 我需要这些信息 ..... 输出格式请以JSON形式输出,具体格式是: 好的,提示词已经帮您优化好: ## 约束条件 请遵循工具的参数格式进行调用,按照工具实际的返回结果总结答案 ## 示例 ... ## 角色 你是端口诊断任务专家...
19. Workflow编排与LLM自主规划的权衡 Workflow编排和LLM自主规划,在可控性与智能化的坐标轴上所处位置 高 Workflow编排 (标准化场景) 可控性 LLM自主规划 (探索化场景) 低 智能化 高 (参考来源:How To Think About Agent Frameworks)
20. 标准化场景:稳定可控 标准化、重复性、容错率低的服务场景,非常适合Workflow,LLM可作为内部环节,完成某一步任务 订单财务类场景 排班通知类场景 输入订单信息 读取客服完整排班表格 查询订单到期时间 查询当前时间 判断 到期时间 > 今天? 抽取当前时段的排班 是 否 有效期内 已经到期 可退订部分费用 费用不可退订 是否存在排班 通过钉钉API发送通知 计算可退定金额 无需发送排班通知 输出相关结论 注:演示示例,非真实业务数据
21. 探索化场景:灵活自主 探索化、解决方案未知、复杂性高的服务场景,非常适合LLM自主规划 RDS实例异常诊断 Agentic RAG 检查会话连接数 生成搜索Query 检查QPS请求 搜索文档 检查CPU内存 检查搜索出结果 检查慢SQL日志 判断是否符合要求 分析各方面可能的原因 整理最终答案 最终给出解决方案 注:演示示例,非真实业务数据
22. Multi-Agent模式:灵活自主+稳定可控 根据问题描述和输入参数,LLM灵活选择诊断流程,诊断流程通过Workflow可控查询 邮箱无法收发信诊断 用户描述邮箱无法发信的情形,会给出域名、账号、报错内容 输入邮箱账号 输入邮箱域名 输入报错内容 查询邮箱账号状态 MX解析诊断 查询报错原因 是否正常 是 查看订单是否到期 TXT解析诊断 给出报错解决方案 否 账号冻结等 CNAME解析诊断 根据查询情况,决策是否输出最终解决方案或继续查询 注:演示示例,非真实业务数据
23. Workflow落地探索演进过程 在Workflow落地的过程中,我们探索过多种不同类型的编排方式和执行过程 Start Function Call Start LLM Text Condition Branch 1 Output 规则引擎 Branch 1 ... LLM Finish 自然语言编排 + LLM驱动按步执行 Branch 1 Branch 2 ... LLM Generate Function Call Text Condition Code Condition Branch 2 ... Code / Function Start ... 规则引擎 Finish 代码/LLM混编 + 规则驱动按步执行 Branch 2 LLM ... Output Finish 自然语言编排 + LLM自主规划执行
24. 领域数据集成与响应速度优化 领域数据集成 • Prompt中动态领域要求 根据服务场景匹配度,在 Prompt加载的过程中动态引入领域先验知识 • 引入外部技能 通过调用领域工具、知识库、文档 等,让LLM有更多方式自主选择获取领域数据 • 领域大模型训练 将领域知识通过模型训练的方式注 入到大模型中,从根本上提高领域任务的精准性 响应速度优化 • 代码参数预转换 多使用流程预编译好的Workflow,将非 必要的LLM模块转换为代码或脚本语言,提高运行效率 • 各种推理加速方式 模型量化、优化KV Cache、使用各 种加速框架、更换高性能GPU等 • 降低模型参数量 在满足需求的前提下选用小参数模型, 针对Function Call、高频任务要做SFT/RL
25. 领域Agent大模型的训练 训练阶段 执行阶段 大模型调优 规划能力 领域Agent语料 领域数据源 数据处理 SFT/RL 工具调用 单步工具调用 领域知识 / 文档 汇总 多步工具调用 清洗 参数反问澄清 Agent评估 子Agent调用 工具选择准确率 条件判断 领域 SOP API 动作执行准确率 领域 MCP Tools 构造/合成 Multi-Agent调用 参数提取准确率 阿里云 OpenAPI 条件判断/场景拒识 步骤规划 生成效果评估 动作执行 观察反思 回答生成
26. 优化提升Agent效果的路径 模型调优 • 确定优化任务 高 • 构造任务数据 Multi-Agent构造 • SFT / RL • 子Agent设计 • Agent协同模式 Agent 运行 效果 • 端到端测试 规划分解 • 构造Workflow • 可控性要求 原型构建 • 运行速度要求 • LLM自主决策 • 提示词工程 • AI辅助调优 低 Agent优化成本 高
27. 阿里云服务领域Agent平台的 设计与落地
28. 业务场景对服务领域Agent平台提出了更高要求 新的云服务领域需求开发范式,对平台易用性和产品可用性都要求较高 高 产品 可用性 传统代码开发 AI生成式构建Agent 最灵活,但需有编程门槛 AI引导开发、调优更简单 手动构建Agent 门槛低,但调优真的很难 低 平台易用性 高
29. 服务领域Agent平台需要承载的能力 聚焦领域问题解决 降低门槛、效率优先 领域经验沉淀与共享 • 聚焦在解决“云计算服务 • 以尽 可 能 低 成 本 、 无 代 • 领域经验沉淀与版本管理 领域”的痛点问题 码的模式来构建Agent • 依托领域数据和平台 • AI引导式生成开发需求 • 支撑服务领域各类模式 • 持续优化各功能点耗时 • 领域经验可内部共享 • 领域能力之间相互赋能 阿里云服务领域Agent智能体平台(智能服务业务流平台)
30. AI驱动服务领域Agent生产的全链路 AI生成式开发参与到服务领域Agent生产构建的全生命周期 Prompt工程 技能使用 流程编排 交互应用 Prompt模板 MCP Tools 调用 流程编排 AI配置开场白 AI引导式需求描述 知识库检索 流程自动规划 AI生成交互表单 Prompt自动生成 文档/网页读取 流程步骤分解 AI构建Artifact Prompt自动调优 AI自动匹配技能 参数自动预编译 AI自主调用Agent
31. 服务领域Agent平台的整体架构 Multi-Agent 转交模式 Handoff 嵌入模式 Nested Interaction 开场白 输入表单 主代理模式 Master Multi-Modal 输出卡片 文本 文档 图片 AI Generator 语音 Planning LLM自主决策 群聊模式 Group Chat 引导式需求收集 Prompt自动生成/调优 Workflow自动编排/预编译 Workflow(流程引擎驱动 / LLM驱动、按步执行 / 自主执行) AI Artifact生成 工具自动选择 开场白/交互表单生成 Tool 工具集成 工具管理 工具授权 Prompt Knowledge 知识库 Infrastructure 文档 服务领域数据 Management 工具执行(同步/异步/轮询) Prompt工程 Prompt模板 服务领域大模型 Memory管理 调试诊断 版本管理 权限管理 统计分析 性能监控 服务领域MCP Server 服务领域LLMOps平台
32. 落地效果:AI化快速构建Agent能力 AI生成式开发构建LLM自主规划类Agent的效果
33. 落地效果:AI化快速构建Agent能力 AI生成式开发构建Workflow预编排类Agent的效果
34. 落地效果:AI化快速构建复杂交互 AI生成式开发构建和应用基于GUI交互形式的Artifact的效果 Artifact对话式生成 在Agent中使用Artifact
35. 总结本次分享的核心点 Agent常见模式与带来的价值 • Workflow预编排 vs LLM自主规划的区别和各自优缺点 • Agent、Multi-Agent的几种常见模式 • Agent带来的价值增益:需求研发范式变革、复杂度降低、交互多样性 阿里云服务领域Agent构建方法论 • Workflow预编排与LLM自主规划的权衡、Multi-Agent应用 • Agent稳定性优化、领域数据集成、Agent响应速度提升 • Agent效果优化提升的路径:原型构建、规划分解、Muti-Agent构造、模型调优 阿里云服务领域Agent平台设计思路 • 阿里云服务领域Agent平台聚焦于领域问题的解决 • 在平台上实现AI驱动Agent的全链路生产过程,实现Agent的低成本构造 • 实现云计算领域经验在服务领域Agent平台上的沉淀与共享
36. Agent应该“灵活自主”还是“稳定可控”? 这取决于场景
37.
38. THANKS 探索 AI 应用边界 Explore the limits of AI applications

Home - Wiki
Copyright © 2011-2025 iteam. Current version is 2.146.0. UTC+08:00, 2025-10-20 17:02
浙ICP备14020137号-1 $Map of visitor$