Multi-Agent架构驱动的Data Agent路线与工程实践

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1. 演讲人:李飞
2. 01 Data Agent架构的演进路径 02 Data Agent 的核心能力 03 架构拆解与工程实现 04 实践经验分享 05 未来展望
3.
4. 01 Data Agent架构的演进路径
5. 单Agent到多Agent的进化 Agent通过引入规划、记忆、工具使用这三个核心功能,提高大模型落地的稳定性,从"好玩"向"好用"迈进。 单Agent 单Agent无法精通所有的技能,各个领域的规划执行流 程不同,使用的工具也不尽相同. 多Agent 多Agent降低工具和知识的搜索空间,保证任务聚焦和 独立优化。
6. 中心化和去中心化智能体架构 Coordinator统一接收所有Agent的信息,决策后再分 发任务。所有Agent仅与中央节点通信。 Agent独立决策,通过点对点通信协作,适合高实时 性、隐私敏感场景。 Central Coordinator Agent1 Agent2 Agent1 Agent3 AWS Bedrock MAC,ReAct等 强于全局优化,但面临单点瓶颈,例如coordinator Agent2 Agent3 斯坦福小镇,TAG等 扩展性优异(如斯坦福小镇的开放交互),但需解决非 平稳性问题
7. Function Call vs MCP vs A2A 本质是快速“规模化”。 01 02 03 Function Call MCP A2A Function Call不是协议,是大模 MCP是跨模型、跨工具的统一交互标 型提供的一种能力,允许模型根 准,不仅规范了工具调用(如函数描 据自然语言指令自动调用预定义 述、参数格式),还整合了 Prompts、 函数,实现与外部工具的连接, 资源管理等上下文体系。但生态成熟度 但它并非统一标准 —— 不同厂商 不足,企业引入可能会造成运维负担, 对其接口格式、参数定义等有独 其标准化设计难以满足垂直领域的定制 立实现。 需求(如安全审计、数据隔离) A2A则解决"多个Agent如何协 作",通过标准化Agent间通 信,推动了多Agent系统的互操 作和协作创新
8. Data分析的全流程 “首先分析我们自己的收入指标增速,然后对比竞争对手的公开数据情况进行benchmark分析,然后结合websearch新闻,最后 给我写一个完整的调研报告” ETL 解决数据清洗的问题 Data Source Metric: 解决业务语义构建与提取的问题 Data Model Dataset Dataset A (Single Metric/Time-Series) Data Model A Data Source C Metric C Report A Insight B (Attribution Analysis) Report B Insight C (Rank Analysis) Report C Dataset C (Multi Metric/MultiDim) Data Source D Data Source F Report Insight A (Trend Analysis) Metric B Dataset B (Single Metric/MultiDim) Data Source E Insight Metric A Data Source A Data Source B Metric Report 解决洞见到结论/建议的问题 Insight : 解决数据到洞见的问题 Metric D Data Model B Metric E Metric F Dataset D (MultiModel/Multi Metric/MultiDim)
9. 能像分析师专家一样规划: Data领域的“Multi-Agent”架构是如何运行的 Goal 看下近7天基金申购 人数,哪个渠道跌得 最多,写个详细的总 结报告 Reward Feedback (正负反馈) Expert Recruitment 查数专家 画图专家 解读专家 Collaborative Decision-Making 归因专家 规划专家 Group 查数专家 Evaluation Outcome 有数据、有逻辑有业务 Sense的分析报告 检测专家 ? == 用户想要的 N轮循环 报告专家 Action Execution Agents: SwiftAgent输出的 Actions: 要素识别 逻辑识别 维度归因 因子归因 报告填充 可视化
10. Data Multi-Agent的挑战 优势 挑战 协调 效率性 异步并行,可同时处理海量信息和任 务,在复杂任务上效率极高 子agent之间无法直接通信与实时协作。 Agent 专注度 context压力相对较小,任务解决空 间小,聚焦专注 在信息抽取和压缩过程中容易失真(例如 数据解读是对dataframe结果解读还是通 过算子编排计算解读) 扩展性 总信息量可扩展,无视上下文,领域 能力扩展性强 子Agent的边界定义 复杂度 任务编排,异步任务管理、结果聚合 逻辑设计复杂度高 依赖高质量的编排结果,消息状态管理和 传递等 工具
11. 当前多Agent的不可能三角 性能 准确 泛化 目标错位风险: “100%正确率”和“绝对稳定性”本质是传统软件思维(确定性输 出),与大模型的概率性本质存在根本冲突。试图用蛮力对抗技术本 质,如同要求内燃机完全不排放废气。 边际效应陷阱: 从90%→95%准确率可能只需1个月优化,但从98%-99%可能需要6 个月,而这1%的提升用户可能根本感知不到,却消耗掉可支撑3个新 功能的研发资源。 机会成本黑洞: 当团队所有精力被“稳定性攻坚”占用时,其他产品正在定义新场 景,最终你的产品可能"赢了精度,输了整个战场”。 ——来自于DeepSeek
12. 02 Data Agent的核心能力
13. 动态复杂推理 多模态环境感知 Agent 能够感知并理解多种数据格式,包括结构 化数据、非结构化文本、图像和语音等。它能够 在复杂数据环境中建立上下文理解,识别关键数 据实体和它们之间的关系。 基于多层次推理机制,Agent 能够处理因果关系 分析、假设验证和异常检测。它通过逻辑推理和 统计分析相结合的方式,从海量数据中提取有价 值的洞察。 面向目标的行动规划 Agent 能够将用户意图转化为具体的分析计划, 自动分解复杂任务,并根据执行结果动态调整策 持续学习进化 Agent 通过用户反馈和自我评估不断优化自身能 力,记忆成功的分析模式并应用于新场景。它能 够积累领域知识,提高分析效率和准确性。 略。它能够平衡短期目标和长期价值,优化分析 路径。 工具调用执行 通过抽象工具接口层,Agent 能够协调调用各种 外部工具、数据库和模型。它能根据任务需求选 择最合适的工具组合,并处理工具调用的异常情 况。
14. 数据层:支持多源异构数据接入,提供灵活的 数据集成方案,包括存算一体、存算分离和存 算外置。 引擎层:数据语义模块通过精准的指标和标签 平台,解决大模型的幻觉问题,并利用预计算 加速引擎将复杂查询响应时间压缩至秒级,确 保实时决策需求的满足。智能模型引擎模块结 合大模型和小模型的动态协同。大模型负责语 义理解与逻辑推演,小模型则专注于结构化分 析。动态路由控制器根据任务自动分配。 应用层:为企业提供功能场景的重要支撑,通 过工具组合,记忆共享,多Agent架构,实现 智能体协同工作
15. 03 架构拆解与工程实现
16. “理解”和“落地”的GAP P 规划 执行 A 冰山上 冰山下 反思 R 记忆 M
17. 企业级的数据查询和SQL生成的GAP 企业级的数据查询是让查数成为人和业务之间的“超级翻译官” 核心问题 AI不懂企业术语 “GMV”就是f_amt, “毛利”在不同的企业有不同的算法 搭建知识库 基于关系数据库建立带业务语义和口径的数据 理解分析需求 建议复杂的分析术语和分析算子的映射关系 方案 实现 有效编排 基于预定义模板编排查询语句
18. 查数专家—NL2Semantics 用户请求 预处理 检索生成 数据对象 对象召回 逻辑对象 描述 口径 关系 对象编排 信息增强 LLM DSL生成 后处理 多步思考 错误修改 解码策略 一致性检查 投票策略 重排序 1.数据模型和业务场景相关,降低大模型关联的错误性。 2.字段冗余存储,降低选择的错误性 3.减少文本生成长度,降低时间复杂度和错误传递。 4.查询语句提前优化,减少慢SQL生成的概率
19. 业务动态适应的持续进化 大模型:你到底要哪个!? • 活动运营 部门理解 用户运营 部门理解 “数据表现”=新客首单人数、成熟 用户复购人数、流失召回人数 • “数据表现”=活动PV/UV、完成活 动人数、活动带来的GMV 经营分析部 门理解 • “数据表现”=门店营收、门店成 本、门店利润、各类损耗指标
20. 记忆即服务 参数化记忆 上下文记忆 隐含存储于模型内部参数中的 上下文记忆是显式的、外部的 知识,通过预训练或后训练获 信息,用于补充模型内部参数 得,嵌入在模型权重中,能快 知识,可进一步分为情景记忆 速检索事实性和常识性知识, 和会话记忆,能支持系统动态 但缺乏可解释性,难以选择性 存储短期和中期信息。 存储:动态更新,内容压 缩,冷热分层,LRU缓存, 引用:重要度,时间衰减 度,置信度 更新。 无需上下文,快速检 索,提高推理效率。 但是 可解释性差 更新困难 保障了模型输出的稳定 性。 但是 存储和引用设计复杂 挑战:记忆一致性,性能, 记忆敏感性
21. Memory-基本记忆操作 01 02 整合 更新 将个体的短期经验经过加工与强化,转化为持久且可靠的长期 系统能够根据新输入的信息,智能地修改和优化现有的记忆内 记忆。 容,确保记忆的时效性和准确性。 03 04 索引 遗忘 通过高效的组织和分类机制,对记忆进行精细的索引管理,以 便于后续的快速检索和利用。 智能地选择性抑制过时、冗余或不相关的信息,以保持记忆系 统的精简和高效。 05 06 检索 压缩 用户能够从庞大的记忆库中迅速访问到所需的相关信息,实现 在保持记忆内容关键信息完整性的同时,通过保留显著信息和 知识的灵活应用。 丢弃冗余信息来高效使用上下文
22. 记忆的更新和读取机制 【记忆更新】融合当前需求与全局目标 𝑚 𝑘 ∗ = 𝑎𝑟𝑔 𝑚𝑖𝑛 𝑚∈𝑀 𝛼𝑠 𝑟𝑒𝑙 (𝑚1, 𝑚2) + 𝛽𝑠 𝑟𝑒𝑐 (𝑚1, 𝑚2) ∗ 𝛾𝑠 𝑖𝑚𝑝 (𝑚1, 𝑚2) + 𝛽𝑠 𝑟𝑒𝑐 (𝑚1, 𝑚2) ∗ 𝛿𝑠 𝑟𝑒𝑐 (𝑚1, 𝑚2) 记忆更新:冲突互斥,信 息熵的增减。 记忆更新考虑时效性,冲突性,扩展性(内容信息增强)和压缩性(内容信息减少) 【记忆读取】融合当前需求与全局目标 𝑚 ∗ = 𝑎𝑟𝑔 𝑚𝑖𝑛 𝑚∈𝑀 𝛼𝑠 𝑟𝑒𝑐 (𝑞, 𝑚) + 𝛽𝑠 𝑟𝑒𝑙 (𝑞, 𝑚) + 𝛾𝑠 𝑖𝑚𝑝 (𝑚) + 𝛿𝑠 𝑟𝑒𝑙 (𝑏, 𝑚) 综合考虑query和记忆的最近性、相关性、重要性,也要考虑用户背景和记忆的相关性 记忆权重:加权平均,时 间平滑。
23. 让Agent记住你是谁,你偏好什么。 Personalized Memory Personalized Analytical Schema Personalized Dictionary
24. 记忆抽取的结构设计 非结构化记忆 结构化记忆 {”卖了多少“:”销售 额”,”上分”:”上海分 行”,”质量问题””发热, 易碎”} ...... 实体链接 借鉴GraphRAG,实现了记忆 图谱用于增强表示记忆中实体与 实体间的关系 会话偏好记忆:“用户查销售金额时 候,喜欢使用饼状图进行对比。用户 想要查的公司一般指上海银行。用户 做比较的时候,也喜欢把北京分公司 的对比加上”。 用户输入:2024年6月份,我的公司 公募基金销售金额与5月相比下 降?”} ...... 相关相似检索 记忆状态:增删改处理 记忆权重:加权平均,时间平滑 • 时效性:避免重复识别,提高计算效率; • 准确性:提高识别的效果和稳定性; 经常被使用的记忆会升级为长期记 忆,而短期记忆会随着时间遗忘
25. Data Report实现链路 Research是Agent最好的落地场景,符合“慢思考”和“10”倍提效。 模板 报告实例 大纲生成 任务生成 任务执行 迭代式 任务下钻 Agent执行 总结式 Agent池 状态传递 修订 信息增强 消息传递 记忆 汇总 反思
26. Data Report实现产品交互 3. 打印推理模型思考过程与大纲,大纲内容支持编 辑 1.支持上传模板进行outline解析 2.用户也可以自由输入报告需求由大模型生成 4. 生成图文并茂数据准确的分析报告
27. 04 实践经验分享
28. 某头部城商行在数据分析层面的核心痛点 用不 明白 原有范式 升级后范式 跑不 过来 教不 明白 ETL任 务太多 BI 分支行行长 /业务人员 分支行行长 /业务人员 数据分析师 数据产品经理 LLM+ Agent架构 数据工程师 Semantic Layer 共 同 维 护 原始数据 原始数据 分支行行长/一线业务员直达数据,用数门槛降低,提升企业经营决策与日常业务流中数据参与度
29. 在某头部城商行支持的核心场景 以该金融机构的数据应用场景为例,通过自然语言指标取数,系统能够快速准确地获取相关数据;智能归因分析则帮助找出业务发展中的关键因素和问题所在;自动报告生成 则以直观的方式呈现分析结果,为银行的决策制定、风险管理、业务优化等提供有力支持。这些场景展示了在银行业中运用自然语言处理和数据分析技术的重要性和实用性, 有助于提高银行的运营效率和决策科学性。 03 02 理财产品销售分析 理财经理需要了解上个月理财产品的 01 销售情况,询问“上个月哪几款理财产 品销售额最高”,系统通过自然语言指 标取数,帮助理财经理了解市场需 信用卡业务分析 求,优化产品推荐策略 常见问题如:“信用卡逾期率最高 的客户群体是哪些”,系统通过自 然语言交互形式,从信用记录、消 费行为、收入情况等多维度数据, 找出逾期率最高的客户群体特征, 以便银行采取针对性的措施降低风 险 04 客户行为分析 分支行业绩对比 运营团队提出“客户流失率与哪些因 领导想要比较各分行的贷款业务总 素相关”,系统进行智能归因分析, 量,询问“A分行和B分行今年的贷款 找出导致客户流失的关键因素,如服 业务总量对比如何”,系统通过自然 务质量不佳、产品缺乏竞争力等,为 语言取数与报告生成,为总行领导提 银行改进服务提供依据。 供业务指导提供参考。 05 风险评估 在评估贷款风险时,询问“近期贷款违 06 约主要集中在哪些行业”,利用智能归 因分析,找出贷款违约集中的行业领 域,为信贷部门调整信贷政策、加强风 险管理提供重要依据。 财务分析 财务部门经常询问“各项业务对利 润的贡献比例是怎样的”,系统通 过智能归因和自动报告生成,综 合考虑各项业务的收入、成本、 风险等因素,计算出各项业务对 利润的贡献比例,并以图表和报 告的形式展示,帮助财务部门进 行成本控制和利润优化
30. “银行领导的一天”:如何利用AI洞察数据 1 关心的问题? 指标异动推送 【对公贷款余额】出现指标异动, 通知领导进行关注 2 多维度分析 异 动 预 警 多 维 分 析 我行今年每个月按分支行和客户类 型的对公贷款余额如何?趋势是怎 样? 3 归因分析 哪个分行下降的最多,哪些客户类 型下降了 银行领导 4 结论输出 帮我对上面数据形成一个总结报告 吧 归 因 分 析 数 据 解 读
31. 实现各类核心经营指标智能分析与报告生成 x50 数据需求 满足效率 90%+ 客户痛点 行领导分析 需求满足度 100% 指标语义 理解准确率 应用的核心产品能力 <6秒 使用场景 1200+ 使用部门 净收入分析 总行领导 贷款情况分析 自然语言数据查询 指标归因慢:主要依赖分析师人 工在BI工具或Excel中进行维度与 因子下钻,手工挖掘洞见 存款情况分析 根据行内常用分析维度与指标的 因子关系,进行自动化归因分析 与建议生成,帮助行领导快速发 现数据异动的原因,形成业务闭 环。 归因分析 数据解读靠人工:领导每次对 于大量表格表示看不过来,想 直接知道结论和哪些指标出了 问题 基于明细数据自动进行趋势分 析、占比分析、排序分析和异常 值分析等工作,并将生成的结果 以清晰易懂的报告形式进行展现 报告生成 上线一周领导主动问 询数量 项目一期服务重点 行内领导可以通过自然语言形式 快速获取每日所需经营数据,并 支持智能生成可视化图表 数据查询效率低:数据需求无 限,开发资源有限,需求排队严 重; 从询问到 结果 分支行领导 项目二期服务重点 业务分析师 同业负债分析 相关荣誉 “ 知名数字化研究与服务机构沙丘社区发 布《2025沙丘社区大模型先锋案例 TOP50》,数势科技凭借该项目入选此 次先锋案例。 ”
32. 打造企业供应链分析助手,推动供应链团队订单管理效率提升 背景: 项目成果: 销售网络(线上线下多渠道并存,覆盖电商、大卖场KA、便利店等),供应链团队日常订单追踪和管理面 临效率提升瓶颈,需要高效洞察异常订单,同时针对订单满足率不达标KA客户进行归因分析,从而挽回流 失订单。 解决方案:使用 SwfitAgent 智能分析助手产品,打造企业供应链分析助手,推动供应链团队订单管理效率 提升。 关键节点 供应链管理效率 提升150% > 挽回可交付 订单商机 300万/月
33. 作为店长数据秘书,实现全自动门店数据分析,提升运营效率 项目背景:某头部茶饮连锁客户,在推行数字化管理与决策,随着直营和加盟店数快速增长,门店督导管辖门店数量变多,人力成本极速上升 项目成果:第一周门店督导询问量突破3000+;分析工作处理时长减少80%;每人每周减少10小时+数据处理工作 1. 目标设定 明确巡检的主要目的,如提升服务质量、确保标准 执行、优化门店环境等。确定要达成的具体指标和 2. 巡店计划 制定巡店的具体地址和其它信息。确定每次巡 店的重点关注指标以及波动原因。 当前达成率。 目标设定 门店信息检索 门店知识库查询 取数与高级计算 达成情况排名 门店KPI查询 自然语言取数 取数与高级计算 同店对照分析 门店KPI归因 指标维度归因 目标设定 4. 效果验收 3. 门店稽核 对比巡检前后各项指标的变化情况。通过数据分析评估门店在 检查门店的问题指标(如基础服务合格率、清洁卫生合格 服务、产品、运营等方面的提升效果。总结经验教训,为下一 率、产品品质合格率、外卖点评合格率等),若有问题,从 次巡检和持续改进提供参考。 知识库中查找策略并推荐给加盟商 取数与高级计算 解读报告能力 门店前后对比 问题指标检索 自然语言取数 总结报告 推荐策略查询 智库文档查询
34. 05 未来展望
35. 展望Data Agent的演进之路 Agent可以处理的任务将 从简单同步型任务往异步 复杂型任务演进 Synchronized-> Asynchronized General -> Personalized Agent将从回复用户问题升 级为主动帮助用户发现问题 Reactive -> Proactve 记忆模块将显著提升 Data Agent对于用户个 性化需求的理解与实现
36.
37. 感谢您的观看
38. 公司和个人介绍 数势科技为企业提供基于大模型增强的数据分析 AI Agent,提升企业的数字化决策能力,推动企业数字 化升级。 公司概况 • 2020年,由原京东技术副总 裁黎科峰博士创立 • 行业首个商业化落地的数据 分析智能体SwiftAgent • 在金融、零售、先进制造领 域有深度技术和业务know- how 部分代表客户 投资机构

首页 - Wiki
Copyright © 2011-2025 iteam. Current version is 2.146.0. UTC+08:00, 2025-10-19 01:12
浙ICP备14020137号-1 $访客地图$