腾讯云wedata agent的思考与实践

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1. 演讲人:虎兴龙
2. 01 Data Agent的挑战 02 腾讯云WeData Agent的设计理念 03 WeData Agent的工程化实践 04 未来展望
3.
4. 01
5. 优秀的Agent 类似优秀的员工 持续 进化 共鸣 信任感 专业 可控
6. 如何建立用户信任? 可迭代进化 自主可控 专业可靠 共鸣认同
7. 02 腾讯云WeData Agent的设计理念 信任,是协作的基础
8.
9. 人和机器没有共同的Context “你知道我知道你是知道的” 参考论文:https://www.cell.com/iscience/fulltext/S2589-0042(21)01551-0
10. 过去 多维数据分析 全域数据资产 基于SQL、可视化拖拽的多维自助 数据分析 分散在不同系统的技术性数据结构,难 以直接应用于业务决策 现在 数据语义层 全域数据资产 分散在不同系统的技术性数据结构,难 以直接应用于业务决策 连接底层数据与业务用戶的桥梁,将技 术数据转化为易于理解的业务概念 数据语义层为Data Agent提供可靠的知识基础和操作接口 Data Agent 基于多智能体协作的超级智能体, 具备数据开发、数据治理、数据分 析等专家能力 人与人 的协作 人与机器 的协作 Data Agent赋予数据语义层更强的交互能力和智能分析能力
11. Context
12. 0.8 x 0.8 x 0.8 x 0.8=0.5 0.8 + 0.8 + 0.8+0.8=3.2
13. Data Agent is Easy ,Data Context is Hard
14. We Know More Than We Can Tell-- Michael Polanyi
15. 概念 关系 指标 维度
16.
17. 1 7
18. 信任感,对 个人的Data Agent 基于多智能体协作的超级智能体,具备 数据开发、数据治理、数据分析等专家 能力 自定义知识 针对特定场景,选定特定领域知识,减 少非相关知识干扰agent 准确度 自定义工具 针对特定插件,从500+工具集中配置需要 用到的工具,同时支持用户自定义工具 多渠道分享 以API、web URL、SDK等方式分享自己的 data agent 供第三方使用 自主优化 可以自助监控agent的调用、用户反馈情 况,并自助进行query标注、agent调优 1 8
19. Data Agent 基于多智能体协作的超级智能体,具备 数据开发、数据治理、数据分析等专家 能力 Wedata GUI辅助 作为WeData助手,帮助用户在数据集 成、开发、运维、治理等环节进行智能 辅助 LUI独立入口 以自然语言的交互形式,帮助用户完成任 务 SDK生态嵌入 以SDK、插件方式,可被集成在office、浏 览器、客户系统中 A2A协议 以API形式,可被客户集成到自己的智能应 用中
20. 03 腾讯云WeData Agent的语义工程 打造语义层与Agent迭代进化飞轮,数据工程的交付升级
21. Data Agent:Data Agent Engineering 统一语义层 语义工程:Data Context Engineering 数据工程:Data Engineering 多模态湖仓一体引擎
22. 自动化评估 运营干预 用户反馈
23.
24. 多源异构数据 MySQL 可信语义层 WeData 智能应用新生态 Agent & ChatBI Doris Hive BI 工具 Starrocks Lakehouse 智能检索 Clickhouse Postgres Tc-House 文档、 Unity Semantics office嵌入 式分析
25. 混合检索 意图识别 Query 向量检索 Query改写 重排 Query分解 用户 目标簇指标、维度的集合 原始序列 ES 候选 指标维度 元数据 语义模型库 重排后Top_k个表 序列表示 Query 语义特征 构造模版使用的指标、维度 聚类检索 去重 关键词 + ES 元数据序 列 语义特征 …… 聚类中心 聚类 重排 (BGE、Qwen-Ranker等) 低分过滤 元数据序列化 业务、主题 ⊕ 数据模型 ⊕ 描述_1 𝑛 1 ⊕ 𝑖=1 ( 指标_1_ 𝑖 ⊕ 维度_1_ 𝑖 业务、主题 ⊕ 数据模 型 描述_2 𝑛 2 ⊕ 𝑖=1 指标_2_ 𝑖 ⊕ ⊕ ⊕ 数据模型 ⊕ 固定模版 指标_q_ 𝑖 ⊕ 𝑖=1 模版Query 元数据 𝑛 𝑞 描述_q 定位目标指标、 维度 维度_2_ 𝑖 …… 业务、主题 FlattenedRAG ) ⊕ 维度_q_ 𝑖 LLM ES
26. SemQL(Semantic Query Language) select * from query( Semantic MCP client = MultiServerMCPClient( { “WeData_Unity_Semantics”: { “desc”: “wedata统一语义层MCP”, “url”: “https://wedata-api-fusion-dev.cloud.tencent.com/mcp/sse”, “headers”: { “TENCENTCLOUD_SECRET_ID”: ”腾讯云accesskey“, ”TENCENTCLOUD_SECRET_KEY“: ”腾讯云secretkey “, ”TENCENTCLOUD_REGION“: ”腾讯云可用区" }, "timeout": "60", "sse_read_timeout": "300", "transport": "sse", } metric=[订单金额], where=[Dimension(订单状态) = '已取消' ], order_by=[TimeOutput(day) desc], group_by=[Dimension(性别别),Dimension(订单 状态),TimeOutput(day),TimeOutput(month)], limit=10, time_start='2025-12-01T00:00:00', time_end='2025-12-30T00:00:00' ) } ) tools = await client.get_tools() agent = create_react_agent( model=llm, tools=tools, debug=True ) response = await agent.ainvoke({"messages": "帮我统计一下近7日订单总金额的变化趋势"})
27. 创建数据模型 定义指标 引入MCP插件 编写助手Prompt 发布个人分析助手
28.
29. 04 未来规划 Data & Context Engineering
30. ➢ ➢ ➢ ➢
31.
32.

首页 - Wiki
Copyright © 2011-2025 iteam. Current version is 2.146.0. UTC+08:00, 2025-10-20 18:45
浙ICP备14020137号-1 $访客地图$