TuGraph + AI:AI 时代下图数据库的智能化探索

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1. 戚仕鹏 吕松霖
2. GraphRAG AI GraphRAG GraphRAG
3.
4.
5. 图 (Graph): 图谱的图 由顶点和它们之间的边构成的数据结构 顶点 边 公司信息表 雇佣关系表 项目信息表 员工信息表 好友关系表 参项关系表 表示实体或概念 表示实体和概念之间的关系 C F 2 A X B 项目 1 员工 D E 公司 员工关系 亲属关系 参项关系 通讯关系 好友关系 …
6. √ 转账500元 张大妈 李大明 √ 叶小花 安全风控 商家服务 全图风控、安全风控、…… 服务图谱、决策图谱、…… 会员关系 场景应用 蚂蚁森林、新春红包、 搜索图谱、垂直应用图谱、…… 关系网络、营销推荐、…… 手机 李小明 赵四 基础设施 金融图谱 数据血缘、异常检测、 推荐图谱、基金图谱、 基础分析、…… 产品图谱、…… 赵六 马小骗 手机 赵九 100+ 业务线 60w核 300+ 场景 在/近/离线三线一致
7. 源于蚂蚁业务实践、性能世界领先、规模世界领先的企业级图数据管理平台 业务 应用 消费金融 安全风控 数据血缘 关系网络 智能营销 Restful/RPC、 命令行、 Java/Python SDK等多种形式接口 Tu Gra p h 图数据 管理平台 操作 管理 数据源 关系型数据库 图构建 图查询 图分析 图运维 模型设计 语句查询 实时图查询 集群管理 数据映射 模板管理 可视化图分析 监控大盘 数据导入 副本设置 配置管理 日志管理 数据管理 插入数据 发布集成 系统功能 数据集成工具 TuGraph Link 批量 增量 引擎 内核 分布式架构 元数据 部署环境 部署形态 毫秒级响应 多地容灾 容器 集群管理 物理机 近/离线 流式图计算 引擎 TuGraph Analytics 时序图计算 流图匹配 一体机 图仿真 流图计算 操作系统 CentOS Oracle … 大数据存储 ODPS Hive … 多数据源 在线离线 图学习 框架 TuGraph Learn 文件 CSV JSON … 实时监控 GNN训练 全图推理 DSL 图策略推荐 图样本生成 运维工具 麒麟 MySQL 实时 导入导出 在线 图数据库 引擎 TuGraph DB (300+) 国际标准图查询语言 ISO-GQL 一站式 图平台 TuGraph Platform 分析 洞察 知识图谱 …… CPU/GPU 消息队列 SLS x86 ARM Kafka …… …
8. App OSGraph (开源图谱洞察) Agent Chat2Graph (图数据智能体) AI Infra Graph Infra DB-GPT-Hub/Text2GQL (图语言微调) DB-GPT/GraphRAG (图检索增强生成) Awesome-Text2GQL (图语料生成) TuGraph DB (单机图数据库) TuGraph Analytics (分布式流图引擎) mini-gu (高校图数据教研平台) GraphUniverse (统一图数据管理)
9.
10. 行为主义 ✓ 适应性强 ✗ 可解释性差 ✗ 鲁棒性不足 (感知思维) 进化 控制 强化学习 智能控制 Agents 具身智能 进化算法 专家系统 AGI? 决策树 神经网络 GraphRAG ✓ 可解释性强 ✗ 规模受限 KAG LLM ✓ Scaling Law ✗ 推理幻觉 符号主义 (抽象思维) 数理 逻辑 连接主义 (具象思维) 仿生 学习
11. Input Query Symptom: I had very bad cardiac pain this morning, also felt dizzy and nauseous. It lasted for a few minutes. Patient file: female, 34 years old, height: 170cm, weight: 55kg… External Database • Vector Database Retrieval Retrieved Results • • • The first symptom sign of a heart attack… Angina pectoris is caused by a decrease in… … Augmentation & Generation • • • Input-layer Output-layer Intermidiate- layer Output Response According to your symptom and conditions, you are likely having Conary Artery Disease…
12. 传统RAG方法 • 基于文本相似性,忽视了文本间的结构关 系 • 过多文本可能会导致上下文过长,出现 “lost in the middle”的问题 • 只检索到文档子集,而无法全面理解全局 信息 GraphRAG • 抽取并存储文本件结构化信息(如节点、 三元组、路径或子图) • 理解与利用文本间的结构关系,结构化知 识图谱处理冗余信息与全局信息 • 基于结构化知识和全局摘要信息进行增强 朴素的GraphRAG链路
13. 特性 传统RAG GraphRAG 关系上下文捕捉 独立处理文档,缺少文档间关系 通过图结构捕捉并利用信息片段之间的关系 提供更丰富的上下文 结构化的知识表示 以独立文档形式存储信息 通过图结构表示实体间的层次和非层次关系 更自然地反映现实世界的复杂性 知识库可扩展性增强 增量数据需重新组织,扩展性有限 自然地将新节点和关系加入已有知识图谱 无需重组数据,保持高效检索性能 知识理解能力增强 依赖LLM的文本理解能力 准确性受限于原始文本的上下文 深入理解文本中的实体及其相互关系 更准确地把握数据的内涵和外延 复杂查询能力增强 一般只能处理单跳推理 在多维查询时表现受限 难以有效连接多个相关特性 利用图结构进行多跳推理 有效连接和聚合多个相关特性 提供更深入的分析结果,
14.
15.
16. 文档结构图谱 文本块记忆、图社区摘要、多路搜索召回
17. 更 严 图谱 谨 私域知识库 知 识 多 全领域知识
18. Local Search 分析报告、财报类文档 北京123科技有限公司由北京ABC科技有限公司全资持股。根据提 供的信息,北京123科技有限公司没有其他的同股东公司。 北京123科技有限公司 北京567科技有限公司 全资持股 投资 Global Search 根据报告,我们可以了解到北京123科技有限公司的唯一股东是北 京ABC科技有限公司。北京ABC科技有限公司又是北京567科技有 北京ABC科技有限公司 限公司的股东之一。因此,可推断北京123科技有限公司与北京 567科技有限公司存在间接股东关系。 任职关系 合作关系 …
19.
20. Question Intent Interpreter Text2GQL Translator
21. Text2GQL为GraphRAG提供了 • 大模型与图谱直接对话 • 不受限的知识检索:灵活的查询语言与算法调用 当前Text2GQL受限于 • 缺少Text2GQL训练语料 • 不同Schema之间的迁移能力 • 不同Dialect之间的迁移能力 • 复杂Text2GQL任务的翻译与执行
22. 训练:DB-GPT-HUB 训练方法 https://github.com/TuGraph-contrib/Awesome-Text2GQL https://github.com/eosphoros-ai/DB-GPT-Hub 训练模型 • LoRA • CodeLlama • QLoRA • Baichuan2 • Qwen 评测:DBGPT-HUB-GQL 评测方法 • 文本相似度(零开发成本) • 语法正确性(需要语法解析器) • 执行结果正确性(需要数据库服务与 实际数据) 基于GQL(tugraph-analytics)语料以及Cypher(tugraph-db)语料微调的CodeLlama-7B- Instruct模型翻译语法正确率与语句相似度达到90%+,执行结果正确率达到50%+
23. N = n template * n schema * n match_pattern • 使用ANTLR4 Visitor遍历抽象语 法树 • 识别查询语句中使用的语法 clause,MATCH,RETURN等 • 将语法Clause后跟随的查询模式 替换为任一合法的查询模式 • 填入数据集中的实际数据 • 随机增加返回条件 • 生成新的查询语句
24. N = n template * n schema * n match_pattern * n generalize_factor
25. JSON格式语料集 Query模版 (n template ) 语料集构建 Query生成 • 模板+Schema 实例 化 * n schema * n match_pattern 泛化后语料对 实例化Query Question泛化 Question生成 • • • 转换为DB-GPT- Hub的微调格式 框架直译 LLM翻译 LLM带示例翻译 • 泛化倍数可选 * n generalize_factor 语料对
26.
27. GraphRAG • • • • 用户领域知识库 大模型记忆 DBMS文档库 Text2GQL模板库 Text2GQL • • 驱动GraphRAG查询 知识图谱动态更新
28. 系统特色 核心能力 • Graph + AI 技术深度融合。 • 单主动多被动混合多智能体架构。 • Graph4AI:图结构增强的智能体架构。 • 快&慢思考结合的双LLM推理机。 • AI4Graph:智能体降低用图门槛。 • 面向智能体链的任务分解与图规划器。 • 推理:快&慢思考推理增强设计。 • 分层记忆系统。 • 规划:图增强任务自动规划。 • 工具知识图谱。 • 记忆:分层知识精炼与GraphRAG。 • 向量与图谱知识库。 • 工具:工具图谱管理与动态推荐。 • 简洁的智能体SDK。 • 用户:面向研发、运维、PD、SA。 • 服务化与Web交互。 • 场景:DevOps、BI、Q&A、AIGC。 • 智能体一键配置。 • 生态:Graph、Agent、RAG、LLM。 • ...
29. • 图计算是以数据分析为中心的数据管理新范式 • 图计算在风控、信贷、社交、搜推等传统场景落地,同时在让大模型更智能 微信公众号搜索 “TuGraph” 了解更多的图计算资讯 联系我们 tugraph@service.alipay.com qishipeng.qsp@antgroup.com lyusonglin.lsl@antgroup.com
30.
31. 大模型正在重新定义软件 Large Language Model Is Redefining The Software

- 위키
Copyright © 2011-2025 iteam. Current version is 2.147.0. UTC+08:00, 2025-10-29 03:21
浙ICP备14020137号-1 $방문자$