大模型增强下的图智能在金融场景的应用

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1. 大模型增强下的图智能 在金融场景的应用 Fabarta图智能解决方案架构师 / 贾志鹏
2.
3. 目录 • • • • 图智能技术在金融领域典型应用 图智能技术当前遇到的挑战 如何结合大模型技术和图智能技术应对挑战 案例分享
4. 图智能技术 什么是图? 基于图论以点 (实体) 和边 (关系) 描述现实世界中个体 和个体之间网络关系的数据结构。 有哪些图技术? 图数据库、 图计算引擎、 图可视化、图分析 什么是图数据库? 图数据库是基于实体和关系建模的数据库系统。以点 、 边为基础存储单元,以高效存储、查询图数据为第一设计 原理的数据管理系统。 一图观万物,一图胜千言
5. 图智能技术的发展趋势和典型应用 10%->80% • 到 2025 年,图技术将用于 80% 的数据和分析创新 参与数据和分析比例 • 而 2021 年只有 10%,将促进 整个企业的快速决策 30% • 到 2023 年,图技术会在全世界 30% 的组织中促进快速的场景 化决策 组织中使用 • 它将帮助找到数据中未知的关 系,找到传统分析方法中不易发 现的价值 50%/44% AI 来源:Gartner 图数据库/图分析平台 非结构化数据 (word, pdf, text, image, video..) 结构化数据 (MySQL, Oracle等 关系型数据库, csv..) 半结构化数据 (Json, xml..) • 图构筑了现代数据以及分析能力的 基础 知识图谱 基础图谱 图智能分析应用 • 50%的Gartner客户咨询过围绕图 技术的AI应用相关的话题 知识图谱 集团图谱 反洗钱 问答 实控人图谱 风控 知识库 客户关联图谱 反诈骗 • 44%的全球 ML 的研究都与图神经 网络相关
6. 图智能技术当前在金融行业的应用 结 构 化 数 据 产 业务 生 系统 数 据 半 结 构 化 数 据 非 关 系 型 数 据 库 知识库服务 图智能 服务 反欺诈 反洗钱 智能营销  智能搜索  资金环路、回流检测  构建面向反洗钱的图谱  贷款流向异常分析  私人银行潜在高净值客户挖掘  智能问答  欺诈交易发现  分析建模发掘可疑个体  贷款还款异常分析  私人银行客户生态圈分析  虚拟助手  信贷申请欺诈团伙发现  关联数据进行团伙发现  企业状态异常分析  对公客户生态圈分析  对公信贷申请欺诈发现  模型固化后自动化预警  企业违约风险分析  信用卡高价值成长路径分析 图智能分析应用 知识图谱 数据获取 智能风控 基于AI的知识获取/建模 图算法支撑 基于AI的知识抽取加工融合 图神经网络/图卷积网络(GNN/GCN) 基于图的知识存储/计算 图数据 + AI分析 基础图谱 图数据库 以图结构存储 算法支撑 图数据库存储 图计算引擎 交 互 应 用 业务 前端 用户
7. 知识图谱构建过程 知识图谱 知识融合 非结构化数据 半结构化数据 结构化数据 实体抽取 关系抽取 属性抽取 指代消解 质量评估 存储 知识推理 计算 实体消歧 实体对齐 实体链接 本体抽取 第三方知识库 步骤1: 数据获取 步骤2: 知识建模与知识获取 步骤3: 知识融合 步骤4: 知识加工 步骤5: 知识存储与计算
8. 基础图谱构建过程 源数据 实体基本信息 实控人识别算法 实控关系 实际控制人 图谱 集团成员关系 集团图谱 股权表 上市公司表 企业图谱 股权穿透算法 真实持股关系 集团龙头识别 高管任职表 执行事务合伙人表 …. 集团识别算法
9. 图智能分析流程 业务理解 • 业务主题 • 图谱类型 • 数据来源 建立图谱 • 面向主题,构建 图谱 • 实体/关系识别 • 数据映射 • 数据加工 图探查 • 针对图谱数据 进行业务/数据 分析发现 • 结构性探查 图模式&图计算 • 图算法分析 • 图模式识别 数据融通 • 通过数据/API/ 可视化的方式将 分析结果集成到 现有系统
10. 图智能分析应用流程 发起业务诉求 业务应用 业务校验 数据来源即加工方式 梳理 全量图算法/规则投放 可视化分析探查 图模型设计 图数据接入配置 图数据折叠 (关系加工) 已有算法/规则参数调 整或定制算法/规则执 行分析 全量图算法/规则执行 和管理 结果集成 多轮调整验证 数据同步 图实例新建 数据全量/增量接入 加工逻辑验证 加工逻辑批量执行调 度 执行结果批量回写入 图 数据查询管理及计算 资源调度
11. 图智能技术当前遇到的挑战 如何加速图谱的使用 2.1 如何理解业务 需求并选择模式 2.2.如何将图数据 结果更友好的呈现 1.图谱构建成本高 知识图谱 非结构化数据 (word, pdf, text, image, video..) 基础图谱 半结构化数据 (Json, xml..) 图智能分析应用 结构化数据 (MySQL, Oracle等 关系型数据库, csv..)
12. 大模型辅助图谱构建 建图方式 自动建图 半自动建图 建图场景 建图思路 大模型如何辅助 • 元数据之间的关系 • 根据元数据利用大模型进行自动建图推荐,人工 • 通过大模型进行元数据的补齐 校验 • 结构化数据的图构建 • 根据元数据梳理的关系,自动构图,比如社交网 • 通过大模型进行自动映射的发现 络、供应链等 • 非结构化数据:文档段落之间的关系 - - 粗粒度的图结构 • • • • 根据段落抽取对应的图 包括分级目录结构 切片前后关系 文档片段与标签的关系 • 通过大模型对文档进行初步切分整理 • 通过大模型进行实体关系提取 • 结构化数据与非结构化数据之间的关系 (企业内典型的关系场景) • • • • 组织机构关系 作者与文档、代码、工作项的关系 文档引用关系 根据关系自动构建 • 通过大模型进行自动映射的发现 • 非结构化数据:(word/pdf等)实体、 关系抽取 • 需要进行细粒度的图谱构建 • 进行知识的抽取、积累 • • • • 大模型进行实体关系抽取; 根据抽取的反馈,大模型微调; 基于微调大模型做实体关系抽取 人工校验并入图 • 根据需求可支撑不同场场景 • 可用于图谱辅助大模型问答; • 可利用图和向量融合方式结合智能体进行问答
13. 元数据构图-大模型辅助元数据补齐 原 始 元 数 据 对公客户基础信息表 集团成员表 字段名 字段中文名 字段名 KHBH 客户编号 jtcykhbh KHMC 字段中文名 jtkhbh JYFW TYSHXYDM 主合同_业务合同基本信息表 担保合同信息表 字段名 字段中文名 字段名 cont_serial_no 合同流水号 GUAR_SERIAL_NO cust_no 客户编号 GUAR_CUST_NO 字段中文名 jtkhgx 集团客户关系 main_guar_mthd MAIN_GUAR_MTHD 主要担保方式 etl_dt 数据日期 guar_serial_no TYSHXYDM 统一社会信用代码 字段中文名为空: 大模型无法使用, 需补齐 展示示例 Fine-tuned LLM with Domain Knowledge (调优典型模式:常见行业术语、拼音首字母缩写、英文简写、英文简写与中文拼音混合) 大模型智能 元数据补齐 补 齐 的 元 数 据 对公客户基础信息表 字段名 字段中文名 KHBH 客户编号 KHMC 客户名称 JYFW 经营范围 TYSHXYDM 统一社会信用代码 集团成员表 主合同_业务合同基本信息表 担保合同信息表 字段名 字段中文名 字段名 字段中文名 字段名 字段中文名 jtcykhbh 集团成员客户编 号 cont_serial_no 合同流水号 GUAR_SERIAL_NO 担保合同流水号 cust_no 客户编号 GUAR_CUST_NO 担保人客户编号 main_guar_mthd 主要担保方式 MAIN_GUAR_MTH D 主要担保方式 guar_serial_no 担保合同流水号 TYSHXYDM 统一社会信用代码 jtkhbh 集团客户编号 jtkhgx 集团客户关系 etl_dt 数据日期 智能化补齐结果
14. 元数据构图-大模型辅助元数据关联关系发现和构建 补 齐 的 元 数 据 对公客户基础信息表 字段名 字段中文名 KHBH 客户编号 KHMC 客户名称 JYFW 经营范围 TYSHXYDM 统一社会信用代码 集团成员表 主合同_业务合同基本信息表 担保合同信息表 字段名 字段中文名 字段名 字段中文名 字段名 字段中文名 jtcykhbh 集团成员客户编 号 cont_serial_no 合同流水号 GUAR_SERIAL_NO 担保合同流水号 cust_no 客户编号 GUAR_CUST_NO 担保人客户编号 main_guar_mthd 主要担保方式 MAIN_GUAR_MTHD 主要担保方式 guar_serial_no 担保合同流水号 TYSHXYDM 统一社会信用代码 jtkhbh 集团客户编号 jtkhgx 集团客户关系 etl_dt 数据日期 • • • • • 合同: 合同号 作者 创建日期 审核日期 合同: ... • 合同号 • 作者 • 创建日期 • 审核日期 • ... Fine-tuned LLM with Domain Knowledge + Vector search (向量相似度TopN + LLM处理) jtcykhbh (集团成员客户编号) KHBH (客户编号) jtkhbh(集团客户编号) 表间关系 表内关系 cust_no (客户编号) cont_serial_no (合同流水号) guar_serial_no (担保合同流水号) 结构化数据和非结构数据的元数据 GUAR_SERIAL_NO (担保合同流水号) GUAR_CUST_NO (担保人客户编号) • • • • • 合同: 合同号 作者 合同: 创建日期 • 合同号 审核日期 • 作者 ... • 创建日期 • 审核日期 • ...
15. 图智能结合大模型在营销场景下的应用 企业数据源 结构化数据 非结构化文档 图片 视频 Fine-tuned LLM 组织结构 代码 Multimodal Database ... Graph Engine Vector Engine
16. 大模型增强图谱使用 图数据查询 图分析结果查询 分析报告生成 贷款企业公司A和公司实际控制 人三度关系以内的交易中,有哪 些企业是房地产行业相关的? 贷款企业公司A持有的账户2024 年是否存在关联交易? 请给出贷款企业公司A的风险分 析报告 Text2Cypher Text2API 智能体串联编排 Fine-tuned LLM with Domain Knowledge 模式名称:关联交易 图Schema信息 业务释义:三角计数模式指的是在一 个金融交易网络中,三个节点(通常 代表市场参与者或交易实体)互相之 间存在交易关系,从而形成一个闭合 的三角形结构。这种模式反映了市场 参与者之间的高度互动和复杂的交易 关系。 图分析任务结果 报告模版
17. 图智能结合大模型在金融风控下的应用 交易对手类型 实体关联分析 资金来源去向 资金交易网络分析 系统自动生成风险分析 报告 政策解读 图智能分析 多维分析 知识问答 大模型 图谱模型分析 专家/历史经验库 政策知识库 图数据存储 企业工商图谱 机构内部数据信息 第三方数据信息 交易图谱 客户关系图谱 客户基本信息 客户变更信息 交易明细信息 工商信息 证照信息 外部协查信息 历史风险评级 历史可疑报告 资金来源信息 ......
18. 图增强RAG 元数据知识化 元数据管理 元数据补齐 元数据关系 数据血缘 数据知识化 向量化 解析/切片 Fine-tuned LLM 关系抽取 内容解析 混合查询 用户问题 前处理(元数据筛选|敏感词过滤) Agent任务调度 图查询与分析 回答 答案后处理 答案生成 Prompt拼接 向量相似度搜索 图查询结果|多路召回|rerank 图+向量 多模态智能 引擎
19. 图智能结合大模型在金融知识库下的应用 LLM 企业内部私域数据 文档 组织 代码 1. 元数据知识化 2. 数据转换为知识 (文档-人员、结构 关系等) 3. 文档、提交记录向 量化 ArcGraph 显式关系 多模态智能引擎 ArcVector 隐式关系 Fabarta 效果 与原生效果比对 LLM任务解析 问题 查询计划生成 回答
20.

Accueil - Wiki
Copyright © 2011-2024 iteam. Current version is 2.137.1. UTC+08:00, 2024-11-15 21:04
浙ICP备14020137号-1 $Carte des visiteurs$