基于知识助手的金融大模型应用实践

如果无法正常显示，请先停止浏览器的去广告插件。

1. 基于知识引擎的金融大模型应用实践曹阳/中关村科金资深AI产品总监

5. 中关村科金资深 AI 产品总监，拥有超过 10 年的 ToB 产品经验，曾任职于阿里、京东、字节跳动、shopee 等公司，主导多个智能客服产品，对 NLP 、智能客曹阳服、CRM 相关的技术、产品应用、商业化有着丰富经验。

6. 基于知识引擎的金融大模型应用实践 • • • 大模型在金融业务场景下应用的趋势和挑战大模型驱动知识应用新范式基于知识助手基座的大模型金融领域应用实践

7. 2024大模型技术的发展态势 GPT-4O等多模态模型效果值得期待营销、运营短视频生成，即将全行业落地私有化基座模型能力无瓶颈开源大模型性能不断进化大模型训练技术成熟增效私有化领域知识训练已经成熟大模型性能不断进化多模态大模型效果惊艳视频大模型超预期发展效型提模大大模型工具链已经成熟快加度速，务融业金能赋型模大大模型厂商全面降价大模型响应速度、上下文长度不断提升降本型大模运行载体小型化端侧大模型发展迅猛模型小型化技术进入成熟期 GPU需求越来越低多行业多场景最佳实践落地降低大模型技术门槛基座模型获得成本降低大量最佳实践，直接抄作业降本

8. 2024年大模型应用的发展阶段大模型应用成熟度（场景）大模型技术成熟度（能力） 01 技术专利数量 02 技术发展时间 03 客服技术舆论指数厂商服务成熟度营销（从低至高） 2023 –> 2024H1 产品研发行业大模型基础作业 AI智能体智能办公知识管理大模型编排工具 HR管理文本生成图像客户需求期望数据治理信息安全（左低右高） IT系统建设提示工程大模型工程化财税管理供应链与生产出海业务大模型对话机器人 2024年上半年，经过我们的大量实践与观察，发现大模型场景落地进入爆发阶段，相相比2023年，客服、智能办公、知识管理领域，从客户需求与厂商服务成熟度方面来看，进步迅猛应工程化技术已进入“准成熟阶段”

9. 金融天然是数字，数字化场景需求显著金融大模型驱动的AIGC可⻅十年发展红利对金融行业的影响和变革 ◎ 个性化的服务和极致用户体验未来 3-5 年进入应用深化阶段利润标准通用场景基本覆盖高价值专业场景规模应用临界点当前阶段相同任务AI模型训练成本近五年下降 2017-2025 年技术突破期 ◎ 高效的价值传递效率 2025 年 -2030 年应用深化期 200 倍 2030 年 - 未来大规模应用期 ◎ 合规安全的决策智能

10. 大模型在落地过程中的关键挑战灵活兼容成本经济大模型迭代速度快，需根据场景需求，兼容多个厂家/多个版本/ 医疗个人助理智能家电 zzz 通用大模型 Google 新场景下冷启动阶段需以人机协同的方式保障准确度。使用过程中形成模型自迭代的反馈机制。 pytorch zzzz g 硬件 zzz vg 分布计算 TPU 投入产出比。 Meta 专业性。注入合法合规与安全隐私能力，遵守内外部规则制定，提升拒绝能力。 megtran tensorflow GPU 源消耗，平衡响应时延，提升最大程度避免幻觉问题，提升 OpenAI 分工体系。参数规模的模型，降低算力资安全可信领域大模型领域大模型需具备工具操控能人机协作金融社交媒体组合创新模型形成能力互补、云边端有效政务应用多种参数规模的基础大模型。力，与其他能力组件、传统AI小根据不同场景需求，选择不同光模块运维自主领域微调将大幅提升基础大模型的特定场景准确度，数据是其中关键。大模型技术前置，企业可自主运维。

11. 大模型是数字时代的智能基础设施，推动科技平权新范式科技平权强调普适价值大算力：单位芯片计算能力提升 5000 倍大模型是人人皆可对话的AI,重塑新型人机生产关系，成为数字生产要素新范式和智能基础设施强算法： Transformer 算法 + 无监督预训练知识平权大数据：全网可用数据智 Scaling Law （规模法则）大模型全面整合“大算力、强算法、大数据”，展现出关键要素优化组合的巨大潜力能大模型验证涌科技平权现可行技术栈服务体验平权决策平权模型大小、训练数据量、计算资源的规模和比例，影响建模的性能。多元升级

12. 基于知识引擎的金融大模型应用实践 • • • 大模型在金融业务场景下应用的趋势和挑战大模型驱动知识应用新范式基于知识助手基座的大模型金融领域应用实践

13. 大模型的本质：语言与世界知识的知识库参数化的知识表示 • 基础的世界知识 • 序列/语言的理解能力 • 遵循指令能力 • 上下文记忆能力与学习能力 • 泛化到新任务的能力 • 复杂推理的思维链能力 • 涌现能力 = Transformer 长距离语义关联 + Scaling Law 海量知识

14. 大模型只是AGI的一个里程碑语言能力过程判断事实判断 RLHF Knowledge Enhancement CCG LSTM Transformer BOW N-gram Embedding Prompt learning 价值判断 Alignment PPO Instruct Turning, Chain of Thought Vector DB Autonomous Agent Embodied AI 规范约束因果推断事实步骤实体关系过程句子知识单词段落序列 token 目标价值观短语/句子 token 词义句义语义事实过程目标心智

15. 大模型潜在应用场景：构建企业知识中台是最佳的切入点非结构化数据的知识化将成为新时代的数智化基建，构建企业知识中台，以知识中台为基础，构建各类基于知识的应用场景。容错性高企业知识问答闲聊弱专业性写作文档摘要文生图定向写作营销创意客服行业报告专业性弱智能音箱专业性强编程辅助教育培训金融投研投顾自动驾驶法务咨询需求大需求小诊疗价值高容错性低价值低

16. 大模型驱动知识应用新范式传统AI赛道的典型模式为AI技术垂直场景+项目制开发,在可持续经营和规模化扩张能力方面稍显不足,而大模型的技术特征和应用效果, 让市场对于AI的商业价值产生了全新的认知与期待。大模型大量参数深层网络结构更好的性能大量参数更强的理解和推理能力深层网络结构较少的特征工程大量参数更容易应用于跨任务和跨领域深层网络结构可批量化复制技术落地快大模型市场适用范围广在新一轮人工智能技术热潮中，中国大模型产业规模快速增长，呈逐年上涨趋势。 175 ZB 48.6 ZB 全球数据量中国数据量数据量不断上升大模型的出现大幅度降低了非结构化数据的使用门槛，有助于释放海量非结构化数据中隐含的知识，赋能企业业务。知识应用痛点知识碎片化知识应用信息的爆炸式增长导致知识变得碎片化和分散。信息过载企业缺乏有效的信息筛选处理机制，导致大量信息被堆积和遗忘，无法得到及时有效的利用。知识共享交流难知识共享机制不足、知识交流渠道不畅、知识共享和交流意愿不足、语言和沟通障碍。数据安全风险增加随着知识信息量的不断增加，信息安全风险也不断增加，企业的核心知识和敏感信息在知识管理过程中可能泄露大模型赋能知识应用优势知识应用市场挑战知识应用认知不足停留在较层次的文档管理，限制了知识应用的潜力和范围，导致客户缺乏场景和动力扩大知识管理软件的应用规模知识管理市场处于起步阶段企业应用场景主要集中于文档管理和检索，局限于显性知识，无法形成知识定义、知识获取、知识存储、知识共享和知识使用的完整体系。市场缺乏生态体系市场仍处于发展初期，尚未形成通用的行业标准化方案、稳定的市场格局和成熟的生态数据解析非结构化数据多源整合知识识别&存储数据结构化&向量化，支持知识高效提取、统计、归纳等知识查看&验证面向业务应用需求以场景为中心检验数据质量人机交互创新智能体群体协作，辅助客观分析、诊断洞察、关联推荐数据资产沉淀提升运营效率，重构底层框架，架构可延展更新成本低

17. 总体技术框架：三个步骤、两个算法、一个平台 3 • 学：各类文档中的显性知识 • 用：业务专家的先验知识 • 教：行为日志中的隐性知识 2 • 定位：任务定位，打开大模型黑箱 • 微调：数据有限的状态下做性能提升 1 • 应用模板：缩短验证周期 • 组件集市：避免重复造轮子 • 低代码平台：降低创新门槛

18. 三个步骤：提升知识利用效率、辅助知识自动更新学用户 • 多模态非结构化数据的解析多模态文档的显性知识用员工 • 高质量多样性数据的筛选 • 通用大模型的能力剖析 • 领域大模型的高效微调多模态交互助手提示用业务专家的先验知识提示模板 • 专家经验的可配置化 • 幻觉检测与消除专家教学 • 音视频全媒体衔接大数据处理教行为日志中的隐性知识指令数据集领域知识库 • 业务指标数据闭环领域微调 • 人机协作流程设计 • 合规加训数据过滤筛选音视频解析人类反馈

19. 两个算法：打开大模型的黑箱、提升领域专业性 NLP任务定位与协同增益图分层微调与知识注入显性知识领域SFT h jt 独创分层 LoRA l大模型的CT机：打开大模型的 B 1 jt A 1 jt Pre- trained Weights w 0jt B 1 jt A 1 jt … … B i jt A i jt B i jt A i jt … B N jt A N j jt Route w r rjt 黑箱，标注出各类NLP任务在模 Route w r rjt l大模型的精微调算法：通过分层型中的“脑区” j … B N jt A N j jt j LoRA技术，大幅提升微调效果，并且所需数据量更小、算力 B 1 jt A 1 jt … B i jt A i jt … B N jt A N j jt x 更少、学习效率更高。 Route w r rjt j 隐性知识RLHF 基于反馈持续优化迭代 4 3 2 1 data Match Model Rerank Model

20. 基于大模型的企业智能，数据是核心资产通用大模型 • 数据：多样、万亿级 • 算力：万卡天量级 • 策略：预训练，通用领域大模型数据 → 知识 → 资产 • 数据：高质、最小必要 • 算力：十卡天持续学习 • 策略：专业、经济、安全流程提示词智能体直觉系统逻辑系统领域大模型指令数据集领域资料库

21. 知识助手带来的知识应用新范式，打通“最后一公里” ChatPilot大模型知识助手内容抽取/总结文档/数据库问答网络搜索问答智能文档管理唤醒企业知识财富、赋能10亿知识工作者解决时效降低60% 降低人力50% 20%+销售业绩 70+运营效率研发速度提升30+ 检索效率提升50% 数据利用率提升50%

22. 基于知识引擎的金融大模型应用实践 • • • 大模型在金融业务场景下应用的趋势和挑战大模型驱动知识应用新范式基于知识助手基座的大模型金融领域应用实践

23. 基于知识引擎基座的金融场景解决方案投顾助手行情分析产品推荐领域知识方案匹配投后追踪研报助手培训助手推荐话术客情维护材料识别快捷查询模块对练市场趋势分析市场趋势解读客户特点分析多模提取混合模型人机协同学员画像个性脚本智能打分客户需求分析产品反馈分析产品竞争力分析大小模型对话质检资料质检资产组合市场咨询质检助手用户画像金牌话术学习材料研报资料员工画像市场数据法律法规历史结果公司规章历史结果知识引擎多模态数据解析全链路调优工具原子组件全环节模型优化能力沉淀客户 AgentGraph Model hub 多样性模型选择自由组件流程编排数据领域模型工厂场景能力业务场景

24. 投顾助手

25. 基于大模型的智能投顾助手是发展的必然趋势 Ø传统智能投顾助手因技术路线能力天花板较低，基于大模型的智能投顾助手将成为智能投顾行业新范式投顾方式智能投顾基于大模型的智能投顾财务报表等结构化数据除结构化数据外，还包括舆情、金融新闻等非结构化文本包括结构化、非结构化文本数据及音视频等多模态数据数据获取方式金融终端、财报金融终端、数据爬取、信息抽取金融终端、数据爬取、信息抽取、联网搜索数据处理方式专业人员手工分析专业人员手工分析：自然语言处理、知识图谱等人工智能技术支持能够处理大规模、高维度的数据，包括历史市场数据、宏观经济指标、行业报告等。更可控的内容生成人工处理数据，效率较低依靠人工智能在数据处理方面的优势，投研人员在短时间内可以处理大量基础工作，决策效率较高实时分析海量数据，并迅速做出决策，提高了投资决策的效率。更全面的实时数据取决于投研人员自身的专业水平与所掌握的信息积累大量行业及市场数据，通过知识推理辅助决策，提高了决策准确性利用强化学习等技术进行自我优化和迭代，不断提升决策的质量和准确度。更生动的表达形式数据格式决策效率决策准确性传统投顾更专业的投顾建议更强大的语义理解新一代 LLM投顾助手 Ø专业客户经理人数不足，智能投顾行业需求持续上升，推动智能投顾市场规模呈现逐年递增趋势我国2022年市场投资者数量共计21213.62万，而投资顾问人员仅有74570位。理论上计算，每位投资顾问需要服务2943位A股投资者，才能覆盖庞大的客户群体。智能投顾行业随着科技发展近年来用户数量与资产管理规模急剧增加已进入成熟期，预计2027年资产规模将达到4.66万亿美元

26. 后期扩展：AI财富助手 — 买方财富管理业务转型助手，深度KYC、产品学习、资产配置、全周期陪伴客户经理展业获客陪伴 ü行情解读 ü研报精炼 ü资讯播报意图识别 ü投资目标 ü客户偏好 ü交易习惯熟识产品 ü亮点提取 ü话术生成 ü精确筛选投顾服务资产配置学习提升 ü股票咨询 ü产品推荐 ü交易策略 ü投资组合 ü家庭配置 ü养老目标 ü产品培训 ü情景演练 ü素质评测一站式调用财富管理全链路能力，对话交互新范式资产配置引擎知识素材库投研报告资讯新闻统一对话式交互入口产品资料 AI财富助手路演材料 AI中台AgentGraph 流程画布大模型意图识别沟通话术生成产品亮点总结研报新闻综述决策引擎异构模型调度调度引擎 AI组件模型微调客户数据及营销客户标签组合优化回测引擎配置报告智能陪练 Agent小模型合规政策知识掌握能力考核场景模拟客户、产品、员工联动 KYC 埋点数据 Prompt生成收益归因营销行为全量筛选 KYP KYE 产品管理员工绩效推荐话术亮点总结产品销量任务完成业绩绩点

27. 培训助手

28. 知识管理场景——智能陪练 Why 大模型推动AI培训全流程变革语义理解内容生成大模型逻辑推理需求分析与课程设计培训内容生成与知识管理学习效果评估与反馈改进智能教学交互与实践训练数字人智能陪练平台 What 知识泛化培训管理与数据洞察规划总结培训材料大模型、小模型混合模型架构小模型对练优秀导师配置高频、易出错的对话流程，推送学员对练，再通过NLP相似度和关键词等进行实时评分自动生成对练脚本 How 大模型对练根据行业场景设置大模型扮演角色，覆盖面更广，场景更丰富，多轮对话自然流畅，复刻真实对客场景落地效果 40 % 培训时长缩短 31.3 % 过度承诺违规率降低智能数字人陪练 Benefit 9.6 % 客户信息泄露违规率降低某头部金融机构，使用大模型陪练大幅提升新人培训效果

29. 投研助手

30. 投研助手通过分析平台来快速获取所需市场、产品、客户等内外部数据，结合这些数据不仅可以判断市场情况，还能通过对话的方式，让大模型进行市场及投研的分析。市场趋势分析分析师可以询问当前市场的整体趋势和各类关键指标数据,判断市场趋势市场趋势解读借助大模型的领域知识能力,可以帮助分析师,进一步解读当前的市场情况客户特点分析分析师可以通过大模型对客户的会话、行为数据分析,了解当前客户的整体特征客户需求分析分析师可以直接获取到来自一线客户的真实需求,以及需求背后的原因产品反馈分析分析师可以消费者对不同产品不同角度的偏好及具体的产品反馈产品竞争力分析借助大模型对竞品的数据分析,帮助分析师判断产品的市场竞争力

31. 研报分析 -支撑话术生成、报告解读每日批量处理抽取观点抽取关键字研报分析

32. 报告写作场景 — 尽调报告、投研报告目标：基于给定的素材，按照特定的报告模板生成内容，并可在界面内智能的对报告内容进行扩写、润色、续写等功能，辅助员工提升写作效率，减少在写作场景的工作投入。信息输入内容解析 OCR解析：营业执照、财报、身份证、其他各类票据信息，并抽取内容。私域文档内容及观点抽取：合同、分析报告、行研报告内容、观点抽取。公域数据内容及观点抽取：热点资讯、市场行情、企查查信息等。大模型能力内容理解要素抽取内容生成内容生成输出报告 Prompt报告模板训练： 1、文档结构； 2、各部分内容侧重点； 3、内容丰富度。 + 大模型内容补全、生成能力 AI能力（OCR）版面解析信息抽取

33. 质检助手

34. 安全合规场景 — 合规质检 Why 企业安全合规，面临全新挑战 What 新一代合规质检平台多模态素材内容提取混合模型合规排查人机协同内容审核行业通用标准:采用大模型智能检查监管政策日趋严格待检数据量大合规排查文本内容提取提升服务刻不容缓规则不统一素材内容素材要素提取小模型负责声音/画面/素材的基础数据质检, 承担高频易检的场景运行成本低处理速度快结果无偏差大模型质检大模型负责低频难检的内容,以及为质检结果提供判定原因,辅助人工快速复审考虑面更广上下文理解样本依赖小语法检查企业业务标准:使用小模型精准检查禁用信息检查必要信息排查 How 大模型、小模型混合场景训练小模型质检体验评估样式排版检查禁用信息提示必要信息提示人工快速审核 Benefit 落地效果 85 % -98 % 80 % 全量违规检出准确率严重违规质检召回率 1 千倍智能较人工检测效率某头部金融机构，使用混合模型质检平台，全面提升质检效果，大幅降低人工检测成本

35. 合规助手 — 用LLM约束LLM，为大模型应用保驾护航基于大模型能力，将法律法规、行业规范、公司规章等非结构化文本内容构建为质检点，并利用大模型对文本内容、对话内容进行合规监控，构建金融领域完善合规能力。法律法规行业规范公司规范 ChatGLM_Fine tune

36. 中关村科金微信公众号免费试用申请