智谱 RAG 技术的探索与实践

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1. RAG在智能客服领域 探索与实践 大模型商业技术中心 / 高级技术总 监 • 柴思远
2.
3. CONTENT • • • • RAG综述 智谱RAG方案 RAG实践 未来展望
4. 01 RAG综述
5. RAG是大模型落地最多的场景 行业 大模型应用场景调研 外部客服 24 文档撰写 20 图像生成 20 数据处理和分析 汽车 零售 9 辅助编程 • 客户服务与支持:通过RAG,客户可以咨询车辆功能、维护、最新技术或政策法规相关信息。 • 工程师研发:工程师利用RAG结合LLM检索技术文档、研究论文和专利信息,加速新技术研发。 • 销售辅助:销售人员通过RAG检索最新车辆数据和市场趋势,为潜在买家提供个性化车型推荐 • 智能客服:结合RAG的LLM提供24/7客户服务,快速检索产品信息。 • 销售培训:利用RAG搜索相关资料,进行销售培训。 • 自动化产品描述:LLM自动生成吸引人的产品描述和营销文案,RAG检索产品规格和用户评价,确保 信息准确性和吸引力。 • 音乐与电影推荐:LLM结合用户喜好和历史数据,生成个性化音乐播放列表或电影推荐;RAG实时 检索最新音乐和电影数据库,确保推荐时效性和多样性。 14 内部知识库 具体应用场景 文娱 • 互动式娱乐:在游戏或虚拟现实体验中,LLM作为虚拟角色AI与用户自然对话,RAG检索用户与角 色间经历,丰富互动体验。 • 粉丝互动:明星或品牌官方平台使用结合RAG的LLM回答粉丝问题,提供最新新闻和活动信息,提 升粉丝参与度和忠诚度。 8 • 智能客服:结合RAG的LLM提供24/7客户服务,快速检索金融产品信息,提供个性化服务与支持。 视频相关场景 其他 外部客服 内部知识库 金融 7 • 文献检索与分析:研究人员利用结合RAG的LLM检索医学文献和研究报告,分析数据,发现新研究线 索和趋势。 6 文档撰写 辅助编程 • 保险销售辅助:RAG检索保险理赔条款,助力快速推动产品销售。 图像生成 视频相关场景 数据处理和分析 其他 医疗 • 虚拟健康助手:结合RAG的LLM回答患者健康相关问题,提供个性化健康建议,检索最新医疗研究信 息,教育患者。 • 症状评估:LLM分析患者症状描述,RAG检索医疗知识库,提供诊断和治疗方案。
6. 什么是RAG • 索引(Indexing) • 检索(Retrieval) • 生产(Generation)
7. RAG的优势 减少模型的生成幻觉 知识及时更新 避免人工整理FAQ 增加了答案推理 增加内容生成的可追溯性 增加问答知识范围的管理权限
8. RAG VS long context 模型 文本长度 价格 200k Input:$15/M tokens Output:$75/M tokens GPT4-turbo 128k Input:$10/M tokens Output:$30/M tokens GLM-4 128k ¥0.1/K tokens ERNIE-4.0 128k ¥0.12/K tokens 关键因素:成本 以GPT4为例:针对一篇20w字的小说提 Claude Opus 问: • Long context,20w字全部输入给模 型大约需要9元。 • RAG,大约只需要召回的6*600个字输 入给模型,大约只需要0.25元。 moonshot-v1 128k ¥0.06/K tokens
9. 02 智谱RAG方案
10. 技术方案全景 文件解析 文件上传 剔除无关信息 切片 识别目录、标题 等 文章类型 匹配规则 构建索引 切片长度 query索引 small to big query改写 用户提问 query拆解 query拓展 语义补全 LLM 排序 prompt模板 rerank模型 路由 向量化 多路召回 输出答案 语义检索 关键词检索 数据库
11. 文档解析&切片 文章内容解析 1. 图片——改写成特定标识符 2. 表格——改写成模型易于理解的html格式 3. 页眉页脚——过滤无关信息 文章结构切片 1. 目录&标题——提取文档结构信息 2. 序列——确保知识的连续我完整
12. small to big 问题 • Embedding模型本身有窗口限制,文档切片过大而导致检索信 息不准确 方案 • 递归检索在原始文档切片基础上,扩展了更多粒度更小的文档 切片。检索文档时如果检索到粒度细致的切片,会递归检索到 其原始大切片,然后再将原始节点做为检索结果提交给 LLM。
13. 解决方案全景 对话窗口 历史消息 输入提示 问答 应用 知识 构建 图文混排 原文查看 问答对话 意图理解 知识 运营 原文引用 多轮对话 拟人化 无知识拒答 知识类型 切片管理 索引管理 数据运营 文档增删查 切片配置 索引生成 对话日志 知识修改 切片修改 索引修改 数据评测 上传 解析 切片 索引
14. 【知识运营】索引工具 问题 • 无法快速修正召回bad case • 用户的问题描述会更加口语化,召回效果会比较差 方案 • 为切片增加索引,索引的创建方式可以有很多种,比如用大 模型抽取切片可以回答的问题,抽取切片适用的业务场景 等,抽取的索引与用户的问题越相近,召回的概率越高,运 营人员也根据bad case修正索引
15. 【问答应用】输入推荐 问题 • 用户的问题往往是发散的、不可控的,那么最终效果也将不 可控 方案 • suggestion不仅可以降低用户输入成本,更主要的是可以规 范用户输入内容,规范用户输入内容后效果更可控
16. 【问答应用】原文引用 问题 • 大模型即使杜撰了内容,用户也很难发现,此时用户往往很 难建立信任 方案 • 在用户提问的时候,我们在给出回答的基础上可以给用户展 示出引用的知识来源,以此来获取用户信任
17. 【问答应用】图文混排 问题 • 知识中往往有很多图文内容,去掉图片内容,就失去了重要 的意思 方案 • 在大模型回答的时候,可以给用户展示出知识中的图片,以 此来提升答案的满足度
18. 【应用】三种常见的落地类型 【应用】三种常见的落地类型 落地 方式 特点 long context 单篇文档、知识种类 多、覆盖面广 快速体验 应用 场景 使用 方式 RAG知识库 精度要求高 可溯源 知识数量庞大、交叉严重 幻觉控制 精度要求高 幻觉控制 专业性强 原文相似度要求高 阅读助手 行政问答 培训对联 电商客服问答 保险政策问答 车书问答 学习助手 坐席助手 ... 公共事务问答 制造设备问答 旅游景点咨询 个人使用 企业对内赋能 企业toc提供服务
19. 【应用】个人使用-论文分析 痛点 通用性、兼容性要求高 覆盖面广,各类文档上传 快速体验 需要总结、对比、翻译、 问答
20. 【应用】企业内部赋能-行政问答 痛点 企业的行政、财务、IT政策 对内部员工提供服务耗费人 力 传统方案理解较差,无法 很好解决员工疑问,导致人 工处理成本无法释放
21. 【应用】企业内部赋能-牧业问答 痛点 • 每天工作过程经常需要翻阅资 料,确保操作合理,翻阅过程繁 养殖员诉求 • 高效学习大量的养殖相关知识,包括奶牛护理、喂养、看病等等 动物学知识 营养知识 繁殖知识 • 简单快速地搜索到相关养殖知识,处理实际遇到的各类问题 设施管理 琐,占用较多时间。 疾病管理和预防 • 传统方案不利于工人查询,工人 更习惯于使用自然语言描述自己 解决方案 遇到的问题。 • 工人查询的知识专业性较高,基 知识库建立 Prompt搭建 于大模型本身的知识无法给出准 确回答。 小范围试验 效果调试 上线使用 Q:我的一头奶牛最近食欲下降,且体重也在减轻,应该 怎样解决? A:这有可能是很多疾病的症状,但具体判断需要根据其 他一些具体症状。例如,如果牛呼吸困难,这可能是肺 炎;如果有腹泻,可能是消化系统问题。 请联系兽医进行评估,在此期间,确保牛有足够的食物和 清洁的水,并且尝试将病牛与健康牛隔离,以防止疾病的 传播。
22. 03 RAG实践
23. 【场景介绍】公共事务客服问答场景 传统方案 • 对话引擎(脚本编排) • 文档引擎(检索系统)
24. 【场景痛点】政策内容繁琐 1.知识整理成本 高 \ • FAQ知识梳理 • 每个问题富集大量相似问 • 容易知识遗漏 2.知识复用性差 \ • 不同城市重复梳理 3.知识更新频繁 \ • 频繁更新FAQ库 • 重新更新FAQ知识分类和逻辑 4.知识晦涩难懂 实行“反向开票”的资源回收企业(包括单位 和个体工商户,下同),应当符合以下三项条 件之一,且实际从事资源回收业务: (一)从事危险废物收集的,应当符合国 家危险废物经营许可证管理办法的要求,取得 危险废物经营许可证; (二)从事报废机动车回收的,应当符合 国家商务主管部门出台的报废机动车回收管理 办法要求,取得报废机动车回收拆解企业资质 认定证书; (三)除危险废物、报废机动车外,其他 资源回收企业应当符合国家商务主管部门出台 的再生资源回收管理办法要求,进行经营主体 登记,并在商务部门完成再生资源回收经营者 备案。 三、自然人销售报废产品连续12个月“反 向开票”累计销售额超过500万元的,资源回 收企业不得再向其“反向开票”。资源回收企 业应当引导持续从事报废产品出售业务的自然 人依法办理经营主体登记,按照规定自行开具 发票。 四、资源回收企业需要“反向开票”的, 应当向主管税务机关提交《资源回收企业“反 向开票”申请表》(附件1),并提供危险废 物经营许可证或报废机动车回收拆解企业资质 认定证书或商务部门再生资源回收经营者备案 登记证明。 \ • 政策文本晦涩难懂 • 需要人工解读,对客服要求很 高
25. 【场景痛点】交互拟人度低 FAQ命中率不高 引导生硬 无法理解上下文 你好,我能用我老婆的公积金贷款吗? 北京小汽车摇号是什么时候 我身份证丢了,能办临时身份证上车吗 抱歉,客服没有理解您的意思,请您简 短描述您想要咨询的问题。比如: 公积金贷款 公积金提取 公积金缴存 如果想要咨询人工请点击 转人工 请您点击要咨询的具体业务: 北京小汽车摇号受理时间 北京小汽车指标政策 猜您还想了解 北京小汽车指标配置办理渠道 小客车指标配置 对于乘坐火车的情况,如果您没有携带 身份证,可以到火车站的公安制证窗口 办理临时身份证明。制证人员会根据您 提供的相关信息录入系统,制作临时身 份证明卡,并加盖公章。有了这张临时 身份证明,您就可以购买火车票并乘坐 火车。 可以用配偶的公积金贷款吗? 居住证办理的条件有哪些? 咋补办呢? 请您点击要咨询的具体业务: 如何办理北京市居住证? 线上申请北京市居住证 抱歉,客服不理解您的意思,您可以详 细描述您的问题。 猜您想问: 身份证如何补办? 居住证如何办理? 你是不是想问: 本地公积金贷款条件 公积金贷款条件 输入 输入 输入 只能提供既定答案 我是高级钳工,能申请多少技能证书补 贴? 您好,参加失业保险1年以上的企业 在职职工或领取失业保险金人员取得 技能人员职业资格证书或职业技能等 级证书的,可按照初级(五级)不超 过1000元、中级(四级)不超过 1500元、高级(三级)不超过2000 元的标准申请技能提升补贴。每人每 年享受补贴次数最多不超过三次,同 一职业(工种)同一等级只能申请并 享受一次,且技能提升补贴和职业培 训补贴不得重复享受;已享受同一职 业(工种)高级别证书技能提升补贴 的,不再享受低级别证书补贴。实施 上述技能提升补贴政策的省(自治 区、直辖市),上年度失业保险基金 滚存结余备付期限应在1年以上。 输入
26. 【技术挑战1】知识召回 通用embedding 用户问题口语化严重,知识专业度高严重 场景embedding 问题:我去年已经离职了,上一家公司给我交了5年公积金, 现在是自己干,我是个人交的公积金,需要满足什么条件? 知识: 十一、灵活就业人员 (一)灵活就业个人账户设立及转移 1、办理条件 (1)本市行政区域内参加住房公积金制度的灵活就业人员, 包括个体工商户及其雇工和自由职业者两类。 …… 2、办理材料 …… 3、办理流程 …… 常规切片方案 简单embedding 知识信息密度大、且条款关联度高 知识相似性极高、窗口长度有些 利用文章结构切片、small2big的索引 关键词搜索+reranking 问题1:城市铁路有哪些特殊的交通规定? 问题2:100万以上城市如何规划铁路布局? 问题:民法典第208条规定是什么? 知识: 一、 城市交通布局规定 (一)通用规定 XXXXX (二)机场特殊规定 xxxxxx (三)铁路特殊规定 1. 规划人口规模 100 万及以上的城市,应根据城市空间 布局和对外联系方向均衡布局铁路客运站;其他城市的铁 路客运站宜根据城市空间布局和铁路线网合理设置。 2. 高、快速铁路主要客站应布置在中心城区内…… 3. 城际铁路客运站应靠近…… 4. 承担城市通勤的铁路…… 5. 铁路货运场站应与城市产业布局相协调…… 6. 铁路编组站、动车段(所)等设施…… 知识:民法典 第二编 物 权 xxxx 第二百零七条 国家、集体、私人的物权和其他权利人的物 权受法律平等保护,任何组织或者个人不得侵犯。 第二百零八条 不动产物权的设立、变更、转让和消灭,应 当依照法律规定登记。动产物权的设立和转让,应当依照法 律规定交付。 第二章 物权的设立、变更、转让和消灭 第一节 不动产登记 xxxx 行政法规规定。 第二百一十一条 当事人申请登记,应当根据不同登记事项 提供权属证明和不动产界址、面积等必要材料。
27. 微调数据构造 直接使用用户query召回知识库片段 使用query召回知识片段的摘要,构 建摘要和知识片段之间的映射关系 Query vs Original Query vs Query Query vs Summary F-Answer vs Original 使用用户的query召回query(自动化 从对应的知识片段中抽取query) 根据用户的query生成fake answer,去 召回知识片段
28. 【Embedding微调】模型测试与选择 不同Embedding模型测试与选择 100.0% 核心结论 95.0% 90.0% u微调对于效果提升很明显 85.0% 微调后Top5召回效果均提升10-20个点。 80.0% u智谱自研模型效果较好 微调前bge-m3 取得最好的结果,这得益于 75.0% 它较大的输入长度 70.0% 微调后TOP5召回达到100%。 65.0% u微调之后模型效果差异缩小 60.0% 微调后top5召回差异在1个点之内。 55.0% u参数规模的影响比较小 50.0% 微调前 微调后 zhipu-v2(564M) bge-M3(530M) bge-small-zh-v1.5(24M) m3e-small(24M) bge-large-zh-v1.5(302M)
29. 【rerank模型】方案选择 rerank 方案对比 核心结论 100% 100% 96% 95% 90% u微调对于效果提升很明显 u大参数模型效果更优 85% 80% 80% 79% 75% 70% 65% 60% 55% 50% 微调前 bge-reranker-base(270M) 微调后 bge-reranker-large(550)
30. 【技术挑战2】答案生成 数据标注难度大 问答有较多回复类型 知识晦涩,易混淆 回答、反问、拒答、相关知识 需要精准区分正确内容 让模型来润色答案 需要分别构造数据并训练 DPO 问题:个人所得税最高不超过多少? 问题:我想问下医保如何报销? 问题:医保报销范围 知识:个人所得税比例: 个人所得税最高不得超过......... 知识:…… 知识: 1.医保报销范围:xx疾病,xx疾病 2.医保可报销的城市范围:北京市、上海市、 xx市 业务专家不懂模型需要什么数据 标准答案:您好!个人所得税最高不得超过......... 润色答案: 您好!关于您提到的个人所得税限制问题,根据相关 政策规定,个人所得税最高......希望对您有所帮助, 如有其他问题,请随时联系我们。 反问:不同城市及不同类型的医保有不同的报销 方式,请问您所在的城市与购买的医保类型是什 么? 问题:APP无法更新怎么办? 知识:APP下载可访问官网进行下载, 下载链 接:http://xxxxxx 拒答:您好,无法更新可能有多种情况,因暂无 相关知识,无法为您直接提供答案。 建议您可以 重新下载APP,下载APP可访问http://xxxxxx 正确答案:医保一般可报范围包括xx疾病、xx 疾病 混淆答案:医保可以在以下几个城市进行报 销。
31. 数据构造:原则 数据要求 通常情况下,提供更多的高质量训练数据,微调效果越好。反之,如果训练数据中存在问题、瑕疵,将对微调效果产生一定的负面影 数据格式 响。 数据质量评价标准 数据集要求 一致性:阅读回复后能感觉到完全理解了指令,则满足一致性. 数据规模:提供数百条高质量的训练数据,数据经过人工 正确性:若回复里面出现了前后矛盾 (逻辑不能自洽),则不满足正确性。 校验。 有帮助性:站在用户角度,答案是否有用,该评价较为主观。 数据分布:根据业务目标,构造和调整各类细分任务场景 流畅性:回答的自然程度或流畅程度 的训练数据量分布,尽量覆盖业务场景所有可能的数据样 有害性:提问或者回答内容包含不恰当、不健康、危险、政治敏感或不道德的信 本。 息。这些信息可能会对读者造成负面影响,
32. 数据构造:业务覆盖度 精答 • 三级标题以下的知识点,直接可回答 • 直接可答 • 场景问题,推理可答 • 三级标题以下知识点,内容相关不能直接回答 问题,给出相关的知识 【问题】拆迁安置住房要提供哪些材料? 【知识】 (五)购买拆迁安置住房提取 1、办理条件 xxxxx 2、办理要件 (1)身份证件原件(居民身份证或台湾居民来往内地通行证 或港澳居民来往内地通行证)...... 【答案】 您好,如果您因购买拆迁安置房需要提取公积金,需要以下材 料: 1. 身份证件原件(居民身份证或台湾居民来往内地通行证或 港澳居民来往内地通行证) 2. 拆迁协议原件...... 请您准备好以上材料,前往公积金中心或指定的提取银行网点 办理提取业务。如有其他问题,请随时联系我们,我们将竭诚 为您服务。 拒答 • 无关话题拒答,闲聊的 • 包含部分知识可答 • 完全不包含拒答 • 业务区域错误 • 包含知识,业务要求拒答 • 操作类/查询类/计算类/对比类/原因类 【问题】 提取承诺书无法下载 【知识】六、其他提取业务 (一)公积金提取附则 **** (二)法院扣划 **** (三)提取查询 **** (四)可线上办理提取情形 **** 【答案】根据苏州公积金政策业务逻辑,用户的提问属于 操作类问题,因为用户询问的是提取承诺书无法下载的问 题,这属于在APP、微信公众号、单位及个人网上营业厅、 小程序、支付宝等移动端及互联网端业务操作中遇到的问 题。根据业务逻辑,这类问题属于拒答类型,因此我无法 回答用户的问题。 反问 • 一级二级知识点,需要反问 【问题】买卖住房提取可以不 【知识】 一、购房提取 (1)购买新房提取 ... (2)购买二手房提取 ... (3)购买公有住房产权提取 ... ...... 【答案】 尊敬的用户,您好!关于您提到的买卖住房提取公积 金的问题,根据我国相关政策,购买住房是可以提取 公积金的。具体的提取条件和流程会根据您所购买的 房型有所不同。目前,我们支持以下几种购房提取方 式: 1. 购买新房提取 2. 购买二手房提取 3. 购买公有住房产权提取 ......
33. 数据构造:COT 串联型:基于背景知识直接回答 问题 背景知识 答案 (五)个人所得税补缴 1、办理条件 xxxxx 根据中国现行的个人所得税相关规定,补缴个人所得税时,纳税人通常需要准备以下材料: 2、办理要件 (1)身份证件原件(居民身份证或台湾居民来往内地通行证或港澳 1.身份证明:通常需要提供身份证原件及复印件,用于验证纳税人的身份。 补缴个人所得税需要提 居民来往内地通行证),(2)银行账户信息:用于转账缴纳税款, 2.银行账户信息:用于转账缴纳税款,需提供开户银行、账户名称、账号等信息。 供什么材料 需提供开户银行、账户名称、账号等信息(3)收入证明:包括工资、 3.收入证明:包括工资、薪金所得的工资单、奖金单等,个体工商户的生产、经营所得的账簿、 薪金所得的工资单、奖金单等,个体工商户的生产、经营所得的账 凭证等,以及各种稿酬、特许权使用费等所得的合同或协议。 簿、凭证等,以及各种稿酬、特许权使用费等所得的合同或协议, 4.费用扣除证明:包括符合税法规定的各种扣除项目,如子女教育、继续教育、大病医疗等专项 (4)费用扣除证明:包括符合税法规定的各种扣除项目,如子女教 附加扣除的证明材料。 育、继续教育、大病医疗等专项附加扣除的证明材料。 xxxxx
34. 数据构造:COT 因果关系:因为..所以..,由...可以得出... 等 问题 背景知识 答案 七、可提取类型 职工有下列情形之一的,可以申请提取本人住房公积金帐户内的存储余额: 1、住房消费类提取 xxxxx 孩子上学能提取吗 2、销户提取 xxxxx 3、其他提取情形 xxxxxx 4、除以上情形,其他方式均不可办理提取业务。 您好!目前公积金政策中,可提取的情形有如下几种...... , 从内容中可看出, 孩子上 学并不属于可以提取公积金的范畴, 所以不能提取公积金。
35. 数据构造:COT 逻辑推理: 推理拒答、反问或者相关知识 问题 背景知识 答案 很抱歉, 根据我所了解的知识不能回答您的问题, 如果您有其他的问题欢迎 产权证号是哪个 无相关知识 补交的养老金什么时候才能进 (一)单位补缴:...... 您好!补缴有两种类型,您未确认是哪种具体的类型,请问您确认是单位补缴 个人账户 (二)个别补缴:...... 还是个别补缴? 您提问。
36. 数据构造:润色 润色原则 润色前 您好,根据“购买二手房提取”政策,符合以下条件的即可办理: (1)提取有效期:在契税完税证明开具一年内可以办理购房提取,(2)职工购买二手房申 请公积金贷款的,为了不影响公积金贷款放款额度,需要等到贷款放款后才能提取公积金, (3)购买非住宅类性质的房屋.公寓以及小产权房均不得提取住房公积金,(4)购买外地 二手房是否可以提取需要以大厅审核结果为准,需要职工配合大厅出具其他所需材料,(5) 材料齐全后办理即可。 • 流畅性: 语言严谨、通常、自然,符合客服的话术风格。 • 多样性: 人工标注数据会受限于个人知识储备, 标注的答案很难避免多余单一、 多样性 较差。 校验方式 1. 长度限制: 比较润色前后长度差是否在合理范围内, 长度约束可过滤掉, 生成过短、过 润色后 长等问题。 2. 相似性过滤:在某些特殊情况下, 即使长度限制符合要求,内容也会有所不同,所以采用 您好,根据相关政策规定,在苏州购买二手房是可以提取公积金的。具体办理条 件如下: 1. 提取有效期:在契税完税证明开具一年内可以办理购房提取。 2. 职工购买二手房申请公积金贷款的,为了不影响公积金贷款放款额度,需要等 到贷款放款后才能提取公积金。 3. 购买非住宅类性质的房屋、公寓以及小产权房均不得提取住房公积金。 4. 购买外地二手房是否可以提取需要以公积金中心审核结果为准,需要职工配合 公积金中心出具其他所需材料。 5. 材料齐全后即可办理。 请您在办理时确保符合以上条件,并准备好相关材料。如有其他问题,请随时联 系我们。祝您购房顺利! 向量、 hash等方式对内容一致性做进一步的限制。 润色前后准确率对比 100% 95% 90% 85% 80% 75% 70% 65% 60% 83.2% 76.0% 润色前 润色后
37. 数据构造:噪声 原始文档 增加噪音 增加知识混淆 不同数量的知识 不同顺序的知识 易混淆的知识 KnowA KnowB KnowA KnowB KnowC KnowA' KnowC KnowA KnowB KnowA KnowB
38. 数据构造:自动泛化 通过大模型自动构造数据,提升模型的泛化能力和鲁棒性。 方 法 •通过多prompt、temperture,topp参数调高、随机选择等手段,等保障输出内容的多样性。 •通过大模型对比标准答案,相似性技术等手段保障正确性。 单prompt 多prompt 作为一名客服话术专家,你的任务是优化客服的回应,使其更具专业 身为客服话术专家,你的主要职责是优化客服的交流方式,使其更具有 性、条理性、礼貌性,并具有良好的格式。 逻辑性、专业性和礼貌性,同时保持格式优美。 用户提问: 用户咨询: {query} {query} 原始客服回复: 原始客服解答: {ans} {ans} 请你对客服的原始回应进行复述和优化,保持原有的内容和主要词汇不 请你对原始的客服解答进行复述和提升,内容和主要词汇应保持不变, 变,专注于客服话术和业务逻辑的润色,同时美化回答格式。 重点在于润色客服话术和业务逻辑,同时优化回答的格式。 给出润色后的客服回答。
39. 训练方法1:分阶段训练 综合训练方案 open source train data base model SFT stage 1 vitercal domain train data SFT stage 2 manual annotation train datal SFT stage 3 final model
40. 训练方法2:DPO 训练思路 对 SFT 数据集进行推理 筛选出存在差异的样本作为负例 保证样本均衡例
41. 训练方法4:DPO DPO策略 DPO用于训练模型学习数据偏序的能力, 使模型 可以高概率生成高质量结果, 低概率生成低质 量结果。 优化策略1: 负样本动态调权 在训练过程中根据负样本的优化程度,对负样 本进行加权,以实现动态调节负样本的梯度影 响,实现稳定训练。 优化策略2: 正负样本平滑 原始 DPO 训练失败的原因在于对负样本的过度 拟合,对此我们使用如下方式分别正负样本的优 化曲线进行平滑处理,消除训练过程中对负样本 的过度优化问题
42. 训练结果:先提升数据质量,再提升数据量 100% 95% 90% 85% 80% 75% 70% 65% 60% 55% 50% 人工标注数据 润色数据+dpo 数据泛化+多阶段
43. 04 未来展望
44. 技术展望 复杂表格识别 多表头、合并单元格等识别 图表识别 流程图、鱼骨图等图表的识别 图文问答 用户输入图片,对图片进行理解并检索知识库回答 仪表盘这个亮了,是怎么回事 根据图片内容,如果在行车途中机油报警灯常亮, 可能是机油量低于标准值,这时需尽快为爱车添 加机油,避免因继续行驶对发动机造成磨损。另 外还有重点检查一下发动机有没有漏油的现象, 如果存在要马上进行维修。 输入
45. 场景展望 学习助手 让学习回归到一问一答的原 始模式 记忆助手 采集助手 帮助个人、家庭、团体记录下 所有的沟通,并且基于这些记 忆辅助大家沟通 学会调研的方法,基于一个 问题来去收集信息,并总结 答案
46. 大模型+搜索增强是大模型时代的新计算机,大模型类似于计算机的CPU,互联网 实时信息与企业完整知识库共同构成了大模型时代的硬盘。 王小川
47.
48.

Home - Wiki
Copyright © 2011-2024 iteam. Current version is 2.138.0. UTC+08:00, 2024-12-22 09:08
浙ICP备14020137号-1 $Map of visitor$