Agentic RAG 的现在与未来——从使⽤⼯具到重构知识系统

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1. Agentic RAG 的现在与未来 & CTO
2.
3. 我介绍
4. 那些年,我们做过的 RAG Retrieval-Augmented Generation(RAG)是当前 LLM 应 中的核 技术之 。 knowledge chunks embedding model Database vector embedding model query context vector LLM answer offline process
5. 问题上下 重写/指代消除 Agentic RAG 是什么意思 对话内容 LLM query Database context …… …… …… 常 的 RAG 技术都有什么 Agentic RAG…… 这个技术是什么意思 LLM answer
6. 混合检索+检索重排 embedding model top-50 vector search vector Database context keyword search rerank model query LLM answer new context top-10
7. Context is the Key 上下 是关键
8. AI 应 的进步就是 上下 管理的进步
9. Agentic RAG
10. 录 01 Agentic RAG 的基本范式 02 Agentic RAG 的系统架构 03 Agentic RAG 的进化 04 案例分享 05 Q&A 向
11. 01 Agentic RAG 的基本范式 从程序化检索到 性化认知
12. 从过去 AI 发展得到的经验 成 成 次 成 ReAct | COT 快思考 作流 慢思考 Agent
13. 从过去 AI 发展得到的经验 快思考 作流 慢思考 Agent 类的做事 式
14. Agentic RAG 的本质变化 让 AI 完成部分任务 让 AI 完成全部任务:决定如何检索
15. 普通 RAG vs Agentic RAG 较稳定,相对较快 Agentic RAG 动态流程:Agent 具备计划与执 多轮检索策略,可 能 我反思检索效果 Agent 可根据任务主动选择相关 chunk 度可扩展,可接 更多 具和策略 可维护性较弱,Agent 计划不可控,调试和定位问题相对 困难 落地复杂度 ,消耗更多 token 和计算资源 响应速度不稳定,根据不同情况时快时慢
16. 场景适配策略与设计考量 场景特征 ✅ 1. 根据任务复杂度来判断 使 问题范围明确、问题类型单 、信息集中 问题范围模糊、问题类型不可预测、信息分散 信息特征 ✅ 2. 根据信息结构来判断 单 集中化(如内部 异构 + 多源(如 档、规章制度) 、报告、图 对准确率要求不 Agentic RAG:可规划推理、动态检索 、数据库) 策略 普通 RAG 更擅 Agentic RAG 可使 快速定位答案 具理解和串联多种内容 推荐 ,成本要求 对准确率和理解 使 普通 RAG:轻量、响应快 使 需求 ✅ 3. 根据准确率/成本要求来判断 使 策略 要求 选择 普通 RAG(Fast + Simple) Agentic RAG 更智能,更精细但成本更
17. 场景适配策略与设计考量 成回答 0.5-1s 1-2s
18. Agentic RAG & 语 通话流程 稍等我查 成 下信息 检索参数 1-2s 等待 LLM 搜索 流式输出 成 token
19. 02 Agentic RAG 的系统架构 从架构搭建到策略调优
20. 系统架构概览 可
21. 系统架构概览 模型 查询 API 接
22. 系统架构概览 联 查询 API 接
23. 具调 不是串联起来的复合功能 ,清晰 应 场景 查询、分析结构化数据 获取最新外部知识 读取报告、合同等 档内容 数值计算、代码执 内部系统联动
24. 系统可调参数 • 推理轮数上限(max steps) • 单任务执 超时时间(timeout seconds) • 是否开启反思机制(reflection enabled) • 任务分解策略(ReAct,rule-based) • 重试限制(retry limit) • 失败回退策略(cancel,default value) • 上下 共享策略(context sharing)
25. 当前架构限制 Agent 当下还不够成熟, 些 具调 可能存在参 数错误,调 结果等情 况,造成调 速度慢成本 死循环 死循环 险
26. 03 Agentic RAG 的进化 优化 从问答增强到系统 向
27. 索引期的智能优化 ,是怎么管理知识的?
28. 索引期的智能优化 个 录,
29. 索引期的智能优化 通过 Agent 式扩展知识,让整体知识能够被检索 知识 chunk chunk chunk chunk Agent 概括总结 DB 整体问答 1 整体问答 2
30. 更多 对象。
31. 记忆系统
32. 检索反馈索引的 迭代 如何在 Agentic RAG 体系中引 Pre-Train 预训练 续训练的思路? Post-Train 后训练 Continuous-Train 续训练
33. 检索反馈索引的 迭代 索引期 embedding model knowledge vector Database 检索期 embedding model vector context LLM query answer
34. 检索反馈索引的 query LLM 记总结笔记(异步执 迭代 - 记笔记 tool call tool retrieved data tool retrieved data tool call answer LLM ) query LLM tool call tool retrieved data tool call tool retrieved data LLM Agent with flag: unreviewed 笔记知识 Database answer
35. 检索反馈索引的 query LLM 记过程笔记(异步执 迭代 - 记笔记 tool call tool retrieved data LLM 知识缺失记录 缓存 tool retrieved data ) Agent tool call 具数据 Database answer
36. 04 案例分享 从想法到真实落地
37. 企业报表数据检索 CRM 具查找同期客
38. Recap
39. Recap
40. AI 做事,我做 具
41.
42. THANKS 模型正在重新定义软件 Large Language Model Is Redefining The Software

Home - Wiki
Copyright © 2011-2025 iteam. Current version is 2.147.0. UTC+08:00, 2025-10-29 03:48
浙ICP备14020137号-1 $Map of visitor$