Agentic RAG 的现在与未来——从使⽤⼯具到重构知识系统
如果无法正常显示,请先停止浏览器的去广告插件。
1. Agentic RAG 的现在与未来
& CTO
2.
3. 我介绍
4. 那些年,我们做过的 RAG
Retrieval-Augmented Generation(RAG)是当前 LLM 应
中的核
技术之
。
knowledge
chunks
embedding
model
Database
vector
embedding
model
query
context
vector
LLM
answer
offline process
5. 问题上下
重写/指代消除
Agentic RAG 是什么意思
对话内容
LLM
query
Database
context
……
……
……
常
的 RAG 技术都有什么
Agentic RAG……
这个技术是什么意思
LLM
answer
6. 混合检索+检索重排
embedding
model
top-50
vector search
vector
Database
context
keyword search
rerank model
query
LLM
answer
new context
top-10
7. Context is the Key
上下
是关键
8. AI 应 的进步就是
上下 管理的进步
9. Agentic RAG
10. 录
01 Agentic RAG 的基本范式
02 Agentic RAG 的系统架构
03 Agentic RAG 的进化
04 案例分享
05 Q&A
向
11. 01
Agentic RAG 的基本范式
从程序化检索到
性化认知
12. 从过去 AI 发展得到的经验
成
成
次
成
ReAct | COT
快思考 作流
慢思考 Agent
13. 从过去 AI 发展得到的经验
快思考 作流
慢思考 Agent
类的做事
式
14. Agentic RAG 的本质变化
让 AI 完成部分任务
让 AI 完成全部任务:决定如何检索
15. 普通 RAG vs Agentic RAG
较稳定,相对较快
Agentic RAG
动态流程:Agent 具备计划与执
多轮检索策略,可
能
我反思检索效果
Agent 可根据任务主动选择相关 chunk
度可扩展,可接
更多
具和策略
可维护性较弱,Agent 计划不可控,调试和定位问题相对
困难
落地复杂度
,消耗更多 token 和计算资源
响应速度不稳定,根据不同情况时快时慢
16. 场景适配策略与设计考量
场景特征
✅ 1. 根据任务复杂度来判断
使
问题范围明确、问题类型单
、信息集中
问题范围模糊、问题类型不可预测、信息分散
信息特征
✅ 2. 根据信息结构来判断
单
集中化(如内部
异构 + 多源(如
档、规章制度)
、报告、图
对准确率要求不
Agentic RAG:可规划推理、动态检索
、数据库)
策略
普通 RAG 更擅
Agentic RAG 可使
快速定位答案
具理解和串联多种内容
推荐
,成本要求
对准确率和理解
使
普通 RAG:轻量、响应快
使
需求
✅ 3. 根据准确率/成本要求来判断
使
策略
要求
选择 普通 RAG(Fast + Simple)
Agentic RAG 更智能,更精细但成本更
17. 场景适配策略与设计考量
成回答
0.5-1s
1-2s
18. Agentic RAG & 语 通话流程
稍等我查
成
下信息
检索参数
1-2s 等待
LLM
搜索
流式输出
成
token
19. 02
Agentic RAG 的系统架构
从架构搭建到策略调优
20. 系统架构概览
可
21. 系统架构概览
模型
查询
API 接
22. 系统架构概览
联
查询
API 接
23. 具调
不是串联起来的复合功能
,清晰
应
场景
查询、分析结构化数据
获取最新外部知识
读取报告、合同等
档内容
数值计算、代码执
内部系统联动
24. 系统可调参数
• 推理轮数上限(max steps)
• 单任务执
超时时间(timeout seconds)
• 是否开启反思机制(reflection enabled)
• 任务分解策略(ReAct,rule-based)
• 重试限制(retry limit)
• 失败回退策略(cancel,default value)
• 上下
共享策略(context sharing)
25. 当前架构限制
Agent 当下还不够成熟,
些
具调 可能存在参
数错误,调 结果等情
况,造成调
速度慢成本
死循环
死循环
险
26. 03
Agentic RAG 的进化
优化
从问答增强到系统
向
27. 索引期的智能优化
,是怎么管理知识的?
28. 索引期的智能优化
个
录,
29. 索引期的智能优化
通过 Agent
式扩展知识,让整体知识能够被检索
知识
chunk
chunk
chunk
chunk
Agent
概括总结
DB
整体问答 1
整体问答 2
30. 更多
对象。
31. 记忆系统
32. 检索反馈索引的
迭代
如何在 Agentic RAG 体系中引
Pre-Train
预训练
续训练的思路?
Post-Train
后训练
Continuous-Train
续训练
33. 检索反馈索引的
迭代
索引期
embedding
model
knowledge
vector
Database
检索期
embedding
model
vector
context
LLM
query
answer
34. 检索反馈索引的
query
LLM
记总结笔记(异步执
迭代 - 记笔记
tool call
tool
retrieved
data
tool
retrieved
data
tool call
answer
LLM
)
query
LLM
tool call
tool
retrieved
data
tool call
tool
retrieved
data
LLM
Agent
with flag: unreviewed
笔记知识
Database
answer
35. 检索反馈索引的
query
LLM
记过程笔记(异步执
迭代 - 记笔记
tool call
tool
retrieved
data
LLM
知识缺失记录
缓存
tool
retrieved
data
)
Agent
tool call
具数据
Database
answer
36. 04
案例分享
从想法到真实落地
37. 企业报表数据检索
CRM
具查找同期客
38. Recap
39. Recap
40. AI 做事,我做
具
41.
42. THANKS
模型正在重新定义软件
Large Language Model Is Redefining The Software