让 Agent 进化 Agent 企业自动化的新范式构想
如果无法正常显示,请先停止浏览器的去广告插件。
1. 让 Agent 进化 Agent
企业 动化的新范式构想
演讲
互动联合创始
句
:
原
& CTO
2. 我介绍
届校友
3.
4. 录
03
04
05
01
企业级智能体现状
01
“Agent
02
Agent
03
Agent
04
”的提出
核
能
设计
落地挑战与未来展望
模型
5. 01
企业级智能体现状
6. 2025 Agent 的发展
7. 2025 Agent 的发展 向
Coze/Dify Manus/Genspark
上 上
难度
替代了
(执
)
Fancy
灵活的模型编排 松散/ 标准化/通
可控的模型编排 MCP
Tool Use Agentic Workflow
再下
部分替代了脑(策略/决策)
Low
难度低
定义 具
型 具
步?
8. 企业场景中 Agent 落地现状
句话:不落地
9. 企业场景中 Agent 落地现状
10. 企业场景中 Agent 落地现状
句
提供 workflow 编排的平台
企业的任何 Agent 需求
不明
但是企业
以满
具,
过去的业务经验
乎可
提供专属 Prompt Engineer 为企业落地应
但是
也有限,
法满
不限的
尾需求
11. 企业场景中 Agent 落地现状
句
提供 workflow 编排的平台
企业的任何 Agent 需求
”的
提供专属 Prompt Engineer 为企业落地应
但是
也有限,
法满
不限的
尾需求
式,填补了业务和 AI 之间的空缺,真正为企业提供能够落地的 Agent
通过“堆
句
乎可
不明
但是企业
以满
具,
过去的业务经验
12. 企业场景中 Agent 落地现状
有
效率低
要承认,
对于
,实
般来说 fancy
的需求不 fancy,导致内部项 不好推进
个 Agent 落地之后带来的实际效果,难通过数字给客户呈现结果,准确率,回复率这
法证明提升了业务,就
很多时候 Agent 上线之后,企业内部不再关注实际运
个 Agent 的
,可能需要在上线之前,先汇报,过审批,但是
些,最终其实并不能作为业务上的指标,
零迭代
个企业内好的项
的需求不实
难评估
员的想法,变成
feature,需要相当的沟通量,也需要很多的测试反馈,最终才能完成迭代上线
不 fancy
作,就涉及信息传递,就会出现沟通问题,业务
情况
法真的落地
13. 企业场景中 Agent 落地现状
使
频率
AI 客服
AI 销售
企业内的 Agent 情况分布
四象限:
实现难度低
实现难度
AI
案
成
AI 可视化
使
频率低
AI 数据分析
14. 企业 Agent 的下 步是什么?
集中需求
尾需求
普适性需求
定制化需求
15. 企业 Agent 的下 步是什么?
1. 能够 持企业业务 员快速试错
2. 能够 持企业内部 员快速搞定
简单 fancy 的 demo 来得到领
导的
1. 能够不断迭代优化,持续提
业务指标
2. 稳定运
持
3. 能够有数据指标证明效果
前期阶段
后期阶段
16. 02
”的提出
“Agent
17. 什么是 Agent
18. Workflow VS Agentic
诶?等等?Workflow?
Workflow 已死,Agentic 当道
19. Workflow VS Agentic
什么是
Workflow
?什么是
Agentic
?
20. Workflow Agent
21. Agentic Agent
汇总结果
检索历史记录
进
络搜索
22. Workflow VS Agentic
很
乎
Agentic
不稳定,通常
不稳定,通常慢
低
强
23. Workflow VS Agentic
区别:到底谁来做 Plan?是 还是 AI
低
强
24. Workflow VS Agentic
When building applications with LLMs, we recommend finding the simplest solution possible, and only increasing
complexity when needed. This might mean not building agentic systems at all. Agentic systems often trade latency
and cost for better task performance, and you should consider when this tradeoff makes sense.
When more complexity is warranted, workflows offer predictability and consistency for well-defined tasks, whereas
agents are the better option when flexibility and model-driven decision-making are needed at scale. For many
applications, however, optimizing single LLM calls with retrieval and in-context examples is usually enough.
—「Building effective agents」Anthropic
25. Workflow VS Agentic
在使
LLMs 构建应 时,我们建议先从最简单的
建 Agentic 系统。Agentic 系统通常会牺牲
当确实需要更
案
,只在确实需要时才增加复杂性。这可能意味着你根本不需要构
些延迟和成本,来换取更好的任务表现,你应该仔细权衡这种取舍是否划算。
复杂度时,Workflows 在处理界定清晰的任务时,能提供更好的可预测性和
下实现灵活性和模型驱动的决策时,Agentic 则是更好的选择。然 ,对于绝
并在提示词内提供示例的单
LLM 调
已经完全够
多数的应
致性;
来说,优化
当需要在规模化场景
个带有检索
具,
了。
—「Building effective agents」Anthropic
26. Workflow + Agentic
Workflow
+
两个思路并不互斥,
Agentic
者是互补关系
27. Workflow + Agentic
使
场景
Agentic
案
28. Workflow + Agentic
使
场景
Agentic
案
29. 为什么企业需要 Agent
程度降低 Agent 搭建难度和优化难度,不懂 AI 的员
后
己
使
搭建能够解决
优化它
前
使
它
也可以
并不断通过使
极
?
需求的 Agent,
30. 企业场景中 Agent 落地现状
通过 Agent
效率低
不实
Agent
难评估
的 fancy 需求可以 句话底成本完成搭建,直接展示给
板,拿下项
通过数字指标来优化 Agent,过程中不断可以展示出指标的变化趋势,简化效果评
完成,因此企业可以
因为 Agent 的迭代可以完全由
式创建某 场景下的
估
零迭代
程度降低沟通成本,业务同学可以直接对话
Agent 来解决问题
不 fancy
极
乎零成本的不断提
Agent 效果
31. 03
能
核
Agent
模型
32. 如何实现 Agent
?
成
Prompt
完成Agent搭建
33. 如何实现 Agent
模型
完成Agent搭建
成,仅仅通过 Prompt 可解决的问题很少
34. 如何实现 Agent
接收任务
?
叠加能
Function Call
MCP……
不断调试优化
完成 Workflow
Agent搭建
35. 如何实现 Agent
?
❌
叠加能
Function Call
MCP……
接收任务
完成 Workflow
Agent搭建
不断调试优化
法通过反复优化调试完成,核
可靠性
幻觉问题不可避免
36. 如何实现 Agent
?
• Agent
作为 个 Agentic
Agent,执
• Agent
程,可
的可靠性是第 指标
的搭建,是 个系统性
,稳定这两个要求,就需要
更复杂的结构设计
37. 如何确保 Agentic Agent 可靠性?
Cursor 写代码
常好
,但是也有时候不好
我的经历:Cursor 写单测
不好
好
:帮我写这个
:帮我写这个
件对应的单测
件对应的单测,写完之后执
查看结果
单测
38. 如何确保 Agentic Agent 可靠性?
Cursor 写代码
常好
,但是也有时候不好
我的经历:Cursor 写单测
不好
好
:帮我写这个
:帮我写这个
件对应的单测
件对应的单测,写完之后执
单测
查看结果
差异:让 Agent 有
个
动检查任务结果的
查结果能够指向问题所在
段,且检
39. AI 做事,我做 具
40. 如何确保 Agentic Agent 可靠性?
性
具
41. 反思并不断试错是
Agentic 可靠的关键
42. 如何确保 Agentic Agent 可靠性?
我迭代的循环
43. Agent
44. Agent
完成循环迭代
45. 04
设计
Agent
46. Agent
核 模块
测试中
管理测试
调优中
收集线上执
数据统计分析
做流量分发控制不同会话
版本控制 管理流程的每
例进
回归测试
信息,到某
节点的维度
数据打点,收集对话关键数据,并统计
不同的流程,并针对不同流程做统计
个版本,提供 diff 版本的能
根据流程改动要求
可以通过配置,针对流程中特定节点进
成
测试
数据,并能够提供详细的执
A/B 测试
流程
例和测试集,批量执
成新的流程配置的 DSL
对
47. 测试中
步
48. 测试中
深
排查问
49. 调优中
详情,排查问题
,确保未来次次被回归
50. 调优中
在
的作
• Agent
通过调优中 可以感知线上执
情况,筛选出有问题的执
,并针对性应
的
优
化动作
• 同时 Agent
例
试
可以通过调优中
动维护测
51. 数据统计分析
优化
向
52. 数据统计分析
在
的作
• Agent
根据数据分析结果可以定位到可能
存在问题的链路流程,并可以针对性的进
析
效果好坏的反馈
• 数据统计给 Agent
分
53. A/B 测试
对
54. A/B 测试
的作
• Agent
通过 A/B 测试模块,可以对
步继续优化
馈进 式来得到
快速验证,不需要
与的
来的测试性改动进
成出
为参
个效果的反馈,根据这个反
程
在
55. 版本控制
功能
• 对每
次测试性改动的新版本都作为单独的版
本,并能够给不同的版本打标签管理
• 可以给出不同版本的差异
56. 版本控制
在
• Agent
的作
可以通过版本控制模块来管理 成
出来的新测试版本
57. 流程
58. 流程
在
成
的作
• Agent
通过流程 成模块可以直接输
改动
要求后,得到改版后的流程
• 同时在发布版本之前,还可以通过这个模块对
程度提
性
的可 是否存在环等等,最
流程
成的流程做静态检查,节点数据是否参数正确,
流程
成
59. 执
流程
60. 05
落地挑战与未来展望
61. 流程抽象困难
式表达出来,
较
死循环,需要有额外的纠
62. A/B 测试的偏差问题
• 为了最
程度的影响实际
时候需要固定流量在
• 可能因为数据量
个
产,做测试的
产
较
的
偏差数据,导致
不准
可能导致实际效果不如预期
• 进
例
63. Agentic 探索执 路径,Workflow 固化执
• 通过 Agentic 的
完成
式来
主探索
个任务的
式,拿到满意结果之后,将探索出来
的过程转换成
个 Workflow Agent
• 特定报告的撰写
• 需要通过 MCP 读取内部 系列的数据
• 分类型汇总数据
• 每个不同类型做不同的脚本处理
成报告
• 处理后的数据汇总,并
64. Recap
65. Recap
者是互补关系
版本控制
的核
原
性
组件
调优中
A/B 测试
流程
成
具
66. AI 做事,我做 具
67.
68. THANKS
探索 AI 应 边界
Explore the limits of AI applications