让 Agent 进化 Agent 企业自动化的新范式构想

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1. 让 Agent 进化 Agent 企业 动化的新范式构想 演讲 互动联合创始 句 : 原 & CTO
2. 我介绍 届校友
3.
4. 录 03 04 05 01 企业级智能体现状 01 “Agent 02 Agent 03 Agent 04 ”的提出 核 能 设计 落地挑战与未来展望 模型
5. 01 企业级智能体现状
6. 2025 Agent 的发展
7. 2025 Agent 的发展 向 Coze/Dify Manus/Genspark 上 上 难度 替代了 (执 ) Fancy 灵活的模型编排 松散/ 标准化/通 可控的模型编排 MCP Tool Use Agentic Workflow 再下 部分替代了脑(策略/决策) Low 难度低 定义 具 型 具 步?
8. 企业场景中 Agent 落地现状 句话:不落地
9. 企业场景中 Agent 落地现状
10. 企业场景中 Agent 落地现状 句 提供 workflow 编排的平台 企业的任何 Agent 需求 不明 但是企业 以满 具, 过去的业务经验 乎可 提供专属 Prompt Engineer 为企业落地应 但是 也有限, 法满 不限的 尾需求
11. 企业场景中 Agent 落地现状 句 提供 workflow 编排的平台 企业的任何 Agent 需求 ”的 提供专属 Prompt Engineer 为企业落地应 但是 也有限, 法满 不限的 尾需求 式,填补了业务和 AI 之间的空缺,真正为企业提供能够落地的 Agent 通过“堆 句 乎可 不明 但是企业 以满 具, 过去的业务经验
12. 企业场景中 Agent 落地现状 有 效率低 要承认, 对于 ,实 般来说 fancy 的需求不 fancy,导致内部项 不好推进 个 Agent 落地之后带来的实际效果,难通过数字给客户呈现结果,准确率,回复率这 法证明提升了业务,就 很多时候 Agent 上线之后,企业内部不再关注实际运 个 Agent 的 ,可能需要在上线之前,先汇报,过审批,但是 些,最终其实并不能作为业务上的指标, 零迭代 个企业内好的项 的需求不实 难评估 员的想法,变成 feature,需要相当的沟通量,也需要很多的测试反馈,最终才能完成迭代上线 不 fancy 作,就涉及信息传递,就会出现沟通问题,业务 情况 法真的落地
13. 企业场景中 Agent 落地现状 使 频率 AI 客服 AI 销售 企业内的 Agent 情况分布 四象限: 实现难度低 实现难度 AI 案 成 AI 可视化 使 频率低 AI 数据分析
14. 企业 Agent 的下 步是什么? 集中需求 尾需求 普适性需求 定制化需求
15. 企业 Agent 的下 步是什么? 1. 能够 持企业业务 员快速试错 2. 能够 持企业内部 员快速搞定 简单 fancy 的 demo 来得到领 导的 1. 能够不断迭代优化,持续提 业务指标 2. 稳定运 持 3. 能够有数据指标证明效果 前期阶段 后期阶段
16. 02 ”的提出 “Agent
17. 什么是 Agent
18. Workflow VS Agentic 诶?等等?Workflow? Workflow 已死,Agentic 当道
19. Workflow VS Agentic 什么是 Workflow ?什么是 Agentic ?
20. Workflow Agent
21. Agentic Agent 汇总结果 检索历史记录 进 络搜索
22. Workflow VS Agentic 很 乎 Agentic 不稳定,通常 不稳定,通常慢 低 强
23. Workflow VS Agentic 区别:到底谁来做 Plan?是 还是 AI 低 强
24. Workflow VS Agentic When building applications with LLMs, we recommend finding the simplest solution possible, and only increasing complexity when needed. This might mean not building agentic systems at all. Agentic systems often trade latency and cost for better task performance, and you should consider when this tradeoff makes sense. When more complexity is warranted, workflows offer predictability and consistency for well-defined tasks, whereas agents are the better option when flexibility and model-driven decision-making are needed at scale. For many applications, however, optimizing single LLM calls with retrieval and in-context examples is usually enough. —「Building effective agents」Anthropic
25. Workflow VS Agentic 在使 LLMs 构建应 时,我们建议先从最简单的 建 Agentic 系统。Agentic 系统通常会牺牲 当确实需要更 案 ,只在确实需要时才增加复杂性。这可能意味着你根本不需要构 些延迟和成本,来换取更好的任务表现,你应该仔细权衡这种取舍是否划算。 复杂度时,Workflows 在处理界定清晰的任务时,能提供更好的可预测性和 下实现灵活性和模型驱动的决策时,Agentic 则是更好的选择。然 ,对于绝 并在提示词内提供示例的单 LLM 调 已经完全够 多数的应 致性; 来说,优化 当需要在规模化场景 个带有检索 具, 了。 —「Building effective agents」Anthropic
26. Workflow + Agentic Workflow + 两个思路并不互斥, Agentic 者是互补关系
27. Workflow + Agentic 使 场景 Agentic 案
28. Workflow + Agentic 使 场景 Agentic 案
29. 为什么企业需要 Agent 程度降低 Agent 搭建难度和优化难度,不懂 AI 的员 后 己 使 搭建能够解决 优化它 前 使 它 也可以 并不断通过使 极 ? 需求的 Agent,
30. 企业场景中 Agent 落地现状 通过 Agent 效率低 不实 Agent 难评估 的 fancy 需求可以 句话底成本完成搭建,直接展示给 板,拿下项 通过数字指标来优化 Agent,过程中不断可以展示出指标的变化趋势,简化效果评 完成,因此企业可以 因为 Agent 的迭代可以完全由 式创建某 场景下的 估 零迭代 程度降低沟通成本,业务同学可以直接对话 Agent 来解决问题 不 fancy 极 乎零成本的不断提 Agent 效果
31. 03 能 核 Agent 模型
32. 如何实现 Agent ? 成 Prompt 完成Agent搭建
33. 如何实现 Agent 模型 完成Agent搭建 成,仅仅通过 Prompt 可解决的问题很少
34. 如何实现 Agent 接收任务 ? 叠加能 Function Call MCP…… 不断调试优化 完成 Workflow Agent搭建
35. 如何实现 Agent ? ❌ 叠加能 Function Call MCP…… 接收任务 完成 Workflow Agent搭建 不断调试优化 法通过反复优化调试完成,核 可靠性 幻觉问题不可避免
36. 如何实现 Agent ? • Agent 作为 个 Agentic Agent,执 • Agent 程,可 的可靠性是第 指标 的搭建,是 个系统性 ,稳定这两个要求,就需要 更复杂的结构设计
37. 如何确保 Agentic Agent 可靠性? Cursor 写代码 常好 ,但是也有时候不好 我的经历:Cursor 写单测 不好 好 :帮我写这个 :帮我写这个 件对应的单测 件对应的单测,写完之后执 查看结果 单测
38. 如何确保 Agentic Agent 可靠性? Cursor 写代码 常好 ,但是也有时候不好 我的经历:Cursor 写单测 不好 好 :帮我写这个 :帮我写这个 件对应的单测 件对应的单测,写完之后执 单测 查看结果 差异:让 Agent 有 个 动检查任务结果的 查结果能够指向问题所在 段,且检
39. AI 做事,我做 具
40. 如何确保 Agentic Agent 可靠性? 性 具
41. 反思并不断试错是 Agentic 可靠的关键
42. 如何确保 Agentic Agent 可靠性? 我迭代的循环
43. Agent
44. Agent 完成循环迭代
45. 04 设计 Agent
46. Agent 核 模块 测试中 管理测试 调优中 收集线上执 数据统计分析 做流量分发控制不同会话 版本控制 管理流程的每 例进 回归测试 信息,到某 节点的维度 数据打点,收集对话关键数据,并统计 不同的流程,并针对不同流程做统计 个版本,提供 diff 版本的能 根据流程改动要求 可以通过配置,针对流程中特定节点进 成 测试 数据,并能够提供详细的执 A/B 测试 流程 例和测试集,批量执 成新的流程配置的 DSL 对
47. 测试中 步
48. 测试中 深 排查问
49. 调优中 详情,排查问题 ,确保未来次次被回归
50. 调优中 在 的作 • Agent 通过调优中 可以感知线上执 情况,筛选出有问题的执 ,并针对性应 的 优 化动作 • 同时 Agent 例 试 可以通过调优中 动维护测
51. 数据统计分析 优化 向
52. 数据统计分析 在 的作 • Agent 根据数据分析结果可以定位到可能 存在问题的链路流程,并可以针对性的进 析 效果好坏的反馈 • 数据统计给 Agent 分
53. A/B 测试 对
54. A/B 测试 的作 • Agent 通过 A/B 测试模块,可以对 步继续优化 馈进 式来得到 快速验证,不需要 与的 来的测试性改动进 成出 为参 个效果的反馈,根据这个反 程 在
55. 版本控制 功能 • 对每 次测试性改动的新版本都作为单独的版 本,并能够给不同的版本打标签管理 • 可以给出不同版本的差异
56. 版本控制 在 • Agent 的作 可以通过版本控制模块来管理 成 出来的新测试版本
57. 流程
58. 流程 在 成 的作 • Agent 通过流程 成模块可以直接输 改动 要求后,得到改版后的流程 • 同时在发布版本之前,还可以通过这个模块对 程度提 性 的可 是否存在环等等,最 流程 成的流程做静态检查,节点数据是否参数正确, 流程 成
59. 执 流程
60. 05 落地挑战与未来展望
61. 流程抽象困难 式表达出来, 较 死循环,需要有额外的纠
62. A/B 测试的偏差问题 • 为了最 程度的影响实际 时候需要固定流量在 • 可能因为数据量 个 产,做测试的 产 较 的 偏差数据,导致 不准 可能导致实际效果不如预期 • 进 例
63. Agentic 探索执 路径,Workflow 固化执 • 通过 Agentic 的 完成 式来 主探索 个任务的 式,拿到满意结果之后,将探索出来 的过程转换成 个 Workflow Agent • 特定报告的撰写 • 需要通过 MCP 读取内部 系列的数据 • 分类型汇总数据 • 每个不同类型做不同的脚本处理 成报告 • 处理后的数据汇总,并
64. Recap
65. Recap 者是互补关系 版本控制 的核 原 性 组件 调优中 A/B 测试 流程 成 具
66. AI 做事,我做 具
67.
68. THANKS 探索 AI 应 边界 Explore the limits of AI applications

Home - Wiki
Copyright © 2011-2025 iteam. Current version is 2.146.0. UTC+08:00, 2025-10-19 11:04
浙ICP备14020137号-1 $Map of visitor$