让 Agent 进化 Agent 企业自动化的新范式构想

1. 让 Agent 进化 Agent 企业动化的新范式构想演讲互动联合创始句：原 & CTO

2. 我介绍届校友

3.

4. 录 03 04 05 01 企业级智能体现状 01 “Agent 02 Agent 03 Agent 04 ”的提出核能设计落地挑战与未来展望模型

5. 01 企业级智能体现状

6. 2025 Agent 的发展

7. 2025 Agent 的发展向 Coze/Dify Manus/Genspark 上上难度替代了（执） Fancy 灵活的模型编排松散/ 标准化/通可控的模型编排 MCP Tool Use Agentic Workflow 再下部分替代了脑（策略/决策） Low 难度低定义具型具步？

8. 企业场景中 Agent 落地现状句话：不落地

9. 企业场景中 Agent 落地现状

10. 企业场景中 Agent 落地现状句提供 workflow 编排的平台企业的任何 Agent 需求不明但是企业以满具，过去的业务经验乎可提供专属 Prompt Engineer 为企业落地应但是也有限，法满不限的尾需求

11. 企业场景中 Agent 落地现状句提供 workflow 编排的平台企业的任何 Agent 需求 ”的提供专属 Prompt Engineer 为企业落地应但是也有限，法满不限的尾需求式，填补了业务和 AI 之间的空缺，真正为企业提供能够落地的 Agent 通过“堆句乎可不明但是企业以满具，过去的业务经验

12. 企业场景中 Agent 落地现状有效率低要承认，对于，实般来说 fancy 的需求不 fancy，导致内部项不好推进个 Agent 落地之后带来的实际效果，难通过数字给客户呈现结果，准确率，回复率这法证明提升了业务，就很多时候 Agent 上线之后，企业内部不再关注实际运个 Agent 的，可能需要在上线之前，先汇报，过审批，但是些，最终其实并不能作为业务上的指标，零迭代个企业内好的项的需求不实难评估员的想法，变成 feature，需要相当的沟通量，也需要很多的测试反馈，最终才能完成迭代上线不 fancy 作，就涉及信息传递，就会出现沟通问题，业务情况法真的落地

13. 企业场景中 Agent 落地现状使频率 AI 客服 AI 销售企业内的 Agent 情况分布四象限：实现难度低实现难度 AI 案成 AI 可视化使频率低 AI 数据分析

14. 企业 Agent 的下步是什么？集中需求尾需求普适性需求定制化需求

15. 企业 Agent 的下步是什么？ 1. 能够持企业业务员快速试错 2. 能够持企业内部员快速搞定简单 fancy 的 demo 来得到领导的 1. 能够不断迭代优化，持续提业务指标 2. 稳定运持 3. 能够有数据指标证明效果前期阶段后期阶段

16. 02 ”的提出 “Agent

17. 什么是 Agent

18. Workflow VS Agentic 诶？等等？Workflow？ Workflow 已死，Agentic 当道

19. Workflow VS Agentic 什么是 Workflow ？什么是 Agentic ？

20. Workflow Agent

21. Agentic Agent 汇总结果检索历史记录进络搜索

22. Workflow VS Agentic 很乎 Agentic 不稳定，通常不稳定，通常慢低强

23. Workflow VS Agentic 区别：到底谁来做 Plan？是还是 AI 低强

24. Workflow VS Agentic When building applications with LLMs, we recommend finding the simplest solution possible, and only increasing complexity when needed. This might mean not building agentic systems at all. Agentic systems often trade latency and cost for better task performance, and you should consider when this tradeoff makes sense. When more complexity is warranted, workflows offer predictability and consistency for well-defined tasks, whereas agents are the better option when flexibility and model-driven decision-making are needed at scale. For many applications, however, optimizing single LLM calls with retrieval and in-context examples is usually enough. —「Building effective agents」Anthropic

25. Workflow VS Agentic 在使 LLMs 构建应时，我们建议先从最简单的建 Agentic 系统。Agentic 系统通常会牺牲当确实需要更案，只在确实需要时才增加复杂性。这可能意味着你根本不需要构些延迟和成本，来换取更好的任务表现，你应该仔细权衡这种取舍是否划算。复杂度时，Workflows 在处理界定清晰的任务时，能提供更好的可预测性和下实现灵活性和模型驱动的决策时，Agentic 则是更好的选择。然，对于绝并在提示词内提供示例的单 LLM 调已经完全够多数的应致性；来说，优化当需要在规模化场景个带有检索具，了。 —「Building effective agents」Anthropic

26. Workflow + Agentic Workflow + 两个思路并不互斥， Agentic 者是互补关系

27. Workflow + Agentic 使场景 Agentic 案

28. Workflow + Agentic 使场景 Agentic 案

29. 为什么企业需要 Agent 程度降低 Agent 搭建难度和优化难度，不懂 AI 的员后己使搭建能够解决优化它前使它也可以并不断通过使极？需求的 Agent，

30. 企业场景中 Agent 落地现状通过 Agent 效率低不实 Agent 难评估的 fancy 需求可以句话底成本完成搭建，直接展示给板，拿下项通过数字指标来优化 Agent，过程中不断可以展示出指标的变化趋势，简化效果评完成，因此企业可以因为 Agent 的迭代可以完全由式创建某场景下的估零迭代程度降低沟通成本，业务同学可以直接对话 Agent 来解决问题不 fancy 极乎零成本的不断提 Agent 效果

31. 03 能核 Agent 模型

32. 如何实现 Agent ？成 Prompt 完成Agent搭建

33. 如何实现 Agent 模型完成Agent搭建成，仅仅通过 Prompt 可解决的问题很少

34. 如何实现 Agent 接收任务？叠加能 Function Call MCP…… 不断调试优化完成 Workflow Agent搭建

35. 如何实现 Agent ？ ❌ 叠加能 Function Call MCP…… 接收任务完成 Workflow Agent搭建不断调试优化法通过反复优化调试完成，核可靠性幻觉问题不可避免

36. 如何实现 Agent ？ • Agent 作为个 Agentic Agent，执 • Agent 程，可的可靠性是第指标的搭建，是个系统性，稳定这两个要求，就需要更复杂的结构设计

37. 如何确保 Agentic Agent 可靠性？ Cursor 写代码常好，但是也有时候不好我的经历：Cursor 写单测不好好：帮我写这个：帮我写这个件对应的单测件对应的单测，写完之后执查看结果单测

38. 如何确保 Agentic Agent 可靠性？ Cursor 写代码常好，但是也有时候不好我的经历：Cursor 写单测不好好：帮我写这个：帮我写这个件对应的单测件对应的单测，写完之后执单测查看结果差异：让 Agent 有个动检查任务结果的查结果能够指向问题所在段，且检

39. AI 做事，我做具

40. 如何确保 Agentic Agent 可靠性？性具

41. 反思并不断试错是 Agentic 可靠的关键

42. 如何确保 Agentic Agent 可靠性？我迭代的循环

43. Agent

44. Agent 完成循环迭代

45. 04 设计 Agent

46. Agent 核模块测试中管理测试调优中收集线上执数据统计分析做流量分发控制不同会话版本控制管理流程的每例进回归测试信息，到某节点的维度数据打点，收集对话关键数据，并统计不同的流程，并针对不同流程做统计个版本，提供 diff 版本的能根据流程改动要求可以通过配置，针对流程中特定节点进成测试数据，并能够提供详细的执 A/B 测试流程例和测试集，批量执成新的流程配置的 DSL 对

47. 测试中步

48. 测试中深排查问

49. 调优中详情，排查问题，确保未来次次被回归

50. 调优中在的作 • Agent 通过调优中可以感知线上执情况，筛选出有问题的执，并针对性应的优化动作 • 同时 Agent 例试可以通过调优中动维护测

51. 数据统计分析优化向

52. 数据统计分析在的作 • Agent 根据数据分析结果可以定位到可能存在问题的链路流程，并可以针对性的进析效果好坏的反馈 • 数据统计给 Agent 分

53. A/B 测试对

54. A/B 测试的作 • Agent 通过 A/B 测试模块，可以对步继续优化馈进式来得到快速验证，不需要与的来的测试性改动进成出为参个效果的反馈，根据这个反程在

55. 版本控制功能 • 对每次测试性改动的新版本都作为单独的版本，并能够给不同的版本打标签管理 • 可以给出不同版本的差异

56. 版本控制在 • Agent 的作可以通过版本控制模块来管理成出来的新测试版本

57. 流程

58. 流程在成的作 • Agent 通过流程成模块可以直接输改动要求后，得到改版后的流程 • 同时在发布版本之前，还可以通过这个模块对程度提性的可是否存在环等等，最流程成的流程做静态检查，节点数据是否参数正确，流程成

59. 执流程

60. 05 落地挑战与未来展望

61. 流程抽象困难式表达出来，较死循环，需要有额外的纠

62. A/B 测试的偏差问题 • 为了最程度的影响实际时候需要固定流量在 • 可能因为数据量个产，做测试的产较的偏差数据，导致不准可能导致实际效果不如预期 • 进例

63. Agentic 探索执路径，Workflow 固化执 • 通过 Agentic 的完成式来主探索个任务的式，拿到满意结果之后，将探索出来的过程转换成个 Workflow Agent • 特定报告的撰写 • 需要通过 MCP 读取内部系列的数据 • 分类型汇总数据 • 每个不同类型做不同的脚本处理成报告 • 处理后的数据汇总，并

64. Recap

65. Recap 者是互补关系版本控制的核原性组件调优中 A/B 测试流程成具

66. AI 做事，我做具

67.

68. THANKS 探索 AI 应边界 Explore the limits of AI applications