Vibe Coding 在代码生成和协作过程中的实践与思考

1. Vibe Coding 在代码成和协作过程中的实践与思考向邦宇巴巴级技术专家阿

2.

3. 录 01 Vibe Coding 产品形态 02 Vibe Coding 在阿内部的发展现状 03 户在 Vibe Coding 过程中遇到的挑战 04 Vibe Coding 产品身遇到的挑战 05 积极适配和拥抱国产开源模型 06 未来已来

4. 01 Vibe Coding 产品形态不同类型的产品

5. 不同 Vibe Coding Cli 命令具

6. 不同类型的产品都有发展具的使 02 在内部Vibe Coding

7. 向阿主要在

8. 阿

9. 具为常的事情也在开始被探索和实现

10. 02 户遇到了些挑战户视看技术和产品发展的问题

11. 陷户会因为AI的表现不所以崩溃

12. 我们看到的Vibe Coding的问题是多的成本户敞开使

13. AI 不同场景下成的代码格和质量差异较对于复杂业务逻辑的边界情况处理不够完善成的代码往往缺乏针对性的性能优化容易导致SQL注类漏洞，供应链攻击和硬编码导致信息泄露

14. AI 成的代码质量问题

15. AI 的代码实现过程中会实现洽 // 例1: 数组去重函数 - 实现和测试都不完善 function removeDuplicates(arr) { // AI可能选择简单的Set 案但不考虑兼容性 return [...new Set(arr)]; } 单测是来保证代码质量是否按预期执的重要阶段 // 对应的测试 - 忽略了边缘情况 function testRemoveDuplicates() { const arr = [1, 2, 2, 3]; const expected = [1, 2, 3]; const result = removeDuplicates(arr); 但如果单测和业务代码都是由AI来完成可能会出现单测和代码洽的情况 // 表看起来没问题，但实际上有很多隐藏问题 console.assert(result.length === expected.length); console.assert(JSON.stringify(result) === JSON.stringify(expected)); // // // // } 但是AI没考虑到的问题： 1. 对象数组的去重 2. NaN的处理 3. 保持原顺序的重要性

16. 程序员在使成以及缺乏对代码整体的理解必然导致调试困难 Vibe Coding 盒代码具时，调试时间增加30%-50% 成 AI 成的代码就像魔法，作时很神奇，出问题时完全不知道从 1 上下理解的局限缺乏全局思维，代码模块化程度不够，代码耦合度，测试覆盖不够，增加了维护困难缺乏可追溯性，和对次性量代码，不知道哪步出了问题，也就不知道回滚 2 的局限步到哪成了具的使越来越盒技术债务可能越来越深，调试难度和复杂性越来越何下盒代码 3 建设具对代码仓库整体的理解如Repo Wiki等合理的如每法应该是使步都要求他进版本控制 commit 具

17. Vibe Coding 志

18. 户体验能法准确理解不，户意图，需要反复确认法维持期上下对话具，浏览器，编辑器，Terminal 作，在Agent模式和Copilot模式之间摇摆问题的投诉有两百

19. Vibe Coding的成本企，使得没有边际效应，不存在就成本就越低的的效应，当前最流户规模越们都不得不为活下去努努的产品压缩成本

20. 产品 03 身也遇到的挑战不同类型的产品

21. 产品的演进导致模型成本越来越

22. Vibe Coding 产品本身还处于摸索阶段具间切 3 碎个对话框往往不知道该做什么，产品户真实的需求化产品设计在通具体验和垂直之间摇摆

23. 险，会成为攻击者利能定安全主的探索和执 AI 驱动的Coding 具具有具存在 Vibe Coding 使的具

24. 04 Agent 建设过程中的不同类型的产品些经验

25. All In One 的架构会导致成本的急剧上升户对效果不满意

26. 需要建设可靠的知识质量体系

27. Agent 对上下记忆的处理的个核 Agent 任务的成败取决于上下管理的成败，写，提取，压缩和隔离是上下隔离的核内容信息输入写入 Write 短期记忆 Short-Term Memory 工作记忆上下文窗口内⻓期记忆 Long-Term Memory 向量/图数据库跨会话持久化选择 Select 递归摘要 MemGPT架构检索增强生成 RAG 语义搜索压缩 Compress 高级文档分块重排序机制过滤式压缩内容提取式压缩多维度优化隔离 Isolate 需要优化技术案例 Mem0, MemGPT Claude Code 核心目标 Windsurf, Google ADK VertexAiRagMemoryService LLMLingua 20x压缩 JSON to Markdown 63%节省 OpenAI Swarm Amazon Bedrock 语义分块嵌入模型检测交叉编码器深度交互评分 LLMChainFilter 相关性判断 LLMChainExtractor 摘要生成语法层压缩语义层压缩语用层压缩信息持久化临时存储精准检索相关信息 Token效率窗口适配错误隔离污染防护功能模块隔离 Worker⻆色 Orchestrator⻆色环境隔离沙盒执行命名空间隔离 AI Agent处理优化结果反馈上下文质量评估满足要求任务执行完成

28. 包容不确定性，也要满户不同的期待 + Core Tools ! 1. 基础具 (6个) - 任务管理和基本交互 2. 件操作 (8个) - 读写编辑和管理件 3. 终端控制 (5个) - 命令和执监控 4. 浏览器动化 (11个) - 浏览和交互 5. 机云 (12个) - 虚拟设备控制和测试 6. 多媒体 (5个) - 图像和频处理 7. 开发具 (7个) - 代码开发和部署 8. 协作具 (5个) - 团队协作和集成 9. 级功能 (1个) - 并执优化 10. 络搜索 (2个) - 信息和资源获取 ⚡ 主要功能群组基础工具 6个工具 ( 高级功能 1个工具 " 协作工具 5个工具 * 文件操作 8个工具网络搜索 2个工具 # & 终端控制 5个工具 ' $ 开发工具 7个工具浏览器自动化 11个工具 % 手机云 12个工具多媒体 5个工具

29. 成本控制是永恒的话题

30. 05 积极适配和拥抱国产开源模型不同类型的产品

31. 国外SOTA闭源模型存在许多险 P 贵隐私问题复杂问题的tokens往往很能让Agent运闭源模型往往是闭源的的模型往往很贵国外闭源 SOTA模型存在多重问题 A 被限流被降智 SOTA模型往往也会倾向于存在合规 D 备案国外模型如果要做产品险问题向C端险户使需要有备案，国外模型还不 C 持

32. 国产模型在链路任务下还存在死循环问题使得 Agent 容易陷执某种死循环，某个shell指令，反复打开某个 2 如反复些问题指令遵循问题 3 在件达百万的tokens上下被遵循和执，尤其是下，某些命令法模型没有训练到过的场景，例如发布或者监控以及运维 1 格式遵循能的的问题如出现xml标签格式不准确，前后法匹配等，会导致法被正确解析整体任务容易失败。json格式不对等问题。全局智能问题国产模型普遍在任务全局理解问题上还存在 Secondary title plac eholder 常不 4 些缺陷，容易陷结果存在较 tokens 步看步的情况，导致随机性，且会消耗较多的

33. 适配开源模型过程中做了哪些努明显的逻辑错误导致的限重复，完全没有进展或状限循环；式动补

34. 适配开源模型过程中做了哪些努（2）

35. 适配开源模型过程中做了哪些努（2）

36. 具格式动修复

37. 国产模型在产品上的些实现在适配国产模型上的些实践

38. 使

39. 在架构上更多的创新 Agent AS Tool 等理念来代替部分主 Agent 的智能 Agent之前，主Agent需要频繁去做所有的琐事越来越，任务执成功率越来越低，效果也不好在没有使使得上下使

40. 内部的技术成果开放给外部户使未来我们也会持续把我们内部的技术开放贡献给社区

41.

42. THANKS Vibe Coding 在代码实践与思考向邦宇阿巴巴成和协作过程中的