Vibe Coding 在代码生成和协作过程中的实践与思考

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1. Vibe Coding 在代码 成和协作过 程中的实践与思考 向邦宇 巴巴 级技术专家 阿
2.
3. 录 01 Vibe Coding 产品形态 02 Vibe Coding 在阿 内部的发展现状 03 户在 Vibe Coding 过程中遇到的挑战 04 Vibe Coding 产品 身遇到的挑战 05 积极适配和拥抱国产开源模型 06 未来已来
4. 01 Vibe Coding 产品形态 不同类型的产品
5. 不同 Vibe Coding Cli 命令 具
6. 不同类型的产品都有发展 具的使 02 在内部Vibe Coding
7. 向阿 主要在
8. 阿
9. 具为 常 的事情也在开始被探索和实现
10. 02 户遇到了 些挑战 户视 看技术和产品发展的问题
11. 陷 户会因为AI的表现不 所以 崩溃
12. 我们看到的Vibe Coding的问题是多 的成本 户敞开使
13. AI 不同场景下 成的代码 格和质量差异较 对于复杂业务逻辑的边界情况处理不够完善 成的代码往往缺乏针对性的性能优化 容易导致SQL注 类漏洞,供应链攻击和硬编码导致信息泄露
14. AI 成的代码质量问题
15. AI 的代码实现过程中会实现 洽 // 例1: 数组去重函数 - 实现和测试都不完善 function removeDuplicates(arr) { // AI可能选择简单的Set 案但不考虑兼容性 return [...new Set(arr)]; } 单测是 来保证代码质量 是否按预期执 的重要阶段 // 对应的测试 - 忽略了边缘情况 function testRemoveDuplicates() { const arr = [1, 2, 2, 3]; const expected = [1, 2, 3]; const result = removeDuplicates(arr); 但如果单测和业务代码都是由AI来完成 可能会出现单测和代码 洽的情况 // 表 看起来没问题,但实际上有很多隐藏问题 console.assert(result.length === expected.length); console.assert(JSON.stringify(result) === JSON.stringify(expected)); // // // // } 但是AI没考虑到的问题: 1. 对象数组的去重 2. NaN的处理 3. 保持原顺序的重要性
16. 程序员在使 成以及缺乏对代码整体的理解必然导致调试困难 Vibe Coding 盒代码 具时,调试时间增加30%-50% 成 AI 成的代码就像 魔法, 作时很神奇,出问题时完全不知道从 1 上下 理解的局限 缺乏全局思维,代码模块化程度不够,代码耦合度 ,测试覆盖 不够,增加了维护困难 缺乏可追溯性,和对 次性 量代码,不知道哪 步出了问题,也就不知道回滚 2 的局限 步 到哪 成了 具的使 越来越 盒 技术债务可能越来越深,调试难度和复杂性越来 越 何下 盒代码 3 建设 具对代码仓库整体的理解 如Repo Wiki等 合理的 如每 法应该是使 步都要求他进 版本控制 commit 具
17. Vibe Coding 志
18. 户体验 能 法准确理解 不 , 户意图,需要反复确认 法维持 期上下 对话 具,浏览器,编辑器,Terminal 作,在Agent模式和Copilot模式之间摇摆 问题的投诉有两百
19. Vibe Coding的成本 企,使得 没有边际效应,不存在 就成本就越低的的效应,当前最流 户规模越 们都不得不为活下去 努 努 的产品 压缩成本
20. 产品 03 身也遇到的挑战 不同类型的产品
21. 产品的演进导致模型成本越来越
22. Vibe Coding 产品本身还处于摸索阶段 具间切 3 碎 个对话框往往不知道该做什么,产品 户真实的需求 化 产品设计在通 具体验 和垂直之间摇摆
23. 险 ,会成为攻击者利 能 定安全 主的探索和执 AI 驱动的Coding 具具有 具存在 Vibe Coding 使 的 具
24. 04 Agent 建设过程中的 不同类型的产品 些经验
25. All In One 的架构会导致成本的急剧上升 户对效果不满意
26. 需要建设可靠的知识质量体系
27. Agent 对上下 记忆的处理的 个核 Agent 任务的成败取决于上下 管理的成败, 写 ,提取,压缩和 隔离是上下 隔离的核 内容 信息输入 写入 Write 短期记忆 Short-Term Memory 工作记忆 上下文窗口内 ⻓期记忆 Long-Term Memory 向量/图数据库 跨会话持久化 选择 Select 递归摘要 MemGPT架构 检索增强生成 RAG 语义搜索 压缩 Compress 高级文档分块 重排序机制 过滤式压缩 内容提取式压缩 多维度优化 隔离 Isolate 需要优化 技术案例 Mem0, MemGPT Claude Code 核心目标 Windsurf, Google ADK VertexAiRagMemoryService LLMLingua 20x压缩 JSON to Markdown 63%节省 OpenAI Swarm Amazon Bedrock 语义分块 嵌入模型检测 交叉编码器 深度交互评分 LLMChainFilter 相关性判断 LLMChainExtractor 摘要生成 语法层压缩 语义层压缩 语用层压缩 信息持久化 临时存储 精准检索 相关信息 Token效率 窗口适配 错误隔离 污染防护 功能模块隔离 Worker⻆色 Orchestrator⻆色 环境隔离 沙盒执行 命名空间隔离 AI Agent处理 优化结果反馈 上下文质量评估 满足要求 任务执行完成
28. 包容不确定性,也要满 户不同的期待 + Core Tools ! 1. 基础 具 (6个) - 任务管理和基本交互 2. 件操作 (8个) - 读写编辑和管理 件 3. 终端控制 (5个) - 命令 和执 监控 4. 浏览器 动化 (11个) - 浏览和交互 5. 机云 (12个) - 虚拟设备控制和测试 6. 多媒体 (5个) - 图像和 频处理 7. 开发 具 (7个) - 代码开发和部署 8. 协作 具 (5个) - 团队协作和集成 9. 级功能 (1个) - 并 执 优化 10. 络搜索 (2个) - 信息和资源获取 ⚡ 主要功能群组 基础工具 6个工具 ( 高级功能 1个工具 " 协作工具 5个工具 * 文件操作 8个工具 网络搜索 2个工具 # & 终端控制 5个工具 ' $ 开发工具 7个工具 浏览器自动化 11个工具 % 手机云 12个工具 多媒体 5个工具
29. 成本控制是永恒的话题
30. 05 积极适配和拥抱国产开源模型 不同类型的产品
31. 国外SOTA闭源模型存在许多 险 P 贵 隐私问题 复杂问题的tokens往往很 能让Agent运 闭源模型往往是闭源的 的模型往往很贵 国外闭源 SOTA模型存 在多重问题 A 被限流被降智 SOTA模型往往也会倾向于 存在合规 D 备案 国外模型如果要 做产品 险问题 向C端 险 户使 需要有备案,国外模型还不 C 持
32. 国产模型在 链路任务下还存在 死循环问题 使得 Agent 容易陷 执 某种死循环, 某个shell指令,反复打开某个 2 如反复 些问题 指令遵循问题 3 在 件 达百万的tokens上下 被遵循和执 ,尤其是 下,某些命令 法 模型没有训练到过的 场景,例如发布或者监控以及运维 1 格式遵循能 的 的问题 如出现xml标签格式不准确,前后 法匹配等,会导致 法被正确解析整体任务容 易失败。json格式不对等问题。 全局智能问题 国产模型普遍在任务全局理解问题上还存在 Secondary title plac eholder 常 不 4 些缺陷,容易陷 结果存在较 tokens 步看 步的情况,导致 随机性,且会消耗 较多的
33. 适配开源模型过程中做了哪些努 明显的逻辑错误导致的 限重复,完全没有进展或状 限循环; 式 动补
34. 适配开源模型过程中做了哪些努 (2)
35. 适配开源模型过程中做了哪些努 (2)
36. 具格式 动修复
37. 国产模型在产品上的 些实现 在适配国产模型上的 些实践
38. 使
39. 在架构上更多的创新 Agent AS Tool 等理念来代替 部分主 Agent 的智能 Agent之前,主Agent需要频繁去做所有的琐事 越来越 ,任务执 成功率越来越低,效果也不好 在没有使 使得上下 使
40. 内部的技术成果开放给外部 户使 未来我们也会持续把我们内部的技术开放贡献给社区
41.
42. THANKS Vibe Coding 在代码 实践与思考 向邦宇 阿 巴巴 成和协作过程中的

Home - Wiki
Copyright © 2011-2025 iteam. Current version is 2.147.1. UTC+08:00, 2025-11-03 05:13
浙ICP备14020137号-1 $Map of visitor$