Vibe Coding 在代码生成和协作过程中的实践与思考
如果无法正常显示,请先停止浏览器的去广告插件。
        
                1. Vibe Coding 在代码 成和协作过
程中的实践与思考
向邦宇
巴巴
级技术专家
阿            
                        
                2.             
                        
                3. 录
01 Vibe Coding 产品形态
02 Vibe Coding 在阿 内部的发展现状
03
户在 Vibe Coding 过程中遇到的挑战
04 Vibe Coding 产品 身遇到的挑战
05 积极适配和拥抱国产开源模型
06 未来已来            
                        
                4. 01
Vibe Coding 产品形态
不同类型的产品            
                        
                5. 不同 Vibe Coding
Cli 命令
具            
                        
                6. 不同类型的产品都有发展
具的使
02
在内部Vibe Coding            
                        
                7. 向阿
主要在            
                        
                8. 阿            
                        
                9. 具为
常
的事情也在开始被探索和实现            
                        
                10. 02
户遇到了 些挑战
户视
看技术和产品发展的问题            
                        
                11. 陷
户会因为AI的表现不
所以
崩溃            
                        
                12. 我们看到的Vibe Coding的问题是多
的成本
户敞开使            
                        
                13. AI
不同场景下
成的代码
格和质量差异较
对于复杂业务逻辑的边界情况处理不够完善
成的代码往往缺乏针对性的性能优化
容易导致SQL注
类漏洞,供应链攻击和硬编码导致信息泄露            
                        
                14. AI
成的代码质量问题            
                        
                15. AI 的代码实现过程中会实现 洽
// 例1: 数组去重函数 - 实现和测试都不完善
function removeDuplicates(arr) {
// AI可能选择简单的Set 案但不考虑兼容性
return [...new Set(arr)];
}
单测是 来保证代码质量
是否按预期执 的重要阶段
// 对应的测试 - 忽略了边缘情况
function testRemoveDuplicates() {
const arr = [1, 2, 2, 3];
const expected = [1, 2, 3];
const result = removeDuplicates(arr);
但如果单测和业务代码都是由AI来完成
可能会出现单测和代码 洽的情况
// 表 看起来没问题,但实际上有很多隐藏问题
console.assert(result.length === expected.length);
console.assert(JSON.stringify(result) === JSON.stringify(expected));
//
//
//
//
}
但是AI没考虑到的问题:
1. 对象数组的去重
2. NaN的处理
3. 保持原顺序的重要性            
                        
                16. 程序员在使
成以及缺乏对代码整体的理解必然导致调试困难
Vibe Coding
盒代码
具时,调试时间增加30%-50%
成
AI 成的代码就像 魔法, 作时很神奇,出问题时完全不知道从
1
上下
理解的局限
缺乏全局思维,代码模块化程度不够,代码耦合度
,测试覆盖
不够,增加了维护困难
缺乏可追溯性,和对
次性
量代码,不知道哪
步出了问题,也就不知道回滚
2
的局限
步
到哪
成了
具的使
越来越
盒
技术债务可能越来越深,调试难度和复杂性越来
越
何下
盒代码
3
建设
具对代码仓库整体的理解
如Repo Wiki等
合理的
如每
法应该是使
步都要求他进
版本控制
commit
具            
                        
                17. Vibe Coding
志            
                        
                18. 户体验
能
法准确理解
不
,
户意图,需要反复确认
法维持
期上下
对话
具,浏览器,编辑器,Terminal
作,在Agent模式和Copilot模式之间摇摆
问题的投诉有两百            
                        
                19. Vibe Coding的成本 企,使得
没有边际效应,不存在
就成本就越低的的效应,当前最流
户规模越
们都不得不为活下去
努
努
的产品
压缩成本            
                        
                20. 产品
03
身也遇到的挑战
不同类型的产品            
                        
                21. 产品的演进导致模型成本越来越            
                        
                22. Vibe Coding 产品本身还处于摸索阶段
具间切
3
碎
个对话框往往不知道该做什么,产品
户真实的需求
化
产品设计在通
具体验
和垂直之间摇摆            
                        
                23. 险
,会成为攻击者利
能
定安全
主的探索和执
AI 驱动的Coding 具具有
具存在
Vibe Coding
使
的
具            
                        
                24. 04
Agent 建设过程中的
不同类型的产品
些经验            
                        
                25. All In One 的架构会导致成本的急剧上升
户对效果不满意            
                        
                26. 需要建设可靠的知识质量体系            
                        
                27. Agent 对上下 记忆的处理的
个核
Agent 任务的成败取决于上下 管理的成败, 写 ,提取,压缩和
隔离是上下 隔离的核 内容
信息输入
写入 Write
短期记忆
Short-Term Memory
工作记忆
上下文窗口内
⻓期记忆
Long-Term Memory
向量/图数据库
跨会话持久化
选择 Select
递归摘要
MemGPT架构
检索增强生成
RAG
语义搜索
压缩 Compress
高级文档分块
重排序机制
过滤式压缩
内容提取式压缩
多维度优化
隔离 Isolate
需要优化
技术案例
Mem0, MemGPT
Claude Code
核心目标
Windsurf, Google ADK
VertexAiRagMemoryService
LLMLingua 20x压缩
JSON to Markdown 63%节省
OpenAI Swarm
Amazon Bedrock
语义分块
嵌入模型检测
交叉编码器
深度交互评分
LLMChainFilter
相关性判断
LLMChainExtractor
摘要生成
语法层压缩
语义层压缩
语用层压缩
信息持久化
临时存储
精准检索
相关信息
Token效率
窗口适配
错误隔离
污染防护
功能模块隔离
Worker⻆色
Orchestrator⻆色
环境隔离
沙盒执行
命名空间隔离
AI Agent处理
优化结果反馈
上下文质量评估
满足要求
任务执行完成            
                        
                28. 包容不确定性,也要满
户不同的期待
+
Core Tools
!
1. 基础 具 (6个) - 任务管理和基本交互
2. 件操作 (8个) - 读写编辑和管理 件
3. 终端控制 (5个) - 命令 和执 监控
4. 浏览器 动化 (11个) -
浏览和交互
5. 机云 (12个) - 虚拟设备控制和测试
6. 多媒体 (5个) - 图像和 频处理
7. 开发 具 (7个) - 代码开发和部署
8. 协作 具 (5个) - 团队协作和集成
9. 级功能 (1个) - 并 执 优化
10. 络搜索 (2个) - 信息和资源获取
⚡
主要功能群组
基础工具
6个工具
(
高级功能
1个工具
"
协作工具
5个工具
*
文件操作
8个工具
网络搜索
2个工具
#
&
终端控制
5个工具
'
$
开发工具
7个工具
浏览器自动化
11个工具
%
手机云
12个工具
多媒体
5个工具            
                        
                29. 成本控制是永恒的话题            
                        
                30. 05
积极适配和拥抱国产开源模型
不同类型的产品            
                        
                31. 国外SOTA闭源模型存在许多 险
P
贵
隐私问题
复杂问题的tokens往往很
能让Agent运
闭源模型往往是闭源的
的模型往往很贵
国外闭源
SOTA模型存
在多重问题
A
被限流被降智
SOTA模型往往也会倾向于
存在合规
D
备案
国外模型如果要
做产品
险问题
向C端
险
户使
需要有备案,国外模型还不
C
持            
                        
                32. 国产模型在
链路任务下还存在
死循环问题
使得 Agent 容易陷
执
某种死循环,
某个shell指令,反复打开某个
2
如反复
些问题
指令遵循问题
3
在
件
达百万的tokens上下
被遵循和执
,尤其是
下,某些命令
法
模型没有训练到过的
场景,例如发布或者监控以及运维
1
格式遵循能
的
的问题
如出现xml标签格式不准确,前后
法匹配等,会导致
法被正确解析整体任务容
易失败。json格式不对等问题。
全局智能问题
国产模型普遍在任务全局理解问题上还存在
Secondary title plac
eholder
常
不
4
些缺陷,容易陷
结果存在较
tokens
步看
步的情况,导致
随机性,且会消耗
较多的            
                        
                33. 适配开源模型过程中做了哪些努
明显的逻辑错误导致的
限重复,完全没有进展或状
限循环;
式
动补            
                        
                34. 适配开源模型过程中做了哪些努
(2)            
                        
                35. 适配开源模型过程中做了哪些努
(2)            
                        
                36. 具格式
动修复            
                        
                37. 国产模型在产品上的
些实现
在适配国产模型上的
些实践            
                        
                38. 使            
                        
                39. 在架构上更多的创新
Agent AS Tool 等理念来代替 部分主 Agent 的智能
Agent之前,主Agent需要频繁去做所有的琐事
越来越 ,任务执 成功率越来越低,效果也不好
在没有使
使得上下
使            
                        
                40. 内部的技术成果开放给外部
户使
未来我们也会持续把我们内部的技术开放贡献给社区            
                        
                41.             
                        
                42. THANKS
Vibe Coding 在代码
实践与思考
向邦宇 阿 巴巴
成和协作过程中的