天猫 AI 全栈交付实践:从个人工具到团队研发提效解决方案
如果无法正常显示,请先停止浏览器的去广告插件。
1. 2026.03.21
阿 巴巴全球总部_访客中
中国杭州 HANGZHOU CHINA
2. 天猫 AI 全栈交付实践
从个
具到团队研发提效解决 案
珈
(曹志强)
淘天集团 · 技术专家
3. AI
近200 名开发 程师
10+ 个业务域/16+ 作台
4 类发布平台/1000+ 存量
2025下半年 启动后端全栈试点
零前端基础 → AI 独 交付
缺失 · 协同摩擦 · 质量验证
具 = 个 技能 X 具熟练度
案 = 解决 案落地深度 X 团队规模
4. 微观视
把当下做到极致
出码质量 → 调试验证 → 研发流程
宏观视
往范式转变延伸
云端全栈 · 异步委派 · 多Agent协同
5. 我们建了什么,做到了什么
6. 知识运营 信号驱动知识沉淀
主动发现隐形知识
B同学遇到直接解决
A同学踩坑并解决
· 报错信息出现 → 可能踩坑
· 多轮调试 >5 轮 → 复杂问题
· 否定表达("不对""改回来
")→ AI 理解有误
·同
件多次编辑 → 反复
修改
动沉淀总结
系统
系统
动沉淀总结
数据验证&差异化
1
动捕获 128 条经验知识,
pitfall 占 51%
vs Cursor Memory / Claude 记忆:
跟着个 设备 ,是「个 助 」
我们基于数据闭环拿到全部会话数
据,是「团队知识」
7. 下发配置流程
管理下发能
,不跟
· 核 问题:
个业务域上百个
仓库
· 报错信息出现
→ 可能踩坑
让每 在每个仓库
动配置 AI 规
· 多轮调试
>5 轮 → 复杂问题
则 → 不现实
· 否定表达("不对""改回来")→ AI 理解
有误
云端下发流程:
·同
Git Group / Repo 信息
→ 系统 动识别业务域
→ 下发对应配置
业务配置后台
知识运营 云端统
下发内容(三个卡 并排):
· AGENTS.md 开发规范
· mcp.json 具配置
· 团队 Skills
设计原则:
· 打开项 就能 ,零配置
· 处修改,全局 效
· 动化 > 动,集中管理 > 分散维护
8. 三个陷阱:
· 幸存者偏差:成功案例反复提起,失败
统计
· 归因错误:做快了是 AI 还是需求本身简单?
· 个体差异:3
100% + 7 没变 = 平均 30%
三杂度矩阵(核 视觉, 维矩阵图):
从真实业务中抽取 60 个历史需求
按两个维度映射到九个象限:
开卷考试:
结果分 75%:代码是否满 需求(LLM as Judge)
为分 25%:Agent 有没有查 档、调知识库
不仅看答案对不对,还看有没有翻对书
碰巧正确 < 稳定正确
数据度量从「感觉有效」到「数据证明」
9. 链路漏
:调
率 → 命中率 → 采纳率
· 调 率低 → Agent 不知道要查资料,Prompt 引导有问题
· 命中率低 → 知识库覆盖不 ,索引质量差
· 采纳率低 → 召回了但不好 ,召回精度有问题
核
洞察:知识被「 」了但没「有 」
频低效 = 浪费 Token + 可能误导模型
阈值:动态中位数,随整体质量 动调整
· 调 率低 → Agent 不知道要查资料,Prompt 引导有问题
· 命中率低 → 知识库覆盖不 ,索引质
· 采纳率低 → 召回了但不好 ,召回精度有问题
优化效果:
针对 频低效知识逐 优化
关联采纳率 18% → 35%
· 调 率低 → Agent 不知道要查资料,Prompt 引导有问题
· 命中率低 → 知识库覆盖不 ,索引质
· 采纳率低 → 召回了但不好 ,召回精度有问题
数据度量在线分析:定位具体哪条知识有问题
10. 与其优化 SPEC 让 AI 写得更好,不如直接给它好的东
来抄。LLM 的底层能 就是"抄+改"——有参照物时表现
显著优于没有时。SPEC 管意图(做什么),物料管执
(怎么做),两者叠加才是完整的可控编码。90% 抄,
10% 写,胶 只在缝隙处。
确定性的给脚本,不确定性的给模型
Agent 写代码背后有四个彼此独
个,不保证其他三个也对。的决策——答对任何
任务规格定义"这次做什么",开发规范划定"什么不能做
",代码模式提供"抄什么",领域知识标注"有什么坑"。
四种失败模式互不重叠,每层物料恰好堵 个,少 层多
种漏洞。
胶
11. 传统链路:
报错 → 看到(损失50%) →
30%) → AI 基于 字猜
Harness AI
不是听
转述
12. 研发链路 控制反转:系统适配AI
让从
洞察——培训统计:
█████████████ 60% 平台操作和调试配置
████ 20% 前端基础知识
████ 20% 其他
→ 不是编程技能,是环境配置
控制反转:
传统:开发者判断平台 → 学操作 → 执
反转:开发者声明意图 → 系统 动识别 →
适配系统到系统适配AI
⇤ ✓ #⇥ ⌧
'✓ó6)3 ◆(✓óD+3 ◆
⇧↵⌫(& ✏⌥
IDD
4 × 3 = 12 üUQ
⌦⌅5ä/⇥rx⇤6) õ⌫UQ
✏
"%
① §! + h£,
② HTTPS !& + X
③ UF$⌅N
沙塔斯 / VOID
动执
NC ↵⌫(&⇠⇣⌥
⇠⇣
'
◆ Skill
⌘w⇣UQ¶
ASCP 供应链
xiaoer-dev
⇠⇣⌘
⌅⇡! Skill
⇠⇣
"ëYà⌥Mg"
éá¶!& / X / URL⇢
/ ^O B Mg|A
ç]¶TÉÖm + XZ& + !&â{
èLC~¶⌦⌅5[8R •Skill
⇤⇢⌃$ Skill
"ëY⌅Ç⌅"
⌘w⇣UQ¶
1. ÖmWI?27 (ice/rax/umi)
2. s06)â{!&G<
3. "⌥:] HTTPS XßEä®
4. à⌥ ↵ Dev Server
5. Å⌦öã` Ü>Mg⇢
_\⌅ Bü§!P2UQ
ç]¶800+ ⇣6)ñÄ!i
3 ⇤D+ = 3 ûH
⌘w⇣UQ¶
1. nk abc.json l= builder #b
2. aù package.json Jk- Vê
3. M ⌃-6) API P2§!
4. "⌥£, Git h(§!
5. d⌧ ↵ nc-context.json
✏
① P29d
② ↵^O
③ 9d⌅N
NC ,⇠ 3 ⇤1K\⌅D+•⌦⌅5⇡ä4%R
"ëYP2§!"
⇤
#⇥ ⌧
éá¶IDD / Ñï / DP /
⌦
① §! + MR
② HTTPS !&
③ §!⌅N
① P2äz;
② URL ⇢ Mg
③ S⌥ú⌅?2
国际 + 家享
✏
abc.json → "⌥l= → .*
三节点抽象:
迭代创建 · 本地调试 · 发布部署
DP
✏
1. nk§!Vê⇧⌅Nâ{
2. w⇣ ↵?2ÇÖu
3. }í!i ú⌅ CI UF$
4. å°⌅Njc^(t
5. y✏Ç⌅fX↵ò
éá¶UF$ / S⌥?2 / §!⌅N / 9d B
ç]¶CI/CD ñÄ + ⌅Njcô¢
⌘ç]6)ñÄ †ì Spring IoC¶[8ä/îo•p`vqÜ>@e
13. 引 :
微观优化的是 25% 的编码时间
要啃剩余 75%,需要范式层 的变
定位:
我们的 具从第 天按 AI Agent 设计
IDE 只是交付载体,核
正在从编辑器变
成编排器
程师
转变:
从编码者到编排者
核 能 :架构设计 · 意图表达 · 输出验证
宏观视
向:
云端全栈异步委派多 Agent 协同
怎么协同谁来执如何分
从驱动 AI蜂巢架构
到 AI主执
打通前后端环境壁垒
统上下
消除具割裂
任务委派给数字员
专业 Agent分
编排器统调度
14. AI Coding本质不是 具辅助,是基础设施。
基础设施的价值,取决于你在上 建了什么。