AI Coding 在蚂蚁保险非固化需求的探索
如果无法正常显示,请先停止浏览器的去广告插件。
1. AI Coding 在蚂蚁保险 固化需求的探索
李世峰(展浪)・ 蚂蚁集团 蚂蚁保前端负责人
蚂蚁终端体验科技
会
2. AI Coding
块、贪吃蛇等游戏,
个按钮的变更需求?
少我知道为什么AI 不了
3. AI Coding 指标
径对
AI Coding采纳率 = AI 成有效代码
代码,修改了其中50
,
额外增加了50
既要求了 AI Coding 的准确率,
数
,AI Coding 采纳率为 50/150 约等于 33.3%
对AI 码 的完整性有要求
例如:AI 成100
/ 需求总代码
4. 险低
险
卡
常供给营销活动
卡权益红包
核
场景
资产品类
交易能
货架
固化类需求
承接
能够抽象模版快速复制
常营销
营销
促
品牌打造资产包装阵地框架资产接功能改造
资产迁移交易核
产的需求
固化类需求
法沉淀通
什么是
范式覆盖的需求
5. 蚂蚁保的
,才能真正意义上改变
业级需求研发范式
6. 固化需求AI Coding的核
AI 助研能具&平台缺漏
撑AI Coding往业级需求更深层次迈进
7. > 50%
固化需求的特点
采纳率 AI Coding的四
卡点
> 90%
深度关联业务知识
8. 可以通过
4
的竿
宽3的
个农肩扛着”
根10的竿
宽3的
“
可以通过
4
国内某 TOP3 AI应
不能通过
吗?
可以通过
吗?
需求问题描述的越清晰、越具体,模型的推理判断结果的正确性越
模型的局限性
9. 什么?
标是什么?
谁来
?
代码研发
系分编写
PRD编写
Mock联调
财保业务需求交付全链路环节
视觉
测试验证
查
代码质检 / CR
最应该完善和增强的需求系分阶段,正
AI助研
临AI能
的缺失,仍靠
埋点
保障
10. 视觉稿 & 视觉稿极复杂
固化需求AI Coding的核
程 —> 上下
程 + 提示词 程
具链缺漏
11. 系统分析
程 全链路
AI 成系分
UI 稿打标
知识
召回
原始PRD
需求扩写
需求点 List
需求点 1代码定位变更分析系分段1出码引导
需求点 2代码定位变更分析系分段2出码引导
需求点 3代码定位变更分析系分段3出码引导
需求点 4代码定位变更分析系分段4出码引导
知识
召回
系统分析 Agent
核AI 系分
三件事
需求查错
需求拆解
档
需求分析 Agent
AI 对话体 问答
案
L0 任务指令层
定义“要 什么”
举例“开发 个xx
L1上下
锚定层
“在什么背景下做”
”
“属于xx业务”“仓库在xxx”
成标准
L2 约定和规范层L3 动态增强层
“不能做什么”“必须怎么做”“怎么做更好”“例外”
“
为红线”“研发规范”
最佳实践、边界case
12. 已上线需求
需求PRD
AI
1. 需求点描述
展示其他
户的投保和退税情况,通过 xxxxxx...….. 促进转化。
2. 需求问题和建议
•
•
•
•
•
员
系分
xxx,
户xxx….
标xxx、涉及功能模块xxx,
5. 可复 代码资源
配置化模式xxxx …..
额处理 xxxx ……
枚举定义 xxx …..
3. 头像处理
性别判断xxxxx
渲染接
户操
验证清单结果:
数据流验证 xxxx …..;
组件依赖验证 xxxx ……;
业务逻辑验证 xxxx …..;
标题配置 xxx ;增信配置 xxx;退税标题配置xxx;
档
4. 代码现状分析
相关代码梳理:
xxx组件代码及功能释义 xxxx ….;
数据获取接 及字段 xxxx ….;
具函数 xxxx ….;
服务层 xxxx ….;
2. 配置化实现
信息xxx,
3. 需求分析摘要
数据边界限制xxx、需求核
作路径xxx ……
,增加xxxx数据
4. 数据处理
处理规则xxxx
1. 资源信息
视觉稿xxx、后端系分xxx、PRD xxx、保险配置平台
xxx,…..
联调环境xxx , 接
1. 数据结构设计
扩展xxxx接
成的系分
2. 环境信息
标题xxx:组件标题需要 持运营 xxxxxx
增信 案xxx:右侧增信 案 xxxxx
头像xxx:使 xxxxx的xxxxx 头像
案xxx:投
案和退税 额xxxx
数据处理xxx:投
案中的xxx必须进 xxxx
技术
真实需求 AI 系分示例
共 472 字
6. 变更
9…
案设计.
7. 数据结构定义
共 4868 字
AI Coding采纳率 72%
8. 关键逻辑解析&关键伪代码
13. 系统分析
程最关键的要点
让AI认怂,不懂就问,别硬扛
才能保证较
的
码采纳率
才能系统化的推动 知识库的完善
14. 领域分类
知识维度
具体内容
业务历史材料
业务领域知识
程
优先级
例等
PRD、系分、测分、发布计划、测试
低● 定义了 3
程范围
业务百科业务介绍、业务模型、名词解释等中
业务附加数据视觉稿、报表等低
仓库代码
代码
录、代码
件和
● 试点业务已在蚂蚁、阿
段、git commit记录
技术领域知识
应元信息接信息jsapi、rpc、tr、http、三
开发
档
库的接
定义
档(如Smallfish)、团队开发
(如 江开发 册)
会议纪要、开发约定、临时
知识卡
信息
碎
公共开发
、服务等
个代码仓库)
案等
集团记忆平
&关联了 31567 条知识内容
● 编写了 领域知识储备实操指导
●
组件、包、H5
(通常 个应 对应
领域 -> 9个维度 -> 30个
项内容 的垂直业务 AI Coding 知识
台录
仓库代码指南,帮助AI了解仓库全貌、定位关键
代码位置
仓库WIKI
知识
档
中
册
15. 问题Q
问题Q实际
召回知识
B
A
C
有关 , 被召回
有关 , 没召回
关 , 被召回
全量业务知识
真实数据依赖
打标,
80%
B / ( B+C )
衡量召回的内容是否相关
近似算法在相同的评分域值下,可
于衡量知识的完善
作、召回策略的优化
衡量召回的内容是否完全
50%
准确率
B / ( A+B )
召回率
知识
20%
60%
作的增量效果
16. Embedding向量搜索 与 Reranker 对
效果对
Q:什么是 xxxxxfish?
Embedding 向量搜索
核
Reranker(重排器)
Bi-Encoder / Dual-Encoder:查询和 Cross-Encoder:查询和 档连接成
档分别编码成独 的向量,通过向
个序列,通过全连接Attention进
量点积或余弦相似度计算相似性。
深度交互。
原理
主要
召回率(Recall):从海量数据中快
准确率(Precision):从候选 段中
速、全 地找出所有可能相关的候选
精准地找出最相关的少数 段。
段。
标
搜索范围
规模:数百万甚
查询和结果的
语义交互
数
亿
档
规模:召回阶段返回的10-100个候
选 段
直接/深度:Token-to-Token 交互发
间接:交互发 在向量空间,缺乏细
在Transformer层内,语义理解能
粒度的Token级上下 感知。
强。
向量检索 TOP3Reranker后 TOP3
xxxxxfish 是什么,、xxxxxfish 是为蚂
蚁移动端研发量身打造的xxxxx ...xxxxxxfish 是什么,xxxxxfish 是为蚂蚁
移动端研发量身打造的 H5 研发框架...
0.990.99
Owner,****Bakery Mock - **@弩哥
\n\n **如有问题,欢迎在评论区留
或者与话题 owner,在 xxxxxfish 中\n
xxxxxfish 推荐使 Bakery ...介绍,我们先通过 张图来简单理解
下 xxxxxfish 组件研发的机制...
0.980.88
使 引导\n:::info\n该功能没有应 类型
限制,只要使 了xxxxxfish、xxxxfish
内置请求库,或 ...
向量检索 + Reranker重排 对知识召回,是 前RAG系统
知识召回 准确率指标提升
0.98
常
案
为了让 H5 性能优化的路径更清晰,
xxxxxfish 全新提供了 `optimize:
'SMALLFISH_RECOMMEND'` 配置...
0.86
17. 使 模型:Qwen3_Reranker_8B
{
"query": "<|im_start|>system\nJudge whether the Document meets the requirements based on the Query
and the Instruct provided. Note that the answer can only be \"yes\" or \”no\".<|im_end|>\n<|im_start|>
user\n<Instruct>: 根据 户问题,找出最相关的 档。\n<Query>: 可 可乐的价格是多少?",
"userId": "20880000111113333",
"model": "Qwen3_Reranker_8B",
"texts": [
"<Document>: 可 可乐的价格是 400 美元<|im_end|>\n<|im_start|>assistant\n<think>\n\n</think>\n\n",
"<Document>: 可 可乐是我最喜欢的饮料<|im_end|>\n<|im_start|>assistant\n<think>\n\n</think>\n\n",
"<Document>: 雪碧是我最喜欢的饮料<|im_end|>\n<|im_start|>assistant\n<think>\n\n</think>\n\n",
"<Document>: Qwen3 很强 <|im_end|>\n<|im_start|>assistant\n<think>\n\n</think>\n\n"
]
Qwen3_Reranker_8B模型 存在的精度问题
由于模型训练时存在chat template 法对 ,精度出现误差
,需要 为加上官 的chat template实现精度对
}
Reranker 重排实现
18. 知识
程
轮
系分
补充
打包反馈
最终系分
良性
循环
AI 成知识
问答过程
知识指标
知识消费
程
记忆中
AI 复盘
程的闭环训练
知识消费
MCP
知识
径观测
知识增强
知识反馈
审查
知识数据 反馈 -> 更新决策
知识数据增量补全建议
19. 知识管理平台示例
知识库AI维护建议
知识库AI维护建议
知识库保鲜、更新、补全任务列表
20. 系分
程 + 知识
程 已上线需求全流程示例
21. AI Coding在业务需求中效果
AI Coding业务数据汇总
试点赛道:保险售前场景
全链路试点时间:10
AI Coding 需求占
AI
下旬
:40%
系分平均采纳率:77%
AI Coding平均采纳率:74.5%
私域知识 1576条 蚂蚁通
程的深
结合,越来越多的复杂需求进
程和知识
随着系分
到
采纳AI Coding
知识 2.96万条
22. 2022年后
业级 AI Coding 采纳率四步
AI 智能体
然语
95% 以上
1990年末
业级“意图需求交付”?
框架 / 平台
组件化拼装
70% 以上
前进
1950中后期
1950早期
1940年左右
中
全量领域知识
程积累完成
级语
职能
业务逻辑与算法
初步关联业务知识
50%左右
汇编语
硬件指令助记符
机器语
AI 动补全
(IDE)
核
定位互换
主导 —> AI 主导
CPU指令集
产品PRD:局部变更功能描述 —> 模块/
研发:编写代码 —> 知识维护
作变化
交付AI化 —> AI 交付
20% - 30%
AI Coding未来的趋势
全局功能“说明书”
23. 为什么AI Coding能开发复杂的游戏,却
不了
业级需求的
个按钮改动的需求 ?
AI 模式时代
( 2022年起,OpenAI 推出的 ChatGPT 引发全球关注)
燃料
世界
知识
蒸馏器
领域
知识
数据时代
数据世界知识语料训练AI,但
需求有
通
数据研究和发展计划”)
业级需求的领域知识往往仅存在于垂直业务内
(2013年起,美国政府宣布启动“
最初的问题,我找到了答案
24. 业级需求的意图交付 + AI应急,明年SEE Conf 会,不
展浪
蚂蚁保前端负责
Thanks
不散~