AI Coding 在蚂蚁保险非固化需求的探索

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1. AI Coding 在蚂蚁保险 固化需求的探索 李世峰(展浪)・ 蚂蚁集团 蚂蚁保前端负责人 蚂蚁终端体验科技 会
2. AI Coding 块、贪吃蛇等游戏, 个按钮的变更需求? 少我知道为什么AI 不了
3. AI Coding 指标 径对 AI Coding采纳率 = AI 成有效代码 代码,修改了其中50 , 额外增加了50 既要求了 AI Coding 的准确率, 数 ,AI Coding 采纳率为 50/150 约等于 33.3% 对AI 码 的完整性有要求 例如:AI 成100 / 需求总代码
4. 险低 险 卡 常供给营销活动 卡权益红包 核 场景 资产品类 交易能 货架 固化类需求 承接 能够抽象模版快速复制 常营销 营销 促 品牌打造资产包装阵地框架资产接功能改造 资产迁移交易核 产的需求 固化类需求 法沉淀通 什么是 范式覆盖的需求
5. 蚂蚁保的 ,才能真正意义上改变 业级需求研发范式
6. 固化需求AI Coding的核 AI 助研能具&平台缺漏 撑AI Coding往业级需求更深层次迈进
7. > 50% 固化需求的特点 采纳率 AI Coding的四 卡点 > 90% 深度关联业务知识
8. 可以通过 4 的竿 宽3的 个农肩扛着” 根10的竿 宽3的 “ 可以通过 4 国内某 TOP3 AI应 不能通过 吗? 可以通过 吗? 需求问题描述的越清晰、越具体,模型的推理判断结果的正确性越 模型的局限性
9. 什么? 标是什么? 谁来 ? 代码研发 系分编写 PRD编写 Mock联调 财保业务需求交付全链路环节 视觉 测试验证 查 代码质检 / CR 最应该完善和增强的需求系分阶段,正 AI助研 临AI能 的缺失,仍靠 埋点 保障
10. 视觉稿 & 视觉稿极复杂 固化需求AI Coding的核 程 —> 上下 程 + 提示词 程 具链缺漏
11. 系统分析 程 全链路 AI 成系分 UI 稿打标 知识 召回 原始PRD 需求扩写 需求点 List 需求点 1代码定位变更分析系分段1出码引导 需求点 2代码定位变更分析系分段2出码引导 需求点 3代码定位变更分析系分段3出码引导 需求点 4代码定位变更分析系分段4出码引导 知识 召回 系统分析 Agent 核AI 系分 三件事 需求查错 需求拆解 档 需求分析 Agent AI 对话体 问答 案 L0 任务指令层 定义“要 什么” 举例“开发 个xx L1上下 锚定层 “在什么背景下做” ” “属于xx业务”“仓库在xxx” 成标准 L2 约定和规范层L3 动态增强层 “不能做什么”“必须怎么做”“怎么做更好”“例外” “ 为红线”“研发规范” 最佳实践、边界case
12. 已上线需求 需求PRD AI 1. 需求点描述 展示其他 户的投保和退税情况,通过 xxxxxx...….. 促进转化。 2. 需求问题和建议 • • • • • 员 系分 xxx, 户xxx…. 标xxx、涉及功能模块xxx, 5. 可复 代码资源 配置化模式xxxx ….. 额处理 xxxx …… 枚举定义 xxx ….. 3. 头像处理 性别判断xxxxx 渲染接 户操 验证清单结果: 数据流验证 xxxx …..; 组件依赖验证 xxxx ……; 业务逻辑验证 xxxx …..; 标题配置 xxx ;增信配置 xxx;退税标题配置xxx; 档 4. 代码现状分析 相关代码梳理: xxx组件代码及功能释义 xxxx ….; 数据获取接 及字段 xxxx ….; 具函数 xxxx ….; 服务层 xxxx ….; 2. 配置化实现 信息xxx, 3. 需求分析摘要 数据边界限制xxx、需求核 作路径xxx …… ,增加xxxx数据 4. 数据处理 处理规则xxxx 1. 资源信息 视觉稿xxx、后端系分xxx、PRD xxx、保险配置平台 xxx,….. 联调环境xxx , 接 1. 数据结构设计 扩展xxxx接 成的系分 2. 环境信息 标题xxx:组件标题需要 持运营 xxxxxx 增信 案xxx:右侧增信 案 xxxxx 头像xxx:使 xxxxx的xxxxx 头像 案xxx:投 案和退税 额xxxx 数据处理xxx:投 案中的xxx必须进 xxxx 技术 真实需求 AI 系分示例 共 472 字 6. 变更 9… 案设计. 7. 数据结构定义 共 4868 字 AI Coding采纳率 72% 8. 关键逻辑解析&关键伪代码
13. 系统分析 程最关键的要点 让AI认怂,不懂就问,别硬扛 才能保证较 的 码采纳率 才能系统化的推动 知识库的完善
14. 领域分类 知识维度 具体内容 业务历史材料 业务领域知识 程 优先级 例等 PRD、系分、测分、发布计划、测试 低● 定义了 3 程范围 业务百科业务介绍、业务模型、名词解释等中 业务附加数据视觉稿、报表等低 仓库代码 代码 录、代码 件和 ● 试点业务已在蚂蚁、阿 段、git commit记录 技术领域知识 应元信息接信息jsapi、rpc、tr、http、三 开发 档 库的接 定义 档(如Smallfish)、团队开发 (如 江开发 册) 会议纪要、开发约定、临时 知识卡 信息 碎 公共开发 、服务等 个代码仓库) 案等 集团记忆平 &关联了 31567 条知识内容 ● 编写了 领域知识储备实操指导 ● 组件、包、H5 (通常 个应 对应 领域 -> 9个维度 -> 30个 项内容 的垂直业务 AI Coding 知识 台录 仓库代码指南,帮助AI了解仓库全貌、定位关键 代码位置 仓库WIKI 知识 档 中 册
15. 问题Q 问题Q实际 召回知识 B A C 有关 , 被召回 有关 , 没召回 关 , 被召回 全量业务知识 真实数据依赖 打标, 80% B / ( B+C ) 衡量召回的内容是否相关 近似算法在相同的评分域值下,可 于衡量知识的完善 作、召回策略的优化 衡量召回的内容是否完全 50% 准确率 B / ( A+B ) 召回率 知识 20% 60% 作的增量效果
16. Embedding向量搜索 与 Reranker 对 效果对 Q:什么是 xxxxxfish? Embedding 向量搜索 核 Reranker(重排器) Bi-Encoder / Dual-Encoder:查询和 Cross-Encoder:查询和 档连接成 档分别编码成独 的向量,通过向 个序列,通过全连接Attention进 量点积或余弦相似度计算相似性。 深度交互。 原理 主要 召回率(Recall):从海量数据中快 准确率(Precision):从候选 段中 速、全 地找出所有可能相关的候选 精准地找出最相关的少数 段。 段。 标 搜索范围 规模:数百万甚 查询和结果的 语义交互 数 亿 档 规模:召回阶段返回的10-100个候 选 段 直接/深度:Token-to-Token 交互发 间接:交互发 在向量空间,缺乏细 在Transformer层内,语义理解能 粒度的Token级上下 感知。 强。 向量检索 TOP3Reranker后 TOP3 xxxxxfish 是什么,、xxxxxfish 是为蚂 蚁移动端研发量身打造的xxxxx ...xxxxxxfish 是什么,xxxxxfish 是为蚂蚁 移动端研发量身打造的 H5 研发框架... 0.990.99 Owner,****Bakery Mock - **@弩哥 \n\n **如有问题,欢迎在评论区留 或者与话题 owner,在 xxxxxfish 中\n xxxxxfish 推荐使 Bakery ...介绍,我们先通过 张图来简单理解 下 xxxxxfish 组件研发的机制... 0.980.88 使 引导\n:::info\n该功能没有应 类型 限制,只要使 了xxxxxfish、xxxxfish 内置请求库,或 ... 向量检索 + Reranker重排 对知识召回,是 前RAG系统 知识召回 准确率指标提升 0.98 常 案 为了让 H5 性能优化的路径更清晰, xxxxxfish 全新提供了 `optimize: 'SMALLFISH_RECOMMEND'` 配置... 0.86
17. 使 模型:Qwen3_Reranker_8B { "query": "<|im_start|>system\nJudge whether the Document meets the requirements based on the Query and the Instruct provided. Note that the answer can only be \"yes\" or \”no\".<|im_end|>\n<|im_start|> user\n<Instruct>: 根据 户问题,找出最相关的 档。\n<Query>: 可 可乐的价格是多少?", "userId": "20880000111113333", "model": "Qwen3_Reranker_8B", "texts": [ "<Document>: 可 可乐的价格是 400 美元<|im_end|>\n<|im_start|>assistant\n<think>\n\n</think>\n\n", "<Document>: 可 可乐是我最喜欢的饮料<|im_end|>\n<|im_start|>assistant\n<think>\n\n</think>\n\n", "<Document>: 雪碧是我最喜欢的饮料<|im_end|>\n<|im_start|>assistant\n<think>\n\n</think>\n\n", "<Document>: Qwen3 很强 <|im_end|>\n<|im_start|>assistant\n<think>\n\n</think>\n\n" ] Qwen3_Reranker_8B模型 存在的精度问题 由于模型训练时存在chat template 法对 ,精度出现误差 ,需要 为加上官 的chat template实现精度对 } Reranker 重排实现
18. 知识 程 轮 系分 补充 打包反馈 最终系分 良性 循环 AI 成知识 问答过程 知识指标 知识消费 程 记忆中 AI 复盘 程的闭环训练 知识消费 MCP 知识 径观测 知识增强 知识反馈 审查 知识数据 反馈 -> 更新决策 知识数据增量补全建议
19. 知识管理平台示例 知识库AI维护建议 知识库AI维护建议 知识库保鲜、更新、补全任务列表
20. 系分 程 + 知识 程 已上线需求全流程示例
21. AI Coding在业务需求中效果 AI Coding业务数据汇总 试点赛道:保险售前场景 全链路试点时间:10 AI Coding 需求占 AI 下旬 :40% 系分平均采纳率:77% AI Coding平均采纳率:74.5% 私域知识 1576条 蚂蚁通 程的深 结合,越来越多的复杂需求进 程和知识 随着系分 到 采纳AI Coding 知识 2.96万条
22. 2022年后 业级 AI Coding 采纳率四步 AI 智能体 然语 95% 以上 1990年末 业级“意图需求交付”? 框架 / 平台 组件化拼装 70% 以上 前进 1950中后期 1950早期 1940年左右 中 全量领域知识 程积累完成 级语 职能 业务逻辑与算法 初步关联业务知识 50%左右 汇编语 硬件指令助记符 机器语 AI 动补全 (IDE) 核 定位互换 主导 —> AI 主导 CPU指令集 产品PRD:局部变更功能描述 —> 模块/ 研发:编写代码 —> 知识维护 作变化 交付AI化 —> AI 交付 20% - 30% AI Coding未来的趋势 全局功能“说明书”
23. 为什么AI Coding能开发复杂的游戏,却 不了 业级需求的 个按钮改动的需求 ? AI 模式时代 ( 2022年起,OpenAI 推出的 ChatGPT 引发全球关注) 燃料 世界 知识 蒸馏器 领域 知识 数据时代 数据世界知识语料训练AI,但 需求有 通 数据研究和发展计划”) 业级需求的领域知识往往仅存在于垂直业务内 (2013年起,美国政府宣布启动“ 最初的问题,我找到了答案
24. 业级需求的意图交付 + AI应急,明年SEE Conf 会,不 展浪 蚂蚁保前端负责 Thanks 不散~

首页 - Wiki
Copyright © 2011-2025 iteam. Current version is 2.148.2. UTC+08:00, 2025-12-14 06:41
浙ICP备14020137号-1 $访客地图$