用户实时动线驱动的场景推荐新范式

如果无法正常显示，请先停止浏览器的去广告插件。

1. 用户实时动线驱动的场景推荐新范式金豆蚂蚁集团- 线开发专家蚂蚁终端体验科技大会

2. 自我介绍 • 豆中旭（金豆），蚂蚁集团（6年半） • 蚂蚁财富APP用户智能研发 • AI Native 应用

3. 业务介绍 • 蚂蚁财富APP，独立理财APP • 余额宝、股票、基金、理财社区、AI要点、资产分组、基金透视 • 专业，高持仓用户为主 AI要点

4. 目录 0102 “人找功能”已走到深水区新范式：”功能找人“ 问题分析解决方案

5. 1.1“人找功能”已走到深水区割裂感路径深少延伸业务间缺少承接好功能难被发现浏览过程中断

6. 1.2 少延伸缺少延伸，兴趣中断 1. 用户即兴看了市场大跌消息，【大跌原因是什么？】 2. 返回列表，主动查找/搜索

7. 1.3 优化效果 1. 用户即兴看了市场大跌消息，【大跌原因是什么？】 2. 返回列表，纯端侧推理 3. 智能推荐 4. 持续查看，延续刚才的意图

8. 纯端侧是如何做到的？

9. 2.1.1 理财场景文本多适合语义化后，由LLM理解推荐

10. 2.1.2 功能推荐Agent 1. 什么时候触发器 4.怎么提示 Agent Runtime 2. 决策依赖信息，语义化用户动线Tool Skills 3.推理决策 APP 状态Tool 端侧大模型 Tools 功能列表Tool 用户画像

11. 2.2 触发器启动Agent，精准介入多层级唤醒协议 { } "bizs"：[] // 定义Agent常驻的业务场景 "pages"：[], // 定义精准触发的页面规则引擎业务级别，多个页面推荐页面级别，单页面推荐 Agent触发

12. 2.3.1 用户动线Tool 将用户操作转化为AI可理解的语义信息全面 & 准确时间操作APP 金融实体页面名称语义化埋点+动态数据替换停留时长查看/点击基金曝光： { "时间": "2025-06-25 11:03:47", "页面名称": "基金详情", "用户行为": "查看", "停留时长(毫秒)": "2612", "基金名称":"易方达证券ETF链接C", "风险等级":"中高风险" } 社区热点点击： { "时间": "2025-06-28 13:34:57", "页面名称": "社区热点", "用户行为": "点击", "热点名称":"美股遭重挫！纳指暴跌逾3%", }

13. 2.3.2 APP状态Tool 提供实时状态感知编号状态类型值语义化 1Push状态【打开、关闭】{ "Push状态": “打开” } 2电量状态【高、一般、低】{ "手机电量": “低电量” }

14. 2.3.3 功能列表Tool 结构化内容 (资讯)抽象功能 (工具) 自带文本，易于理解无文本描述，需要生成内容与功能统一语义化核心内容提取美股收盘丨纳指暴跌3.56% … 多模态LLM+专家经验 { "name":"基金排行", //功能名 "description": “多维度基金榜单…” // AI 生成 }

15. 2.4 Skills 为推荐结果提供表达能力标准数据协议 UI组件库弹窗 Skills管理器 "skillData":{ "title": //标题 "content": //内容 "imgUrl": //图标 "scheme": //跳转链接 }, "skillCon g":{}//skill 配置, "skillID": skill标识站内信 … 挂件

16. 2.5 Agent Runtime 1. 场景配置解析 Tools、Skills、 Prompt配置 2.Tools调用3.Prompt拼装4.模型数据解析5.Skills调用链式调用Prompt模板合法性校验智能匹配

17. 2.6 问题挑战 1. 文本内容如何高效、精准采集 2. 推理速度慢问题 3. 内存、包体积问题 4. 推荐对用户的提醒较强，不适合随机

18. 2.6.1 采集更精准 ———1.文本内容如何高效、精准采集解决： ❌ 1. Text AOP，精准度不足，实现复杂 ❌ 2. 截图 OCR，内存消耗大，采集慢 ❌ 3. View Tree遍历，轻量，精准度不足 ✅ 4. RPC + DSL，精准、轻量问题：重要信息散落在页面各个模块中

19. RPC+DSL采集 { "ruleCode": "hot_topic", //规则标识 "RPCName": "社区热点", //RPC名称 "output": {"热点名称": "$.result.title"} //输出结果 } 1. APP 启动 5. 用户操作 3. DSL 解析 2. RPC 监听器 4. 金融实体关联规则 7. 基础行为模型 6. 埋点事件总线 { } 8.语义融合引擎 { "action":""//行为类型, "time": ""//时间, "code": ""//埋点code, 9.完整语义信息 } "时间": "2025-06-28 13:34:57", "页面名称": "社区热点", "用户行为": "点击", "热点名称":"美股遭重挫…"

20. 2.6.2 推理更快 ———2.推理速度慢问题 3. 精简输入Token Prompt优化{"编号": 1, "标题": "热点资讯", "内容": "宇树科技年度营收已超10亿元"} {"编号": 2, "标题": "今日收益更新", "内容": “你持有的基金今日…”} {"编号": 3, "标题": "热点资讯", "内容": "金价油价双双上涨！"}jsonl 1. Markdown结构化指令编号，标题，内容 1,热点资讯,宇树科技年度营收已超10亿元 2,今日收益更新,你持有的基金今日收益已开始更新 3,热点资讯,金价油价双双上涨！csv 2. 固定内容，预计算缓存优化 ### 角色金融产品与用户行为建模助手 ### 任务基于用户行为序列，判定候选功能使用意愿（高/低） ### 输入用户行为序列：包含模块名称/用户行为/停留时长(毫秒)/时间等 4. 精简输出Token {"编号": 1, "点击意愿": "低"} {"编号": 2, "点击意愿": "高"} {"编号": 3, "点击意愿": "中"} {"编号": 4, "点击意愿": "低"} {"编号": 5, "点击意愿": "中"} {"编号": 6, "点击意愿": "低"} Jsonl ["低","高","中","低","中","低"] 字符串数组

21. 2.6.3 模型更轻量 ———3.内存、包体积问题 ❌ 码本矢量量化，准确率高，执行慢 ✅ 计算量化参数，执行快，准确率低 GPU推理权重量化 Weight-only 精度损失分组+两级量化 GroupSize+BilevelQuant 关键信息离群值处理 Outliers 10%-20% 性能损耗训练策略 QAT+QLoRA LLM 0.6B， 4bit

22. 2.6.4 推荐更准 ———4.推荐对用户的提醒较强，不适合随机问题 • 阶段一：线下冷启动阶段二：线上持续优化 4 ： v1.0 冷启动模型5 ：模型部署上线 3 ： SFT 训练6 ：线上用户数据 2 ：云端大模型标注 1 ：无标签用户数据准确率/召回率评估 7 ：新的高质量训练数据 8 ： v2.0 迭代模型

24. 2.8 场景化推荐方案规则 1. 固定规则（第几次点击/曝光）传统模型LLM-Agent 1. 结构化特征（基金/股票ID, 行为类1. 非结构化语义特征（文本），语义型），概率统计理解、推理 2. 确定性强、速度快2. 高效特征关联、千人千面2. 支持零样本、一人一策 3. 依赖专家经验，场景扩充慢3. 特征工程复杂，文本特征不友好3. 性能成本高（NLP优化）例：用户第二次打开社区页，停留超5秒则推荐例：给“高风险偏好”用户群推荐“股票类”内容例：**感知**用户刚看完“纳指大跌”文章，**推理 **其想了解大跌原因，**主动**提供相关内容

25. 总结与展望规划展望总结回顾 1. 端云协同，更准确 1. 问题：割裂感、路径深、少延伸 2. 内容生成，能力探索 2. 解法：用户动线、功能列表等语义 3. 场景覆盖，升级为APP的智能中化，实现功能推荐Agent。枢，构建下一代AI Native APP 人找功能 -> 功能找人 AI Agent 驱动的场景推荐范式

26. Thanks