用户实时动线驱动的场景推荐新范式

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1. 用户实时动线驱动的场景推荐新范式 金豆 蚂蚁集团- 线开发专家 蚂蚁终端体验科技大会
2. 自我介绍 • 豆中旭(金豆),蚂蚁集团(6年半) • 蚂蚁财富APP用户智能研发 • AI Native 应用
3. 业务介绍 • 蚂蚁财富APP,独立理财APP • 余额宝、股票、基金、理财社区、AI要点、资产 分组、基金透视 • 专业,高持仓用户为主 AI要点
4. 目录 0102 “人找功能”已走到深水区新范式:”功能找人“ 问题分析解决方案
5. 1.1“人找功能”已走到深水区 割裂感路径深少延伸 业务间缺少承接好功能难被发现浏览过程中断
6. 1.2 少延伸 缺少延伸,兴趣中断 1. 用户即兴看了市场大跌消息, 【大跌原因是什么?】 2. 返回列表,主动查找/搜索
7. 1.3 优化效果 1. 用户即兴看了市场大跌消息, 【大跌原因是什么?】 2. 返回列表,纯端侧推理 3. 智能推荐 4. 持续查看,延续刚 才的意图
8. 纯端侧是如何做到的?
9. 2.1.1 理财场景文本多 适合语义化后,由LLM理解推荐
10. 2.1.2 功能推荐Agent 1. 什么时候 触发器 4.怎么提示 Agent Runtime 2. 决策依赖信息,语义化 用户动线Tool Skills 3.推理决策 APP 状态Tool 端侧大模型 Tools 功能列表Tool 用户画像
11. 2.2 触发器 启动Agent,精准介入 多层级唤醒协议 { } "bizs":[] // 定义Agent常驻的业务场景 "pages":[], // 定义精准触发的页面 规则引擎 业务级别,多个页面推荐 页面级别,单页面推荐 Agent触发
12. 2.3.1 用户动线Tool 将用户操作转化为AI可理解的语义信息 全面 & 准确 时间 操作APP 金融实体 页面名称 语义化 埋点+动态数据替换 停留时长 查看/点击 基金曝光: { "时间": "2025-06-25 11:03:47", "页面名称": "基金详情", "用户行为": "查看", "停留时长(毫秒)": "2612", "基金名称":"易方达证券ETF链接C", "风险等级":"中高风险" } 社区热点点击: { "时间": "2025-06-28 13:34:57", "页面名称": "社区热点", "用户行为": "点击", "热点名称":"美股遭重挫!纳指暴跌逾3%", }
13. 2.3.2 APP状态Tool 提供实时状态感知 编号状态类型值语义化 1Push状态【打开、关闭】{ "Push状态": “打开” } 2电量状态【高、一般、低】{ "手机电量": “低电量” }
14. 2.3.3 功能列表Tool 结构化内容 (资讯)抽象功能 (工具) 自带文本,易于理解无文本描述,需要生成 内容与功能 统一语义化 核心内容提取 美股收盘丨纳指暴跌3.56% … 多模态LLM+专家经验 { "name":"基金排行", //功能名 "description": “多维度基金榜单…” // AI 生成 }
15. 2.4 Skills 为推荐结果提供表达能力 标准数据协议 UI组件库 弹窗 Skills管理器 "skillData":{ "title": //标题 "content": //内容 "imgUrl": //图标 "scheme": //跳转链接 }, "skillCon g":{}//skill 配置, "skillID": skill标识 站内信 … 挂件
16. 2.5 Agent Runtime 1. 场景配置解析 Tools、Skills、 Prompt配置 2.Tools调用3.Prompt拼装4.模型数据解析5.Skills调用 链式调用Prompt模板合法性校验智能匹配
17. 2.6 问题挑战 1. 文本内容如何高效、精准采集 2. 推理速度慢问题 3. 内存、包体积问题 4. 推荐对用户的提醒较强,不适合随机
18. 2.6.1 采集更精准 ———1.文本内容如何高效、精准采集 解决: ❌ 1. Text AOP,精准度不足,实现复杂 ❌ 2. 截图 OCR,内存消耗大,采集慢 ❌ 3. View Tree遍历,轻量,精准度不足 ✅ 4. RPC + DSL,精准、轻量 问题:重要信息散落在页面各个模块中
19. RPC+DSL采集 { "ruleCode": "hot_topic", //规则标识 "RPCName": "社区热点", //RPC名称 "output": {"热点名称": "$.result.title"} //输出结果 } 1. APP 启动 5. 用户操作 3. DSL 解析 2. RPC 监听器 4. 金融实体 关联规则 7. 基础行为模型 6. 埋点事件总线 { } 8.语义融合引擎 { "action":""//行为类型, "time": ""//时间, "code": ""//埋点code, 9.完整语义信息 } "时间": "2025-06-28 13:34:57", "页面名称": "社区热点", "用户行为": "点击", "热点名称":"美股遭重挫…"
20. 2.6.2 推理更快 ———2.推理速度慢问题 3. 精简输入Token Prompt优化{"编号": 1, "标题": "热点资讯", "内容": "宇树科技年度营收已超10亿元"} {"编号": 2, "标题": "今日收益更新", "内容": “你持有的基金今日…”} {"编号": 3, "标题": "热点资讯", "内容": "金价油价双双上涨!"}jsonl 1. Markdown结构化指令编号,标题,内容 1,热点资讯,宇树科技年度营收已超10亿元 2,今日收益更新,你持有的基金今日收益已开始更新 3,热点资讯,金价油价双双上涨!csv 2. 固定内容,预计算缓存优化 ### 角色 金融产品与用户行为建模助手 ### 任务 基于用户行为序列,判定候选功能使用意愿(高/低) ### 输入 用户行为序列:包含模块名称/用户行为/停留时长(毫秒)/时间等 4. 精简输出Token {"编号": 1, "点击意愿": "低"} {"编号": 2, "点击意愿": "高"} {"编号": 3, "点击意愿": "中"} {"编号": 4, "点击意愿": "低"} {"编号": 5, "点击意愿": "中"} {"编号": 6, "点击意愿": "低"} Jsonl ["低","高","中","低","中","低"] 字符串数组
21. 2.6.3 模型更轻量 ———3.内存、包体积问题 ❌ 码本矢量量化,准确率高,执行慢 ✅ 计算量化参数,执行快,准确率低 GPU推理 权重量化 Weight-only 精度损失 分组+两级量化 GroupSize+BilevelQuant 关键信息 离群值处理 Outliers 10%-20% 性能损耗 训练策略 QAT+QLoRA LLM 0.6B, 4bit
22. 2.6.4 推荐更准 ———4.推荐对用户的提醒较强,不适合随机问题 • 阶段一:线下冷启动 阶段二:线上持续优化 4 : v1.0 冷启动模型5 : 模型部署上线 3 : SFT 训练6 : 线上用户数据 2 : 云端大模型标注 1 : 无标签用户数据 准确率/召回率评估 7 : 新的高质量训练数据 8 : v2.0 迭代模型
23. 2.7 整体架构 业务 社区 基 股票 Tools ( 感知:用户动线 | 功能列表 | 云端特征) 资产分组 基 穿仓 Skills (表达:站内信 | 弹窗 | 挂件 | 视图点击) Agent Agent Runtime (工作流:触发器 | 意图管理 | Pipline | Prompt 管理 | Memory) LLM Runtime (场景注册 | 流式结果监听 | LLM推理 | 结果回调 ) 端大模型 端推理 (金融基模 | Lora ) AI 工程 ( SFT训练 | 评测 | 实时意图特征 | 量化压缩)
24. 2.8 场景化推荐方案 规则 1. 固定规则(第几次点击/曝光) 传统模型LLM-Agent 1. 结构化特征(基金/股票ID, 行为类1. 非结构化语义特征(文本),语义 型),概率统计 理解、推理 2. 确定性强、速度快2. 高效特征关联、千人千面2. 支持零样本、一人一策 3. 依赖专家经验,场景扩充慢3. 特征工程复杂,文本特征不友好3. 性能成本高 (NLP优化) 例:用户第二次打开社区页,停留超5秒则推荐 例:给“高风险偏好”用户群推荐“股票类”内容 例:**感知**用户刚看完“纳指大跌”文章,**推理 **其想了解大跌原因,**主动**提供相关内容
25. 总结与展望 规划展望 总结回顾 1. 端云协同,更准确 1. 问题:割裂感、路径深、少延伸 2. 内容生成,能力探索 2. 解法:用户动线、功能列表等语义 3. 场景覆盖,升级为APP的智能中 化,实现功能推荐Agent。 枢,构建下一代AI Native APP 人找功能 -> 功能找人 AI Agent 驱动的场景推荐范式
26. Thanks

首页 - Wiki
Copyright © 2011-2025 iteam. Current version is 2.148.2. UTC+08:00, 2025-12-14 04:49
浙ICP备14020137号-1 $访客地图$