美团搜索广告召回分享

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1. 美团搜索广告召回分享 田南 美团到家研发平台
2. 美团搜索广告介绍 搜商家 搜商品 展商家 ◼ 特点 ✓ 以搜商品为主(85%+),搜商家为辅;百万级商 家,十亿级别商品 搜索广告 列表推荐广告 ✓ 中小商家多,内容质量不高 ✓ LBS属性,供给不充分,对召回率要求更高 网页搜索 电商搜索 到家搜索 产品 百度、360 阿里、京东 美团外卖、饿了么 优化 体验 体验、交易 体验、交易 索引 长文本、非结构 化 短文本、结构 化 短文本、非结构化 供需 全网 全国 LBS区域性 展示 网页 商品(标品) 商家/菜品(非标 品多)
3. 美团搜索广告召回发展阶段 阶段1一多策略关键 词挖掘 思路,SPU挖掘可能被搜索query 阶段2一分层召回体 系 思路,基于流量供给分层针对性建设召回通路 阶段3一生成式召回 思路,借鉴生成式大模型思路及能力改造,长期 • 快速落地,覆盖高频流量 • 离线->在线,覆盖更多流量 探索DSI新范式 • 以NLP技术挖词为核心 • 问题维度分层,召回通道更聚焦,优化更针 • 离线用能力,构建领域微调大模型 • 多策略并行的方式追求更高覆盖 对性 • 在线用思想,传统模型结合大模型子技术 突破以单一NLP技术的瓶颈,大量使用个性 • 蒸馏做桥梁,探索生成式大模型蒸馏到传统 • 模型方式 化/图/多模态等召回技术 缺点: • spu到query反向挖掘,效率低 缺点: • 离线策略,难以覆盖长尾 • 判别式模式为主,决策空间不足 • 多策略并行,维护成本高,单策略 • 模型规模不足,天花板很容易逼近 ROI低 • 多通道独立优化,难以1+1>2 挑战: • • • 算力焦虑 迭代效率 架构改造成本
4. 阶段1— 关键词挖掘策略思路 ◆ 词/实体粒度,适合信息抽取 流量特点:query短,高频流量集中,商家无买词能力 ◆ query闭集合且规模不大,反向匹配 ◆ 需要自动化的方法 Bidword ② Query改写 ① Bidword挖掘 相关性约束 Query Ad 示例化 打法:从SPU挖掘关键词落地更快,通过QUERY改写尽可能提升命中率
5. 发展阶段1—多策略关键词挖掘 规则式 挖掘式 • 基于共现统计,挖掘重要关键词 RAKE算法 互信息 炒西红柿鸡蛋-->炒西红柿 • 从原文本抽取字词,进行重组合 抽取式 标注组合模型 指针组合模型 • 准确性好,多样性一般 • 易融合结构化数据 深度学习 • 对原文本编码,能生成新关键词 生成式 序列标注模型 • 多样性好,准确性一般 • 易融合结构化数据 炒西红柿鸡蛋-->炒鸡蛋 深度分类模型 深度生成模型 标注与生成模型 炒西红柿鸡蛋-->番茄炒蛋 展望:关键词挖掘解决了早期业务快速落地和业务基本盘的问题,针对越来越丰富和复杂的流 量,需要强化流量找商品匹配的思维和效率
6. 阶段2—分层召回体系 强意图有供给 番茄炒蛋/炒西红柿鸡蛋=>西红柿炒鸡蛋 提升匹配效率 烧烤=>烤羊肉串/烤羊腿 泛意图有供给 离线统一到生成式 在线稀疏化检索 关键词召回 + 离线->在线 基础语义模型 个性化信息模型 多维多目标模型 基础相关性限制 用户个性化需求 平台多样化目标 向量召回 单维->多维 真实需求匹配 汉堡王=>肯德基 泛需求弱供给 潜在需求匹配 三亚搜索烤串=>没有供给 无广告供给 长期泛需求 即时多需求 搜索推荐化 博客:百亿大规模图在外卖 广告场景的应用 供给运营化 流量驱动运营 区域性广告供给缺乏 短期强需求 B&C 联动 图神经网络技术 蜂窝流量分析 提升转化 高潜商家识别 自动智能运营 宏观流量调控 商家留存转化 聚焦留存
7. 阶段3—生成式召回 优化思路:结合LLM及生成式技术,提升召回的决策空间和匹配能力 用思想— 离线关键词召回 用思想—向量召回 学能力—相关性 用LLM— 在线关键词召回 CoT思想实现生 成具象到泛化 RLHF思想提升 生成一致性 CLIP多模态大模 型 基于SD的向量生 成式表征 CoT能力蒸馏 模型隐层知识蒸馏 LLM基座模型训练 LLM应用于离线关 键词挖掘 LLM online化
8. 生成式关键词召回—借鉴大模型技术思想 借鉴大模型统一多任务、CoT、RLHF等技术思想,优化生成式小模型效果 召回指标recall提升5pp+,相关性提升3pp+
9. 生成式关键词召回—离线升级为LLM大模型 构建到家广告领域大模型,并通过激发LLM知识,生成全面准确的关键词 领域知识 多任务/多指令、全参数训练 健身=>轻食 领域适配 AdGPT 激发领域知识 高质量数据、PEFT 川菜=>眉州东坡 店铺知识 指令微调 补充店铺知识 知识 注入 高质量 数据 猪手=>猪肘切片 实例知识 召回指标recall提升2pp++ 知识 激发 多样 prompt 训练/推断一致 检索增强 利用实例知识 AdGPT spu 检 索 语义相近的 spus 组装 RAG prompt AdGPT 关键词
10. 多模态生成式向量召回—结合扩散模型,多阶段生成向量表征 Query Embedding Attention Fusion 下一次点击的商品 CLIP图像表征 个性视觉预期 重建loss 行为表征 个性模块 行为序列 共性视觉预期 所有相关商品 CLIP图像表征 语义表征 共性模块 Query文本 视觉预期模型 对比学习的判别式匹配,升级为基于扩 散模型的生成式检索 基于视觉预期实现流量多模态建模,CLIP提升多模态理解能力 视觉预期: ➢ QUERY历史点击图片表示通用视觉信息 ➢ 用户历史点击图片代表个性化视觉信息 效果:离线recall指标提升1.5PP 效果:相似item向量表示空间更加可区分
11. 生成式相关性判断—多维度蒸馏LLM能力 激发和学习大模型对通用知识的理解及复杂问题的推理能力,解决传统相关性模 型样本难、泛化性弱问题 相关性AUC指标+1PP,对于hard问题解决率提升50%+
12.

Home - Wiki
Copyright © 2011-2024 iteam. Current version is 2.137.1. UTC+08:00, 2024-11-17 18:36
浙ICP备14020137号-1 $Map of visitor$