京东联盟广告生成式推荐探索与实践-DPO多目标优化 - 在线工具

在线工具

在线工具

反馈

文库码库小摊

更多

京东联盟广告生成式推荐探索与实践-DPO 多目标优化

出处：mp.weixin.qq.com

摘要

生成式推荐大模型在京东联盟广告业务中优化UCTR与UCVR指标，通过DPO对齐范式实现多目标优化。商品离散化和行为序列建模简化了推荐流程，提升了模型泛化能力。Softmax-DPO和β-DPO方法分别处理多负例和参数敏感问题，线上实验显示转化率显著提升。未来探索方向包括多目标优化和多场景建模。

阅读原文

xiaozi 于 2025-02-17 分享

4052

关联话题： #京东

欢迎在评论区写下你对这篇文章的看法。

评论

据说喜欢分享的,后来都成了大神

国别域名注册8折优惠

vultr activity

tencent

不要太在乎别人的目光，因为没人会注意你。

文库

更多

首页 - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-07-23 05:18
浙ICP备14020137号-1 $访客地图$