话题AI工程 › RL

AI工程:RL

关联话题: Reinforcement Learning、强化学习

微信看一看强化学习推荐模型的知识蒸馏探索之路

本文基于论文《Explore, Filter and Distill: Distilled Reinforcement Learning in Recommendation》,发表于CIKM 2021,论文作者来自微信看一看团队。

深度强化学习在滴滴路径规划中的探索实践

滴滴的路线引擎每天要处理超过400亿次的路线规划请求,路径规划是滴滴地图输出的核心服务之一。不同于传统的路径规划算法,本文主要介绍的是一次深度强化学习在路径规划业务场景下的探索,目标是为用户规划出最符合司乘双方习惯的路线,降低偏航率。

强化学习在小桔车服用户运营中的实践

小桔车服为滴滴旗下品牌,围绕车主及汽车生命周期,整合运营多项汽车服务,更加智能更加用心地为车主提供适合的一站式用车服务,致力于让每一个人拥有轻松车生活。

本次分享的主题为强化学习在小桔车服用户运营中的实践。在互联网场景下,面向用户的营销是每个业务所对的共同问题,而如何帮助小桔车服运营提升营销的 ROI 是我们算法同学的工作重点之一。在本文,我们将向大家介绍如何将车服的营销问题建模为一个强化学习过程,并且如何精细化地对每个人做出个性化的营销动作,在实际业务中又取得了怎样的效果。

简约而又简单的Bloom Filter

今天聊聊布隆过滤器,这一1970年代提出的技术,用于处理海量数据判重。通过建立m位二进制位图和k个哈希函数,快速判断数据是否存在。虽存在误判概率,但在大数据场景下效率显著。适用于垃圾邮件过滤、存储分片查询等场景,实现简单且效果佳。

首页 - Wiki
Copyright © 2011-2025 iteam. Current version is 2.148.2. UTC+08:00, 2025-12-20 10:49
浙ICP备14020137号-1 $访客地图$