Predicting Rider Conversion in Sparse Data Environments with Bayesian Trees
摘要
Lyft面临乘客转化率预测的数据稀疏难题,传统模型易过拟合。为此,团队创新性地构建了贝叶斯树模型:通过分层树结构细分场景(如城市区域、时间段等),并利用高斯先验进行贝叶斯平滑——子节点参数受父节点约束,数据越少则越依赖父节点先验。该方法在稀疏场景下实现稳健预测,同时通过简单参数模型保障逻辑一致性(如强制历史转化率与当前概率单调相关),兼顾实时性与可解释性。