导读 在金融行业竞争激烈的当下,传统营销模式存在资源浪费、客户体验不佳、市场竞争加剧等问题,精准营销能够提升营销效果和客户满意度,成为企业突破困境的关键。因果推断特别是增益模型提供了解决思路,其中树型增益模型表现突出。今天将围绕金融背景下的营销需求,分享树型增益模型的原理、节点分裂算法,展示其在电话营销时机场景的应用,最后总结成果并探讨未来发展方向,助力大家深入理解该模型在金融营销领域的价值与潜力。
1. 背景介绍
2. Tree-Base 增益模型介绍
3. Tree-Base 营销时机挖掘
4. 总结与未来方向
分享嘉宾|王心怡马上消费算法工程师
编辑整理|高怡杰
内容校对|李瑶
出品社区|DataFun
传统机器学习更加专注于预测,也就是回答“是什么”的问题。
因果机器学习则重点关注数据中的因果关系,也就是去回答“如果...会怎么样”的问题,并输出整体或子群体的因果效应估计。
Tree-Base 增益模型介绍
1. 分裂标准 1:基于 KL 散度、欧几里得距离和卡方统计量
2. 分裂标准 2:基于上下文处理选择(CTS Tree)
通过多棵因果树的组合来预测,每棵树基于不同的自助法去训练数据集而生成。通过这种方式可以增加模型的稳健性和泛化能力。
通过随机特征选择策略,只需要考虑特征空间中的一个随机子集的某一策略,因此有助于减少模型的方差,并防止模型过度依赖某些特征。
最终的预测结果为所有树的预测平均值,这样可以很好地捕捉数据中的模式,提供更稳健的预测。
3. 分裂标准 3:基于 delta-delta-P(ΔΔP)标准
4. 分裂标准 4:基于 IDDP 标准
5. 分裂标准 5:正交双重机器学习因果森林
步骤 1:正交化处理
首先拟合一个辅助模型,分别对因变量 Y 和处理变量 T 进行一个建模;
对于建模拟合得到的 Y 估计和 T 估计,再重新会计算 Y 和 T 的残差值;
利用残差值以及原始我们的用户的特征 X 去构建正交森林。
步骤 2:构建正交森林
正交森林的节点分裂中可以采用先前提到的分裂标准(最大化子节点中的处理效应来选择最大的分裂点);
增加额外的调整参数,可以根据样本量进行实时地调整。
步骤 3:双重机器学习估计
对每个叶子节点中使用加权最小二乘回归对残差进行回归,以估计每个个体营销处理效果,也就是每个个体的增益值;
通过这个局部模型,再结合所有树的估计,最后得到每一个用户的增益值情况。
6. 五种树型增益模型对比
Tree-Base 营销时机挖掘
干预时机:在 9 点到 17 点,整体上对每个客户都进行时机干预。
结果:用户是否响应营销,也就是最后用户是否能接通电话,或者是能够接收到我们发送的短信。
客户特征:主要选用用户画像特征。
treatment & control:treatment 组是选用某一个时机作为干预组,control 则是选择其他干预时机为控制组。
方案一:采用各时间段作为干预组,随机选择一部分时间点作为控制组。
方案二:选择一个固定接通率较低的时间段为控制组。
方案三:考虑用户特征分层,选择每一个分层中表现较为中性的时段作为控制组。
总结与未来方向
决策树通过信息增益去进行分裂,目标是使节点信息熵达到最小。这种做法的好处是类别确定性比较高,达到分类的目的。
uplift 树模型使节点分布差异最大,不同时机响应率分布差异大,从而实现提升增益的目的。
增加一些对实时增益模型的应用,去实时分析用户的行为数据和反馈。
进行多源数据的融合与模型的优化,以获得类型更加丰富的用户特征。
增强模型的透明性与解释性。
考虑与深度学习的模型做融合。
分享嘉宾
INTRODUCTION
王心怡
马上消费
算法工程师
王心怡,现就职于马上消费的算法工程师一职,本科毕业于天津大学信息管理与信息系统专业,硕士清华大学物流工程,目前主要研究兴趣在因果推断、运筹优化领域。
往期推荐
国际时尚电商巨头Data+AI场景降本增效探索!
Flink CDC 3.3 版本解读
用户情感陪伴大模型的自研之路和应用拓展
DeepSeek 如何重塑大数据:数势科技 SwiftAgent 的创新分享
Shopee AI训练加速实战应用探索
基于大语言模型与多模态的 RLHF 技术和挑战
腾讯海外游戏大数据平台建设助力游戏增长实践
Shopee突破IO瓶颈,加速AI训练实战探索
漫谈MFU(一):解锁高效算力的关键密码
大模型和知识图谱双轮驱动的汽车制造业知识服务
点个在看你最好看
SPRING HAS ARRIVED