作者简介
Seven,数据分析师,专注用户增长、数据科学等领域。
在产品设计上构建正确的 AB 实验,合理计算指标,度量产品功能和迭代的影响;
基于观测数据的因果推断,即从已有实验和非实验数据中提炼因果关系;
用户运营场景中遇到的因果推断问题;
虚拟价值评估场景中的因果推断具体案例;
业务背景:现阶段用户运营体量较大,短信是需要成本的,利用 UPLIFT 模型寻找短信敏感人群,在精细化策略运营的基础上帮助运营人员节省成本,进一步提高运营 ROI。
模型应用:
业务背景:用户增长业务存在一些业务板块是虚拟形态,比如企业微信、公众号、会员等,业务方希望评估下这些虚拟形态带来的增量价值,从而指导成本投入。
口径迭代:
模型介绍:例如我们在 A 城市施加干预/政策,且无法找到 A 城市的最佳对照地区,就可以使用合成控制法对若干大城市进行适当的线性组合,以构造一个与 A 市非常相似的“合成 A 市”,并将“真实 A 市”与“合成 A 市”进行对比。
业务背景:酒店产品想通过AB实验探索用户价格弹性,即调整定价时,看转化率变化情况,为了在不进行违规操作的前提下能够得到相对科学的结论来支持决策,我们使用合成控制(SCM)的方法寻找合理的对照组:通过寻找可对比的省份作为调价前后对比评估的控制组,从而合成与实验组省份数据特征相似的虚拟控制组。
方案详情:
模型介绍:用干预临界点前后很近的观测数据构造实验组和对照组。
业务背景:公众号每周四会发推文,推文提醒方式从强提醒改为了弱提醒,评估其对公众号触达转化率的影响。
数据处理:
方案设计:
数据拟合:
WHEN:当无法设计完美随机实验的时候,从观察性的数据中去(拟合随机试验)测算因果效应。
WHAT:本质是剥离我们所不关心的外部变量对结果的影响,从而精准估计到我们所关心的策略因素对结果的单一影响。
HOW:评估方法的选择本质上可以总结为:使用场景识别选择合适的因果推断方法,并使用合适的方法结合业务真实数据来解决问题。
问题判别:评估计算的是群体效应(ATE)、无法进行 AB 实验。
核心思想:人为创造一个虚拟对照组与策略上线数据做比较估计策略真实效果。
使用方法:PSM\SCM\Casual Impact\DID。
常见场景:
问题判别:探究干预(策略)对于不同用户的异质效应(又叫 HTE),指的是哪些细分用户对策略更敏感更容易被影响以及影响有多少,更好的归因和理解不同的用户群,传统做法是多维分析,效率低,容易犯错。
核心思想:对某个干预敏感度最大的一批人。
使用方法:因果树/因果森林。
常见场景:通常情况下,是结合实验来做分析的。
“携程技术”公众号
分享,交流,成长