背景
先选择一个特定活动和特定指标
选择一个比较感兴趣的切面做二次分析,选择下钻按钮,例如选择敏感人群切面
再分析得到敏感人群+用户性别切面的情况
活动指标切面分析: 找出活动本身效果最好的切面组合
AB桶效果切面分析: 找出实验桶和对照桶差异最大的切面组合
活动指标切面分析: 找出活动本身效果最好的切面组合
AB桶效果切面分析: 找出实验桶和对照桶差异最大的切面组合
获取效果最显著的人群切面组合,并给出每个人群切面下的指标结果
给出每个切面下最小样本量,小于最小样本量则结果有一定的偶然性和不确定性。
分析数据:输入几十个切面和单个分析指标。切面:例如性别、年龄、职业等,指标:例如购买率、发布率、次留率等。
相关分析:分析切面和指标,切面和切面的相关性,剔除一些强相关的切面。例如7天内购买数量和14天购买数量这两个切面如果存在强相关性只需要留一个就可以了。
聚类分析:将切面的连续型数值通过聚类算法聚类成离散的类别。
信息增益率计算:计算信息增益率最大的切面,并在这个切面的基础上递归获取最大信息增益的切面。
剪枝:小于人数和增益率的阈值,则剔除子节点。
获取最佳切面:分析切面有效性,计算最小有效样本量。
分析数据:输入几十个切面和单个分析指标。切面:例如性别、年龄、职业等,指标:例如购买率、发布率、次留率等。
相关分析:分析切面和指标,切面和切面的相关性,剔除一些强相关的切面。例如7天内购买数量和14天购买数量这两个切面如果存在强相关性只需要留一个就可以了。
聚类分析:将切面的连续型数值通过聚类算法聚类成离散的类别。
选取合理的切面组合:选取切面组合,计算最小有效样本量,设置阈值剔除人数过少和不满足最小样本量的切面组合。
获取最佳切面:获取差异最大和最小的切面组合。
桶xx(人数xxx 指标值5.62%)相比桶others(人数xxx 指标值4.86%)在切面是否敏感人群=1,30天内买家身份互动过的天数=xxx提升了0.76%(该置信度最小人数为xxx)
桶xx(人数xxx 指标值5.72%)相比桶others(人数xxx 指标值4.91%)在切面是否敏感人群=1,是否当天新会员=0提升了0.81%(该置信度最小人数为xxx)
桶xx(人数xxx 指标值5.73%)相比桶others(人数xxx 指标值4.91%)在切面最近30天的访问天数=x,是否敏感人群=1提升了0.81%(该置信度最小人数为xxx)
在预热阶段就准确预测了闲鱼222活动当天的购买率,为后续及时调整运营调整素材争取了时间。