个推数据智能五步法实践与应用
如果无法正常显示,请先停止浏览器的去广告插件。
1. 数智 · 同行
第三届大数据技术沙龙
2. 个推数据智能五步法实践与应用
两天
个推 | 数据开发工程师
3. 目录
数据智能五步法
机器学习平台
中立国模式
4. 数据智能五步法
5. 数字化营销痛点
获客成本攀升
随着互联网行业的发展,品牌
层出不穷,竞争激烈
投放归因困难
" 我知道我的广告费有一半被
浪费掉了,但我不知道是哪一
半"
ROI 提升乏力
如何“把钱花在刀刃上”,减
少资源的无效投入?
6. 数据智能上市企业
SDK 累计安装量超 760 亿
数据中台
技术中台
数
据
积
累
其中智能 IoT 设备 SDK 累计安装量超 1.5
亿
SDK 日活跃独立设备数超 4 亿
其中智能 IoT 设备日活跃数超 2500
万
数据来源:个推 ( 注:数据截至 2021 年 6 月)
7. 品牌营销
用户增长
风控服务
智慧城市
公共服务
8. 个推数据能力
基础标签 兴趣标签
刻画性别、年龄段、消费水平等基础画像 反映人群近期线上兴趣及应用偏好
9. 数据智能五步法
01 用户深度洞察
02 用户精准分群
03 行为归因分析
10. 机器学习平台
11. CPS
Cost
Perf
Stability
12. 传统机器学习开发流程
需求确定
数据获取
数据清洗
特征工程
算法工程
模型训练
可以看出,在模型开发流程中,数据分析
80% 的工作是在处理数据和开发工程
投放输出
预测分析
模型评估
13. 传统机器学习开发流程
• 人效成本高
• 开发周期长,模型效果评估需要反复开发验证
• 缺乏标准化流程,数据处理流程长,稳定性难以保障
14. 个推数据中台“每日治数平台”
15. 每日治数平台 - 机器学习平台架构图
16. 数据洞察
上传样本后 自动进行数据打通、特征匹
配、数据洞察
分析师通过词云和 TGI 、 IV 指标 快速评估
特征价值 ,筛选有效特征用于模型训练
基于个推丰富的标签特征库和标签平台个性化
业务特征构建, 保证样本质量足够丰富
17. 模型训练
通过个推大数据计算引擎 GQL 构造模型训练
模板和数据分析计算流程, 分析师在平台上
即可完成模型训练
将回归结果进行分箱,五个分包和实际正样本
数据进行 mapping ,对比模型分值和真实结
果, 直观洞察特征区分度和模型效果
18. 数据预测
分析师评估通过的模型可以
直接在平台上进行数据预测
平台提供了预测推荐和数据输出,
一站式解决投放策略
投放约 20% 的预测人群即可
击中 80% 的消费者
19. 计算流程
系统设计 重点关注模型训练 ,提升质
量和效果
数亿级别 的样本数据洞察训练时间可以
控制在 1 小时 内
数据分析指标图标工程标准化 ,分
析师可以直接训练完成后进行端详洞察
20. 算法模块化
NLP
MultiClassifi
cation
LR
Tensorflow
K-means
……
21. 中立国模式
22. 联合建模的顾虑
如何保证数据不会泄漏?
另一方知道了我的样本人群和投放对象怎么办?
合法合规
23. 整体设计
中立国是一个独立的数据安全计
算环境
它满足了数据供应方和使用方的
数据融合计算需求,也避免数据
传输过程中的安全合规性问题
24. 数据安全
客户数据在客户本地加密 客户数据存储和流转数据 安全网关、日志审计、安全算
中立国不涉及数据解密 存储分开,互相不可见 法等运维技术保障
25. 中立国环境
数据信任
个推环境
用户本地加密数据
通过中立国服务
进行数据加密传输
进行数据加密扩量
通过中立国服务
进行数据加密传输和
解析
客户数据全程加密,加密方式保存在客户本地
确保数据安全可控
在中立国安全计
算环境下进行模
型训练预测
客户筛选目标
人群进行投放
26. THANKS
数据让产业更智能
,
个推与您结伴前行
!
两天
个推 | 数据开发工程师
www.GeTui.com