数据智能的高可用实时风控决策系统
如果无法正常显示,请先停止浏览器的去广告插件。
1. 数据智能驱动的
高可用实时金融风控决策系统
蚂蚁金服消费金融事业群大消金技术部风管技术部贷中平台技术团队
马希民
2. 概述
极速响应 极致安全生产 高可用 策略寻优
海量用户请求
海量数据
大规模决策树 策略完整验证
数据变动影响评估 直播态
大促态
策略异常态 策略优化求解
约束条件下策略推荐
花呗/信用卡贷中实时风控业务
3. 概述
业务:有横有纵,分层分级
决策流程数字化
基于bpmn2.0决策流
决策流程映射决策树
规则数字化
基于ANTLR类SQL语法DSL
规则编排分层分级
4. 概述
极致安全生产
极速响应
取数优化、规则执行优化
预决策、多级决策
全链路beta
Beta、灰度、监控体系建设
高可用 策略寻优
规则熔断 阈值调优
A/B实验体系建设
规则自适应降级
规则数字化 + 决策流程数字化
5. 性能之道:多级决策
名单、准入、等级过滤
快速决策
快速拦截问题流量,快速放过优质流量
分层分级的量化规则集合
最主要的规则分层,大部分流量可以获得决策结果
模型打分、图相关行为规则
形成流量漏斗
只运行最必要的规则
量化决策
深度决策
可疑流量进行深度决策,判断是否放过
实时计算任务,依赖多种数据源,计算复杂特征
无法对当笔流量进行判断,为下一笔的支用储备数据
异步
决策
6. 性能之道:预决策 + 弹性决
策
在线链路获取预决策缓存结果
在线链路运行部分规则,甚至不需要运行规则
预决策的决策树是在线链路的子树
预决策提前计算的规则是在线链路可能规则的子集
预测最具性价比的规则、特征
降低在线链路IO消耗,减小在线链路规则运行规模
提前计算高性价比规则
降低在线链路IO耗时
7. 性能之道:决策引擎
风险矩阵
规则剪枝
管理时静态维护策略规则所属矩阵范围 离线静态分析可能具有性价比的剪枝规则
运行时O(1)的复杂度筛选出需要运行的规则集合 运行时动态计算,提前获取结果或减少需要查询的特征数量
8. 安全生产:全链路beta
信贷严谨性
数据、规则的变动需要测算全局影响
数据的变动会对决策子树的生成产生全局影响
数据变动影响可测算
决策流程数字化
单个节点有beta、release两个实现
支撑了决策子树动态生成的可旁路验证
规则数字化
新规则、迭代规则上线前都会有beta版本
支撑了风险矩阵生成的可旁路验证
规则变动影响可测算
9. 高可用:自适应降级
对大商户的SLA承诺,系统的异常状态需要在分钟级恢复
活动状态的保障需要尽可能少的人工介入,否则无法达到响应要求
策略异常态
直播态、大促态
多维度:商户、规则 实时计算任务聚合获取熔断信息 日常维护特定商户、场景的降级配置、方案
多指标:分钟/小时级别的通过率、拦截量 平台提供熔断配置信息 单机在感知到流量突增时自动切换
10. 决策智能化:传统策略研发流程
离线
旁路
在线
通过流量仿真的方式测算策略迭代的影响 验证策略符合预期,无实际风险表现 线上决策结果回流离线日志分析影响
存在离在线不一致的问题 只能验证正确性,无法验证有效性 迭代效率慢,无法快速验证策略有效性
流量仿真 特征仿真 方案beta 线上表现
模型仿真 图仿真 全链路beta 离线测算
11. 决策智能化:数据智能驱动的研发流程
指标繁多,套现率、FPD、挡后支付等等,策略迭代对应多目标优化问题,仅靠专家经验难以做到最优
离线测算与在线存在一致性问题,旁路验证无实际的风险表现
A/B实验体系
阈值优化
分层分域,根据策略维度不同使用不同的分流因子 策略阈值的局部调优,梯度反向传播寻优获得局部最优解
完备的指标体系,支持业务方对实验效果做出更充分的评估 专家给出策略框架,阈值优化完善策略细节
12. 谢谢