欢迎大家来到【风控基建实战】
风控团队与黑灰产的对抗是动态且激烈的,技术也在不断迭代升级。我们希望通过一系列硬核技术分享,与风控岗位的小伙伴们加深交流,共同夯实业务基石。
引言:从大禹治水到AI时代的因果革命
张衡地动仪:从“神怒”到“物理因果”的科学觉醒
16世纪,地震仍被视作“神灵震怒”,缺乏科学解释。东汉张衡发明的地动仪,通过铜铸龙口吐球的机械联动,首次实现了地震方向的实时监测。其核心原理是利用惯性原理感知震动,触发对应方位的铜球坠落,精准预测了千里之外的陇西地震。从神秘主义到实证科学,张衡的因果模型为地震学奠定基础。现代复原实验表明,该装置对4级以上地震的方位判断准确率达82%,其原理至今启发着地震预警系统的设计。
DeepSeek R1:AI开启因果推断新纪元
GPT-4虽能生成流畅文本,却无法回答“删除神经元如何影响输出”这类因果问题——这暴露了传统大模型依赖统计相关性的局限。DeepSeek R1的突破在于引入因果推理模块:通过GRPO算法(群组相对优势优化)构建“思考-验证”双阶段模型,显示建模干预效应。例如在洪水预测中,R1不仅能分析历史数据相关性,还能模拟“若某区域堤坝加高1米,淹没风险如何变化”。这相当于在AI大脑中植入“因果透镜”,使模型能区分“点击广告”与“真实购买意愿”的混淆因素。
从大禹“因势利导”的治水智慧,到张衡机械装置揭示的地震因果,再到AI通过算法逼近复杂因果关系,人类始终在探索“现象-规律-干预”的闭环。这种思维范式的迭代,本质是“从被动适应到主动干预,从经验总结到理论验证”的进化。在如今的商业决策领域,人们也遇到了各类问题,例如在金融场景,给哪些用户进行短信触达才能在不明显影响体验同时提升获客转化?如何识别那些只有发权益才来申请产品而不发权益则不会申请的用户?给哪些用户提额不会带来风险逾期率的弹跳同时能增加GMV?基于因果关系的推断决策是解决这类问题的有效途径之一。
1、因果关系:超越统计相关的深层关系
因果关系的本质在于事件A直接引发事件B,而非仅存在统计关联。早在古希腊时期,亚里士多德提出“四因说”,试图用质料因、形式因、动力因和目的因解释万物起源。18世纪休谟进一步提出因果是“经验间的习惯性联想”,强调时间顺序与恒常连结性。但直到现代数学工具的发展,人类才真正将因果关系从哲学思辨转化为可量化的科学模型。
经典的正反案例如下:
伪相关案例:冰激凌销量与溺水率在夏季同步上升,看似强相关,实则由高温这一共同原因驱动——高温促使更多人游泳(增加溺水风险)和购买冰激凌。类似地,巧克力消费量与诺贝尔奖得主数量的正相关,实则是国家经济水平同时影响两者。
真实因果案例:吸烟与肺癌的因果关系通过随机对照实验验证。研究发现,吸烟者患肺癌风险比非吸烟者高80%,且存在剂量反应关系(吸烟量越大风险越高)。
其中因果关系与相关性的本区别为:相关性仅描述变量间的统计关联(如巧克力消费与诺贝尔奖数量的正相关),而因果性需通过实验验证内在机制(如随机对照试验证明吸烟致癌)。
因果关系相较于其他关系有如下关键特征:
必然性:因果关系的存在不依赖观察者意志,遵循“无因不成果,有果必有因”的规律。
时序性:原因必先于结果,但时序关联未必蕴含因果(如昼夜交替与天体运动的关系)。
复杂性:表现为多因一果(如地震由地壳运动、板块应力共同作用)、因果链嵌套(如经济周期影响企业决策)等。
工业界中因果关系的应用存在于三个层面:
1)关联层面:基于历史数据总结的一种关系,两件事情总是相伴发生;
2)干预层面:面向未来预测的一种关系,如果做了某件事,会发生什么样的结果;
3)反事实层面:面向过去复盘的一种关系,如果当初做了不一样的行动,会发生什么样的结果。
经典的机器学习算法和大模型早期的版本,大多处于第一层的关联层面,即基于历史数据找到强关联的关系,例如通过冰激凌销量来预测溺水率。这种解法存在多方面问题:
i)解释性差,无法给出符合常识的逻辑关系;
ii)泛化性差,给未来的预测带来较大不确定性。而因果推断技术则会从第二、三层面出发,给出更合理的解释和更稳定的预测结果。DeepSeek R1也是通过在第二、三层面的突破,显示呈现思考链路,给用户带来惊喜。
2、因果推断:操控未来变量的锦囊妙计
维度 | 潜在结果框架(POF) | 结构因果模型(SCM) |
理论基础 | 基于反事实潜在结果,强调个体效应估计 | 基于结构方程与DAG,强调系统因果机制建模 |
数学工具 | 统计推断(均值差异、回归调整) | 图论与do算子演算 |
核心假设 | SUTVA、可忽略性、一致性 | 模块性、因果马尔可夫条件、因果充分性 |
优势场景 | 随机实验、个体效应估计 | 观察性研究、复杂因果路径分析 |
局限性 | 依赖可忽略性假设,无法处理未观测混杂 | 需准确因果图,高维计算复杂 |
应用建议:
方法
| 核心假设 | 数据需求 | 适用场景 | 优势 | 局限 |
随机实验 | 随机分配无混杂 | 实验数据 | 可控的小规模测试 | 无偏估计、结果可靠 | 成本高、泛化性差 |
PSM | 可观测混杂充分 | 横截面观测数据 | 非实验场景的个体级效果评估 | 灵活易用 | 依赖可观测变量 |
DID | 平行趋势 | 面板数据 | 政策或策略的群体级效果评估 | 控制时间不变混杂 | 动态效应难捕捉 |
合成控制法 | 对照组可合成 | 时间序列数据 | 地区/群体干预效果评估 | 适用于少量实验组 | 过拟合风险 |
3、应用实践:增益模型在因果推断框架下的落地路径
维度
| 单模型法 | 双模型法 | 双阶段修正法 | 类别转换法 | 因果森林 |
建模效率 | 高(单模型) | 中(双模型) | 低(四阶段) | 高(单模型) | 中(树集成) |
数据需求 | 全量数据 | 组间均衡 | 组间非均衡 | 组间1:1 | 高维特征 |
可解释性 | 低 | 中 | 中 | 高(直接输出增益) | 高(特征重要性) |
工业落地优先级 | 多Treatment场景 | 小规模AB测试 | 非对称样本 | 二值干预 | 复杂因果路径 |
参考文献
1 Pearl, J. (2009),Causality: Models, Reasoning, and Inference,Cambridge University Press。
2 Athey, S., Imbens, G. (2015),Causal Inference for Statistics,Social, and Biomedical Sciences。
3 Wager, S., Athey, S. (2018), Estimation and Inference of Heterogeneous Treatment Effects using Random Forests,Journal of the American Statistical Association。
4 DeepSeek-AI etc. (2025),DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning。
扫码关注得物风控,获得最新鲜的购物反诈提醒!
也可在“得物App”关注“得物风控安全助手”哦~