构建面向大模型的安全治理体系
如果无法正常显示,请先停止浏览器的去广告插件。
1. 构建面向大模型的
安全治理体系
演讲人:张浩然
作业帮 / 高级架构师
2. 目录
01 02 03 04
背景及挑战 大模型与治理
体系建设 应用实践和
效果收益 总结与展望
3.
4. 01
背景及挑战
5. 背景介绍
互联网智能化与AI大模型双重驱动下,信息安全领域面临前所未有的复杂挑战
攻击威胁进化
内部复杂性
• AI工具降低攻击门槛,效率呈指数级增长 • 多元化业务场景:互联网、智能硬件、AIGC
• 攻击者呈现组织化、产业化趋势 • 数万员工规模团队,全国十几个工区
• 日均恶意尝试从10万次攀升至几十万次 • 各类loT智能设备接入增加防御难度
三层防御体系
网络层 传输层 终端层
网络域控隔离、双因素认证、内网零
信任网关、身份鉴权、动态权限策略 威胁检测系统、流量探针、深度网络
流量分析、文件沙箱隔离检测 智能EDR系统全覆盖、预装强装网络
检测、95%以上终端覆盖率
6. 面临的挑战
安全防御体系运营能力面临两大挑战:
无效报警占用了太多人力 报警处理需要一定的专业度
日均接近2w条安全告警,有效信号不足15% 大多数报警需要复杂的场景判断,规则引擎无法高效处理
安全专家深陷噪声"海洋",处置效率严重受阻 SOP流程复杂且难以维护,新人员工误判率高
7. 核心挑战 – 无效报警占用太多人力
报警数量太多
• 终端数量众多,日均近2w条报警,高危数据
仅占15%
中低数据延后处理
• 大量数据和有限的人手和时间权衡下
• 不得不选择聚焦高危问题,将中低危问题延后处理
效率不足、响应滞后
规则引擎可能存在误报,延后处理可能潜藏问题
• 高危数据中可能存在误报
• 中低危数据也可能存在遗漏
• 安全专家80%以上的时间浪费在实际上不需
要处理的事情上
• 对于中危的暂时搁置,导致很多潜在问题未
被发现
8. 核心挑战2 – 报警决策需要专业度
场景案例:弱密码报警处理
访问外部系统 访问内部系统
对公网地址的登陆,大多是可以忽略的 大多数场景需要治理
如果是本公司公网地址,则需要处理 门禁、打印机、部分测试服务可以忽略
需要额外溯源分析访问目的和上下文 数据库和关键业务系统则需要立即处理
9. 02
大模型与治理体系建设
10. 传统方案局限性
传统安全运营模式
人工专家
+
规则
+
智能安全运营模式
系统处置
VS
推理模型
+
RAG
+
Agent
自动化响应,持续学习优化
手动规则更新,专家经验依赖
低效率处置 知识碎片化
• 人工处置速度约20条/人/小时,与告警产生速度形成20倍差距 • 典型攻击场最和内部审计场景的处置经验分散在多套知识库
• 日均1.5万条低危告警长期未被覆盖,潜藏0.12%真实安全事件 • 大部分判断标准无法形成可沉淀的规则特征,呈现黑盒状态
识别能力有限 决策失误代价高
• 规则复杂且识别能力有限,仅能处理预设的威胁模式,容易被
复杂场景绕过 • 安全运营人员能力参差不齐,告警响应准确率不足89%
•
90%威胁研判依赖专家经验,错误处置容易导致二次事件
11. 大模型引入:突破传统瓶颈
通用大模型应用挑战
协同智能解决方案
大模型幻觉、确定性缺失 推理模型
非事实性回应与随机输出,同等条件下结果偏差超过30% 基于Deepseek等长推理大模型,突破多步逻辑推理瓶颈
强化复杂多步骤推导能力
维持上下文逻辑关联一致性
推理能力差,逻辑断层 检索增强生成
多步推导逻辑断层,无法有效关联报警上下文关键要素 多路召回策略,实现精准高效的知识库检索与匹配
向量检索+关键词增强
最小指令设计降低幻觉
数据过时、特定知识匮乏 智能Agent
缺少企业业务数据和历史处置方案,无法准确理解企业场景 自动执行处置,实现安全运营闭环与持续反馈
自动执行杀毒、工单等操作
知识库不断优化与自我完善
12. RAG助力体系能力提升
输入流程
报警标准化 关键信息补充
提取时间、ID、IP等核心字段 情报Agent调用丰富数据
向量化
BGE-M3模型精准捕捉语义
大模型推理
最小指令方式减少幻觉
输出流程
知识库反馈 自动处置 交叉验证 模型决策
持续优化数据质量 Agent执行杀毒等操作 多模型交叉验证结果 处置决策与解释输出
13. RAG助力体系能力提升
P
上下文补充
大模型智能决策
补全场景信息、追溯历史相似案例
多模型交叉验证
A
离线&在线
数据飞轮
知识库反馈
D
Agent自动化执行
持续优化、补充案例库
非确定结果人工审核
C
14. 技术架构-实时报警处置
原始报警数据标准化
向量化(embedding)
保留核心字段:时间、报警ID、IP信息、威胁特征、网络数据和地
理位置
BGE-M3模型向量化,精准捕捉语义并保持强大泛化能力
完善补充关键信息 多路召回
调用情报agent区分内外网、定位责任方、识别设备、评估威胁级别 结合向量检索与关键词检索,确保相关案例全面召回
大模型处置 Agent自动化执行
采用最小指令方式,依赖参考内容,减少模型幻觉 自动下发杀毒措施、发起工单、误报加白、添加高危黑名单
多模型交叉验证
多基座模型结果一致则采纳,出现分歧则互验,无法达成共识时人
工处理
反馈优化数据库
人工处理案例自动入库,已有相似案例则优化召回策略和规则逻辑
核心效果指标
处置时间1分钟内 自动化率99.99% 召回率99%+
原小时级 人工减少99% 原89.1%
15. 技术架构-知识库构建
数据打标
文本分块 向量化
人工审核 持续优化
数据打标
知识入库
知识库优化
• 历史报警数据全面整理与人工标注 • 相似度检索(>95%) 避免重复入库
• 统一标注平台确保分类一致性 • 新型案例入库扩充知识储备
• 非常见案例重点审核保障准确性 • 针对误判案例持续优化召回策略
16. 03
应用实践
17. 应用实践:威胁流量检测
流量分析与场景、历史案例关联,生成智能治理建议
结合多维上下文:时段特征、安全域、业务环境等
区分测试/生产、办公/服务设备,场景化威胁检测
18. 效果展示
自动处置率 处置时间 告警召回率
人工介入从日均1000条降至10条以内 从小时级响应提升至分钟级 从人工平均89.1%显著提升
AI系统 vs 传统人工方式效率对比
量级突破
系统实现运营效率量级提升,安全防御体系达到SOMM模型中最高级别(LEVEL 4 韧性级)
19. 效果展示
精准度与召回率的权衡:系统采用激进策略,优先提高召回率
尽可能多地拦截可疑告警,通过人工高效复核确保安全
精度-召回率-处理量周统计
核心发现
一周处理数据统计 | 99%+ 召回率
基于深度推理模型方案相比通用大模
型,复杂安全决策准确率提升18.7%
不同模型性能对比
召回率维持在99%以上,确保关键
安全威胁不漏报
基于相同测试集的效果评估 | +18.7% 准确率提升
Deepseek等⻓推理模型在多步逻辑
推理任务中表现最佳
20. 04
总结与展望
21. 核心价值
可持续优化
智能化
自动化
22. 未来发展方向
落地AI实践、 多场景扩展, 持续数据飞轮优化,
推动安全治理跨越式发展 支持更广泛的安全治理需求 不断提升系统智能化水平
23. Thank You
「代码传递思想.技术创造回响」