构建面向大模型的安全治理体系

如果无法正常显示，请先停止浏览器的去广告插件。

1. 构建面向大模型的安全治理体系演讲人：张浩然作业帮 / 高级架构师

2. 目录 01 02 03 04 背景及挑战大模型与治理体系建设应用实践和效果收益总结与展望

4. 01 背景及挑战

5. 背景介绍互联网智能化与AI大模型双重驱动下，信息安全领域面临前所未有的复杂挑战攻击威胁进化内部复杂性 • AI工具降低攻击门槛，效率呈指数级增长 • 多元化业务场景：互联网、智能硬件、AIGC • 攻击者呈现组织化、产业化趋势 • 数万员工规模团队，全国十几个工区 • 日均恶意尝试从10万次攀升至几十万次 • 各类loT智能设备接入增加防御难度三层防御体系网络层传输层终端层网络域控隔离、双因素认证、内网零信任网关、身份鉴权、动态权限策略威胁检测系统、流量探针、深度网络流量分析、文件沙箱隔离检测智能EDR系统全覆盖、预装强装网络检测、95%以上终端覆盖率

6. 面临的挑战安全防御体系运营能力面临两大挑战：无效报警占用了太多人力报警处理需要一定的专业度日均接近2w条安全告警，有效信号不足15% 大多数报警需要复杂的场景判断，规则引擎无法高效处理安全专家深陷噪声"海洋"，处置效率严重受阻 SOP流程复杂且难以维护，新人员工误判率高

7. 核心挑战 – 无效报警占用太多人力报警数量太多 • 终端数量众多，日均近2w条报警，高危数据仅占15% 中低数据延后处理 • 大量数据和有限的人手和时间权衡下 • 不得不选择聚焦高危问题，将中低危问题延后处理效率不足、响应滞后规则引擎可能存在误报，延后处理可能潜藏问题 • 高危数据中可能存在误报 • 中低危数据也可能存在遗漏 • 安全专家80%以上的时间浪费在实际上不需要处理的事情上 • 对于中危的暂时搁置，导致很多潜在问题未被发现

8. 核心挑战2 – 报警决策需要专业度场景案例：弱密码报警处理访问外部系统访问内部系统对公网地址的登陆，大多是可以忽略的大多数场景需要治理如果是本公司公网地址，则需要处理门禁、打印机、部分测试服务可以忽略需要额外溯源分析访问目的和上下文数据库和关键业务系统则需要立即处理

9. 02 大模型与治理体系建设

10. 传统方案局限性传统安全运营模式人工专家 + 规则 + 智能安全运营模式系统处置 VS 推理模型 + RAG + Agent 自动化响应，持续学习优化手动规则更新，专家经验依赖低效率处置知识碎片化 • 人工处置速度约20条/人/小时，与告警产生速度形成20倍差距 • 典型攻击场最和内部审计场景的处置经验分散在多套知识库 • 日均1.5万条低危告警长期未被覆盖，潜藏0.12%真实安全事件 • 大部分判断标准无法形成可沉淀的规则特征，呈现黑盒状态识别能力有限决策失误代价高 • 规则复杂且识别能力有限，仅能处理预设的威胁模式，容易被复杂场景绕过 • 安全运营人员能力参差不齐，告警响应准确率不足89% • 90%威胁研判依赖专家经验，错误处置容易导致二次事件

11. 大模型引入：突破传统瓶颈通用大模型应用挑战协同智能解决方案大模型幻觉、确定性缺失推理模型非事实性回应与随机输出，同等条件下结果偏差超过30% 基于Deepseek等长推理大模型，突破多步逻辑推理瓶颈强化复杂多步骤推导能力维持上下文逻辑关联一致性推理能力差，逻辑断层检索增强生成多步推导逻辑断层，无法有效关联报警上下文关键要素多路召回策略，实现精准高效的知识库检索与匹配向量检索+关键词增强最小指令设计降低幻觉数据过时、特定知识匮乏智能Agent 缺少企业业务数据和历史处置方案，无法准确理解企业场景自动执行处置，实现安全运营闭环与持续反馈自动执行杀毒、工单等操作知识库不断优化与自我完善

12. RAG助力体系能力提升输入流程报警标准化关键信息补充提取时间、ID、IP等核心字段情报Agent调用丰富数据向量化 BGE-M3模型精准捕捉语义大模型推理最小指令方式减少幻觉输出流程知识库反馈自动处置交叉验证模型决策持续优化数据质量 Agent执行杀毒等操作多模型交叉验证结果处置决策与解释输出

13. RAG助力体系能力提升 P 上下文补充大模型智能决策补全场景信息、追溯历史相似案例多模型交叉验证 A 离线&在线数据飞轮知识库反馈 D Agent自动化执行持续优化、补充案例库非确定结果人工审核 C

14. 技术架构-实时报警处置原始报警数据标准化向量化(embedding) 保留核心字段：时间、报警ID、IP信息、威胁特征、网络数据和地理位置 BGE-M3模型向量化，精准捕捉语义并保持强大泛化能力完善补充关键信息多路召回调用情报agent区分内外网、定位责任方、识别设备、评估威胁级别结合向量检索与关键词检索，确保相关案例全面召回大模型处置 Agent自动化执行采用最小指令方式，依赖参考内容，减少模型幻觉自动下发杀毒措施、发起工单、误报加白、添加高危黑名单多模型交叉验证多基座模型结果一致则采纳，出现分歧则互验，无法达成共识时人工处理反馈优化数据库人工处理案例自动入库，已有相似案例则优化召回策略和规则逻辑核心效果指标处置时间1分钟内自动化率99.99% 召回率99%+ 原小时级人工减少99% 原89.1%

15. 技术架构-知识库构建数据打标文本分块向量化人工审核持续优化数据打标知识入库知识库优化 • 历史报警数据全面整理与人工标注 • 相似度检索(>95%) 避免重复入库 • 统一标注平台确保分类一致性 • 新型案例入库扩充知识储备 • 非常见案例重点审核保障准确性 • 针对误判案例持续优化召回策略

16. 03 应用实践

17. 应用实践：威胁流量检测流量分析与场景、历史案例关联，生成智能治理建议结合多维上下文：时段特征、安全域、业务环境等区分测试/生产、办公/服务设备，场景化威胁检测

18. 效果展示自动处置率处置时间告警召回率人工介入从日均1000条降至10条以内从小时级响应提升至分钟级从人工平均89.1%显著提升 AI系统 vs 传统人工方式效率对比量级突破系统实现运营效率量级提升，安全防御体系达到SOMM模型中最高级别（LEVEL 4 韧性级）

19. 效果展示精准度与召回率的权衡：系统采用激进策略，优先提高召回率尽可能多地拦截可疑告警，通过人工高效复核确保安全精度-召回率-处理量周统计核心发现一周处理数据统计 | 99%+ 召回率基于深度推理模型方案相比通用大模型，复杂安全决策准确率提升18.7% 不同模型性能对比召回率维持在99%以上，确保关键安全威胁不漏报基于相同测试集的效果评估 | +18.7% 准确率提升 Deepseek等⻓推理模型在多步逻辑推理任务中表现最佳

20. 04 总结与展望

21. 核心价值可持续优化智能化自动化

22. 未来发展方向落地AI实践、多场景扩展，持续数据飞轮优化，推动安全治理跨越式发展支持更广泛的安全治理需求不断提升系统智能化水平

23. Thank You 「代码传递思想.技术创造回响」