构建面向大模型的安全治理体系

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1. 构建面向大模型的 安全治理体系 演讲人:张浩然 作业帮 / 高级架构师
2. 目录 01 02 03 04 背景及挑战 大模型与治理 体系建设 应用实践和 效果收益 总结与展望
3.
4. 01 背景及挑战
5. 背景介绍 互联网智能化与AI大模型双重驱动下,信息安全领域面临前所未有的复杂挑战 攻击威胁进化 内部复杂性 • AI工具降低攻击门槛,效率呈指数级增长 • 多元化业务场景:互联网、智能硬件、AIGC • 攻击者呈现组织化、产业化趋势 • 数万员工规模团队,全国十几个工区 • 日均恶意尝试从10万次攀升至几十万次 • 各类loT智能设备接入增加防御难度 三层防御体系 网络层 传输层 终端层 网络域控隔离、双因素认证、内网零 信任网关、身份鉴权、动态权限策略 威胁检测系统、流量探针、深度网络 流量分析、文件沙箱隔离检测 智能EDR系统全覆盖、预装强装网络 检测、95%以上终端覆盖率
6. 面临的挑战 安全防御体系运营能力面临两大挑战: 无效报警占用了太多人力 报警处理需要一定的专业度 日均接近2w条安全告警,有效信号不足15% 大多数报警需要复杂的场景判断,规则引擎无法高效处理 安全专家深陷噪声"海洋",处置效率严重受阻 SOP流程复杂且难以维护,新人员工误判率高
7. 核心挑战 – 无效报警占用太多人力 报警数量太多 • 终端数量众多,日均近2w条报警,高危数据 仅占15% 中低数据延后处理 • 大量数据和有限的人手和时间权衡下 • 不得不选择聚焦高危问题,将中低危问题延后处理 效率不足、响应滞后 规则引擎可能存在误报,延后处理可能潜藏问题 • 高危数据中可能存在误报 • 中低危数据也可能存在遗漏 • 安全专家80%以上的时间浪费在实际上不需 要处理的事情上 • 对于中危的暂时搁置,导致很多潜在问题未 被发现
8. 核心挑战2 – 报警决策需要专业度 场景案例:弱密码报警处理 访问外部系统 访问内部系统 对公网地址的登陆,大多是可以忽略的 大多数场景需要治理 如果是本公司公网地址,则需要处理 门禁、打印机、部分测试服务可以忽略 需要额外溯源分析访问目的和上下文 数据库和关键业务系统则需要立即处理
9. 02 大模型与治理体系建设
10. 传统方案局限性 传统安全运营模式 人工专家 + 规则 + 智能安全运营模式 系统处置 VS 推理模型 + RAG + Agent 自动化响应,持续学习优化 手动规则更新,专家经验依赖 低效率处置 知识碎片化 • 人工处置速度约20条/人/小时,与告警产生速度形成20倍差距 • 典型攻击场最和内部审计场景的处置经验分散在多套知识库 • 日均1.5万条低危告警长期未被覆盖,潜藏0.12%真实安全事件 • 大部分判断标准无法形成可沉淀的规则特征,呈现黑盒状态 识别能力有限 决策失误代价高 • 规则复杂且识别能力有限,仅能处理预设的威胁模式,容易被 复杂场景绕过 • 安全运营人员能力参差不齐,告警响应准确率不足89% • 90%威胁研判依赖专家经验,错误处置容易导致二次事件
11. 大模型引入:突破传统瓶颈 通用大模型应用挑战 协同智能解决方案 大模型幻觉、确定性缺失 推理模型 非事实性回应与随机输出,同等条件下结果偏差超过30% 基于Deepseek等长推理大模型,突破多步逻辑推理瓶颈 强化复杂多步骤推导能力 维持上下文逻辑关联一致性 推理能力差,逻辑断层 检索增强生成 多步推导逻辑断层,无法有效关联报警上下文关键要素 多路召回策略,实现精准高效的知识库检索与匹配 向量检索+关键词增强 最小指令设计降低幻觉 数据过时、特定知识匮乏 智能Agent 缺少企业业务数据和历史处置方案,无法准确理解企业场景 自动执行处置,实现安全运营闭环与持续反馈 自动执行杀毒、工单等操作 知识库不断优化与自我完善
12. RAG助力体系能力提升 输入流程 报警标准化 关键信息补充 提取时间、ID、IP等核心字段 情报Agent调用丰富数据 向量化 BGE-M3模型精准捕捉语义 大模型推理 最小指令方式减少幻觉 输出流程 知识库反馈 自动处置 交叉验证 模型决策 持续优化数据质量 Agent执行杀毒等操作 多模型交叉验证结果 处置决策与解释输出
13. RAG助力体系能力提升 P 上下文补充 大模型智能决策 补全场景信息、追溯历史相似案例 多模型交叉验证 A 离线&在线 数据飞轮 知识库反馈 D Agent自动化执行 持续优化、补充案例库 非确定结果人工审核 C
14. 技术架构-实时报警处置 原始报警数据标准化 向量化(embedding) 保留核心字段:时间、报警ID、IP信息、威胁特征、网络数据和地 理位置 BGE-M3模型向量化,精准捕捉语义并保持强大泛化能力 完善补充关键信息 多路召回 调用情报agent区分内外网、定位责任方、识别设备、评估威胁级别 结合向量检索与关键词检索,确保相关案例全面召回 大模型处置 Agent自动化执行 采用最小指令方式,依赖参考内容,减少模型幻觉 自动下发杀毒措施、发起工单、误报加白、添加高危黑名单 多模型交叉验证 多基座模型结果一致则采纳,出现分歧则互验,无法达成共识时人 工处理 反馈优化数据库 人工处理案例自动入库,已有相似案例则优化召回策略和规则逻辑 核心效果指标 处置时间1分钟内 自动化率99.99% 召回率99%+ 原小时级 人工减少99% 原89.1%
15. 技术架构-知识库构建 数据打标 文本分块 向量化 人工审核 持续优化 数据打标 知识入库 知识库优化 • 历史报警数据全面整理与人工标注 • 相似度检索(>95%) 避免重复入库 • 统一标注平台确保分类一致性 • 新型案例入库扩充知识储备 • 非常见案例重点审核保障准确性 • 针对误判案例持续优化召回策略
16. 03 应用实践
17. 应用实践:威胁流量检测 流量分析与场景、历史案例关联,生成智能治理建议 结合多维上下文:时段特征、安全域、业务环境等 区分测试/生产、办公/服务设备,场景化威胁检测
18. 效果展示 自动处置率 处置时间 告警召回率 人工介入从日均1000条降至10条以内 从小时级响应提升至分钟级 从人工平均89.1%显著提升 AI系统 vs 传统人工方式效率对比 量级突破 系统实现运营效率量级提升,安全防御体系达到SOMM模型中最高级别(LEVEL 4 韧性级)
19. 效果展示 精准度与召回率的权衡:系统采用激进策略,优先提高召回率 尽可能多地拦截可疑告警,通过人工高效复核确保安全 精度-召回率-处理量周统计 核心发现 一周处理数据统计 | 99%+ 召回率 基于深度推理模型方案相比通用大模 型,复杂安全决策准确率提升18.7% 不同模型性能对比 召回率维持在99%以上,确保关键 安全威胁不漏报 基于相同测试集的效果评估 | +18.7% 准确率提升 Deepseek等⻓推理模型在多步逻辑 推理任务中表现最佳
20. 04 总结与展望
21. 核心价值 可持续优化 智能化 自动化
22. 未来发展方向 落地AI实践、 多场景扩展, 持续数据飞轮优化, 推动安全治理跨越式发展 支持更广泛的安全治理需求 不断提升系统智能化水平
23. Thank You 「代码传递思想.技术创造回响」

首页 - Wiki
Copyright © 2011-2025 iteam. Current version is 2.146.0. UTC+08:00, 2025-10-20 18:45
浙ICP备14020137号-1 $访客地图$