端侧大模型的安全建设:如何在算力与保障之间找到平衡

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1. 李志伟
2. 目录
3.
4.
5.
6. AI大模型 端侧大模型 模型训练方式:云端 模型训练方式:数据中心或云端 VS 模型推理方式:服务器或云端 参数量:多为百亿/千级别 模型推理方式:端侧 参数量:多为十亿级别
7.
8. 预估未来4年,端侧大模型市场每年会以40~50%的增长率保持快速增长 90 79 单位:亿 61 60 47 31 30 21 8 0 2023 2024E 2025E 2026E 市场规模 2027E 2028E 数据来源:【头豹研究院】2024年中国端侧大模型行业研究
9.
10.
11.
12.
13. 。
14.
15. 代码攻击 (Code Attack) 输入中嵌入恶意代码片段,执行危险指令 拒绝遏制 (Refusal Suppression) 不断提出请求,直到模型执行危险的命令 正负对比 (Pos-Neg Contrast) 提供正反两面输入,使模型产生混淆/偏误 OWASP首次发布大模型的TOP10脆弱性 风险 前缀注入 (Prefix Injection) 输入之前添加特定指令/文本改变模型行为 指令注入 (Instruction Injection) 输入中插入特殊指令,改变模型行为 多轮越狱 (Many-shot Jailbreak) 基于多轮对话的机制诱导模型风险输出 邪恶密友 (Evil Confidant) 通过建立信任关系,让模型泄漏敏感信息 生成式反事实引导 (GCG) 向模型提供提供误导性输入,改变模型行为 组合攻击 (combo attacks ) 多种攻击手段结合使用,以绕过安全策略 · · ·
16. -参数/结构可被逆向工程 - 无云端级防火墙/入侵 -模型压缩(量化/剪 - 运行时内存/缓存中遗 提取;攻击者获得完整 检测等防护能力 枝)导致决策边界扭曲 留敏感信息,容易泄漏 模型后,可分析训练数 -只能依赖终端操作系统 -压缩模型对输入扰动敏 - 多应用间数据交叉污 据特征、复制模型架构 的基础防护 感 染
17.
18.
19. 企 业 用 户 平 台
20.
21.
22. • • • • 难 • • • •
23. 企 业 用 户 平 台
24. 稳定性 准召率 软硬件适配 重复 持续运算 72小时 load/unload (每万次输入) 运行 (每千次) 识别准确性 X86 ARM >95% 支持 性能 模型加载 目标 按需加载/ 释放 内存 支持 模型加载并 推理时间 CPU/NPU占 物理存储 完成初始化 (平均值) 用率(IDEL) 占用 (平均值) <=800ms <200ms 3% < 500M 内存 占用 功耗 运行电流 < 400M < 600mA 0次崩溃 0次崩溃 0次崩溃
25.
26. 监管部门针对端侧大模型的备案审查、与常态化管理过程中,核心关注如下问题: 离线用户 能否封禁 违规日志 能否上报 突发事件 能否处置 备案测试 场景化+离 线沙盒
27.
28. 端侧离线模型的应急处置方案 云端控制台 终端设备 词库管理 知识库管理 拦截策略管理 封禁阈值 模型阈值 违规日志解析 干预文件 基础配置 主动推送 定期同步 干预策略 离线x天 禁用AI功能 支持紧急情况 一键禁用 智能回复|辅助撰写|图片处理|个人助理 安全SDK加载更新文件并执行 定期拉取 本地基座大模型
29. 端侧场景在日常运营时,因无法像云端方案用户完整的用户日志做例行巡检,因此建立常态化/自动化的评测 评测数据集 场景化 对抗性 围绕Agent场景制定 复合风险评测体系 基础安全评测集 Promp t KDES 互联网黑词挖掘 高级攻击生成系统 多样性 毒性 构建仿写大模型快速扩 展 毒性增强技术 待 测 评 终 端 大 模 型 高级攻击评测集 评测报告 评测标注 A1-A5分类风险指数 裁判大模型 风险详情 分类模型 内容安全优化建议 人工标注 模型回复
30. 端侧丰富的应用场景,在基础的评测数据集之上,建立针对AI应用场景的评测方案 评测数据集 场景化 围绕Agent场景制定 复合风险评测体系 基础安全评测集 Prompt 对抗性 KDES 互联网黑词挖掘 高级攻击生成系统 多样性 毒性 待 测 评 终 端 大 模 型 构建仿写大模型快速扩展 毒性增强技术 高级攻击评测集 评测报告 评测标注 A1-A5分类风险指数 裁判大模型 风险详情 分类模型 内容安全优化建议 人工标注 模型回复
31. 构建仿写大模型、与毒性增强的技术,快速围绕各种主题场景构建测试题集,解决端侧评测数据集构建问题
32. 构建裁判大模型,以高度自动化、和高度准确率的要求建立评测结果标注系统,进一步降低评测成本 Q A / 1. 2. 3. “ 4. “ 1. 2. “ 3. “ 1. 2. ” “ ” ” “ ” “ ” “ ” “ ” ” “ ” “ ····· ” ” 裁 判 大 模 型 标 注 3
33. 构建裁判大模型,以高度自动化、和高度准确率的要求建立评测结果标注系统,进一步降低评测成本 Q A 1959 1965 9 9 裁 判 大 模 型 标 注
34. 支持CPU/GPU/NPU运行:内存 占用400M~1024MB多种规格可 选;可同时支持文本、图片审核
35.
36.
37.
38.
39. 大模型正在重新定义软件 Large Language Model Is Redefining The Software

首页 - Wiki
Copyright © 2011-2025 iteam. Current version is 2.147.0. UTC+08:00, 2025-10-28 05:37
浙ICP备14020137号-1 $访客地图$