端侧大模型的安全建设:如何在算力与保障之间找到平衡
如果无法正常显示,请先停止浏览器的去广告插件。
1. 李志伟
2. 目录
3.
4.
5.
6. AI大模型
端侧大模型
模型训练方式:云端
模型训练方式:数据中心或云端
VS
模型推理方式:服务器或云端
参数量:多为百亿/千级别
模型推理方式:端侧
参数量:多为十亿级别
7.
8. 预估未来4年,端侧大模型市场每年会以40~50%的增长率保持快速增长
90
79
单位:亿
61
60
47
31
30
21
8
0
2023
2024E
2025E
2026E
市场规模
2027E
2028E
数据来源:【头豹研究院】2024年中国端侧大模型行业研究
9.
10.
11.
12.
13. 。
14.
15. 代码攻击 (Code Attack)
输入中嵌入恶意代码片段,执行危险指令
拒绝遏制 (Refusal Suppression)
不断提出请求,直到模型执行危险的命令
正负对比 (Pos-Neg Contrast)
提供正反两面输入,使模型产生混淆/偏误
OWASP首次发布大模型的TOP10脆弱性
风险
前缀注入 (Prefix Injection)
输入之前添加特定指令/文本改变模型行为
指令注入 (Instruction Injection)
输入中插入特殊指令,改变模型行为
多轮越狱 (Many-shot Jailbreak)
基于多轮对话的机制诱导模型风险输出
邪恶密友 (Evil Confidant)
通过建立信任关系,让模型泄漏敏感信息
生成式反事实引导 (GCG)
向模型提供提供误导性输入,改变模型行为
组合攻击 (combo attacks )
多种攻击手段结合使用,以绕过安全策略
·
·
·
16. -参数/结构可被逆向工程 - 无云端级防火墙/入侵 -模型压缩(量化/剪 - 运行时内存/缓存中遗
提取;攻击者获得完整 检测等防护能力 枝)导致决策边界扭曲 留敏感信息,容易泄漏
模型后,可分析训练数 -只能依赖终端操作系统 -压缩模型对输入扰动敏 - 多应用间数据交叉污
据特征、复制模型架构 的基础防护 感 染
17.
18.
19. 企
业
用
户
平
台
20.
21.
22. •
•
•
•
难
• •
• •
23. 企
业
用
户
平
台
24. 稳定性 准召率 软硬件适配
重复
持续运算
72小时
load/unload
(每万次输入) 运行
(每千次) 识别准确性 X86
ARM
>95% 支持
性能
模型加载
目标 按需加载/
释放
内存 支持
模型加载并
推理时间 CPU/NPU占 物理存储
完成初始化
(平均值) 用率(IDEL)
占用
(平均值)
<=800ms
<200ms
3%
< 500M
内存
占用 功耗
运行电流
< 400M < 600mA
0次崩溃
0次崩溃
0次崩溃
25.
26. 监管部门针对端侧大模型的备案审查、与常态化管理过程中,核心关注如下问题:
离线用户
能否封禁
违规日志
能否上报
突发事件
能否处置
备案测试
场景化+离
线沙盒
27.
28. 端侧离线模型的应急处置方案
云端控制台
终端设备
词库管理 知识库管理 拦截策略管理
封禁阈值 模型阈值 违规日志解析
干预文件
基础配置
主动推送
定期同步
干预策略
离线x天
禁用AI功能
支持紧急情况
一键禁用
智能回复|辅助撰写|图片处理|个人助理
安全SDK加载更新文件并执行
定期拉取
本地基座大模型
29. 端侧场景在日常运营时,因无法像云端方案用户完整的用户日志做例行巡检,因此建立常态化/自动化的评测
评测数据集
场景化
对抗性
围绕Agent场景制定
复合风险评测体系
基础安全评测集
Promp
t
KDES 互联网黑词挖掘
高级攻击生成系统
多样性
毒性
构建仿写大模型快速扩
展
毒性增强技术
待
测
评
终
端
大
模
型
高级攻击评测集
评测报告 评测标注
A1-A5分类风险指数 裁判大模型
风险详情 分类模型
内容安全优化建议 人工标注
模型回复
30. 端侧丰富的应用场景,在基础的评测数据集之上,建立针对AI应用场景的评测方案
评测数据集
场景化
围绕Agent场景制定
复合风险评测体系
基础安全评测集
Prompt
对抗性
KDES 互联网黑词挖掘
高级攻击生成系统
多样性
毒性
待
测
评
终
端
大
模
型
构建仿写大模型快速扩展
毒性增强技术
高级攻击评测集
评测报告 评测标注
A1-A5分类风险指数 裁判大模型
风险详情 分类模型
内容安全优化建议 人工标注
模型回复
31. 构建仿写大模型、与毒性增强的技术,快速围绕各种主题场景构建测试题集,解决端侧评测数据集构建问题
32. 构建裁判大模型,以高度自动化、和高度准确率的要求建立评测结果标注系统,进一步降低评测成本
Q
A
/
1.
2.
3. “
4. “
1.
2. “
3. “
1.
2.
”
“
”
”
“
”
“
”
“
”
“
”
”
“
”
“
·····
”
”
裁
判
大
模
型
标
注
3
33. 构建裁判大模型,以高度自动化、和高度准确率的要求建立评测结果标注系统,进一步降低评测成本
Q
A
1959
1965
9 9
裁
判
大
模
型
标
注
34. 支持CPU/GPU/NPU运行:内存
占用400M~1024MB多种规格可
选;可同时支持文本、图片审核
35.
36.
37.
38.
39. 大模型正在重新定义软件
Large Language Model Is Redefining The Software