隐私不上云,模型放心用:通过结构化语义标签实现隐私防火墙
如果无法正常显示,请先停止浏览器的去广告插件。
        
                1. 隐私不上云,模型放 :通过结构
化语义标签实现隐私防 墙
武实验室
陈昱
腾讯            
                        
                2.             
                        
                3. 01
背景与挑战
险
传统
案局限            
                        
                4. 模型服务隐私泄漏
即清除
• 监控与排障平台常保留完整请求与返回
• 分享
链接或截图会让信息在外部扩散
上下游隐私泄漏隐患
• 在前端暴露 API 密钥会被抓包或反编译直接获取
• 认证与租户隔离粒度不
• 外部调
未设
,容易出现横向访问与越权
名单易被被诱导执
任意请求
• 推理基础设施漏洞可能导致跨会话串线、数据错配
•
志、缓存与备份未加密,
旦泄露即为明
部署时泄漏隐患
暴露            
                        
                5. 模型            
                        
                6. 各场景隐私泄漏点
实
指导场景
可能泄漏点:住址、
常
机号、身份证/护照号、
触发:让模型写投诉/申请/预约、规划出
程(航班/
次/酒店)、家庭成员信息、银 卡尾号、联系
、处理快递/物业/银
名单
事宜
写作场景
可能泄漏点:简历/邮件/合同/会议纪要
常
触发:润
的姓名、电话、邮箱、公司/部
、客户名单、薪资与绩效,邮件签名与附件名
求职材料、撰写对外邮件、整理会议记录
信息检索场景
可能泄漏点:粘贴内部
号、账号、票据号、IP、设备号、地址;PDF/Doc 元数据(作者、修订历史)
触发:让模型总结内部 wiki、PDF、群聊
常
档/聊天记录中的邮箱、            
                        
                7. 各场景隐私泄漏点
机号/订单号、IP地址            
                        
                8. 个
信息输出
险管理
《
成式
智能个
信息保护技术要求 第6 部分:输出阶段管理》
6.2 涉及个 信息输出场景对涉及个 信息的输出场景, 成式
智能服务
提供者在输出阶段应满 如下要求:
a) 默认情况下,不应展示已识别个 信息(已公开个 信息、 户提供的个 信
息和已授权使 的个 信息除外)
d) 应对展示的个 信息实施基线安全策略。
《
成式
智能个
信息保护技术要求 第 8 部分:供应链管理》
在对第三 提供 户输 数据前,宜先对个
或匿名化处理等安全保护措施
信息进
识别,并采取去标识化
其他要求
训练阶段对其中涉及个 信息部分内容进 剔除,保障训练阶段本身不会引
隐私数据合规 险。对话运 阶段,增加对于涉及隐私问题的检测,对于相关
问题拒绝回答            
                        
                9. ChatBot 典型场景案例
户:查找腾讯投递简历的官
bot:腾讯社会招聘投递简历的官
址
:https://careers.tencent.com/jobopportunity.html            
                        
                10. 脱敏需求挖掘
当模型需要披露脱敏实体才能应答时,如“查找腾讯投
递简历的官
址”,若腾讯被脱敏,则需询问 户是
否可提供真实实体            
                        
                11. 现有隐私保护 案能            
                        
                12. 02
HaS 的解法            
                        
                13. HaS: 不只是 next level 脱敏技术,也是 种安全交互
S
Hide Annotate Seek
隐私信息识别与隐藏 结构化语义标签标注 隐私信息还原
A H
式            
                        
                14. Key Insight: 寻找 模型友好的实体表达
层级命名空间            
                        
                15. Show Case: 脱敏前原            
                        
                16. Show Case: 标签编译后的 本
<组织[001].企业.英
名>的联系
是谁?
**合同编号:** <编号[001].合同编号.代码>
**甲 (服务提供 ):** <组织[001].企业.完整名称>(以下简称<组织[001].企业.简称>或<组织[001].企业.英 名>)
注册地址: <地点[001].办公地址.完整地址>
联系 : < 物[001].个 .姓名>(< 物[001].个 .拼 名>)
电话: <电话[001].固定电话.号码>
**
(客户):** <组织[002].企业.完整名称>(<组织[002].企业.英 名>,以下简称<组织[002].企业.简称>或<组织[002].企业.英 缩写>)
注册地址: <地点[002].办公地址.完整地址>
联系 : < 物[002].个 .姓名>(< 物[002].个 .拼 名>)
邮箱: <邮箱[001].个 邮箱.地址>
**1. 服务内容**
<组织[001].企业.简称>向<组织[002].企业.英 缩写>提供名为<产品/服务[001].软件.中 名>(<产品/服务[001].软件.英 名>)的<产品/服务[002].软件服务.完整描述>。<产品/服务[003].
协议.中 名>(<产品/服务[003].协议.英 名>, <产品/服务[003].协议.英 缩写>)保证<百分 [001].服务指标.数值>的在线时间。<组织[001].企业.简称>将确保该<产品/服务[002].软件服务.
简称>的稳定运 。
**2. 协议期限**
本协议 < 期/时间[001].具体 期.年
>起 效, < 期/时间[002].具体 期.年
>终 ,为期两年。任何
如需提前终 ,需提前< 期/时间[003].时间段.天数>书 通知对 。
<组织[001].企业.英 名>和繁星贸易均应遵守此条款。
**3. 费 与 付**
<组织[002].企业.英 缩写>同意 付订阅费 ,总计
币< 额[001].合同 额.中
写> (< 额[001].合同 额.数字符号>/< 额[001].合同 额.英 表述>)。费 需分两次 付:协议
效后< 期/时间[004].时间段. 作 数>内 付<百分 [002]. 付 例.数值>,即< 额[002]. 付 额.中 数字>;第 年服务开始前 付剩余<百分 [002]. 付 例.数值>。 付账户为<
组织[001].企业.简称>在<组织[003]. 融机构.完整名称>(<组织[003]. 融机构.英 缩写>)开设的账户,账号为<编号[002].银 账号.号码>。
**4. 保密条款**
<组织[001].企业.英 名>和<组织[002].企业.英 缩写>同意,对在履 本协议过程中获悉的对 商业秘密和技术信息予以保密。此保密义务在本协议终 后持续有效,直 该信息进 公共
领域。            
                        
                17. <ORGANIZATION> 的联系 是谁?
不同解法对
实体类型标签
合同编号: <CONTRACT_ID>
甲 (服务提供 ): <ORGANIZATION>(以下简称 <ORGANIZATION> 或 <ORGANIZATION>)
联系 : <PERSON>(<PERSON>)
**
(客户):** <ORGANIZATION>(<ORGANIZATION>,以下简称 <ORGANIZATION> 或 <ORGANIZATION>)
联系 : <PERSON>(<PERSON>)
指代关系丢失模型
CloudGenius的联系
是谁?
SkyGenius 的联系
**合同编号:** SAAS-2024-Q3-8801
**甲 (服务提供 ):** 云创智能有限公司(以下简称
云创智能或CloudGenius)
联系 : 李红(Li Hong)
**
(客户):** 繁星贸易集团(Star Trading Group,
以下简称繁星或STG)
联系 : 张英建(Zhang Yingjian)
假名替换
法回答 ❌
是谁?
合同编号: SAAS-2023-Q2-9732
甲 (服务提供 ): 华新智联科技有限公司(以下简称 华新智联 或 SkyGenius)
联系 : 王敏(Wang Min)
**
(客户):** 晨耀贸易集团(Stellar Trading Group,以下简称 晨耀 或 STG)
联系 : 周建业(Zhou Jianye)
违反《个保法》第8条对数据质量的要求,不
<组织[001].企业.英
结构化语义标签
DeepSeek正确作答
名>的联系
是谁?
**合同编号:** <编号[001].合同编号.代码>
**甲 (服务提供 ):** <组织[001].企业.完整名称>(以下简称<组织[001].企业.简称>或<组织[001].企业.英 名>)
联系 : < 物[001].个 .姓名>(< 物[001].个 .拼 名>)
**
(客户):** <组织[002].企业.完整名称>(<组织[002].企业.英 名>,以下简称<组织[002].企业.简称>或<组织[002].
企业.英 缩写>)
联系 : < 物[002].个 .姓名>(< 物[002].个 .拼 名>)
模型可正确回答,合规,
便解析与校验 ❌
便解析与校验 ✅            
                        
                18. HaS Agentic 框架
云
侧
与语义
约束
算
法
端
侧
标签推理
规则
最
信息
披露
任务策略
模板
协
同
编
排
系统提示词
注
程记忆
GestaltTag
Align 标签感知分词
隐私实体识别 实体标签编译
多策略映射
搜索
复合标签段
实体裁剪 检召回
兜底链
标签映射拆分 隐私实体还原
具
模
型
能
上下
中间
标签映射
成
多轮映射
累积流
序贯还原
滚动流            
                        
                19. HaS Workflow
用户输入
模型-Hide_with
模型-NER
识别到
是
否
非首轮对话激活
工具-Pair
包含复合标签
首轮对话激活
是
工具-标签提取
模型-Split
工具-映射合并
否
模型-Hide
指定脱敏类型
映射自检
通过
不通过
需用户补充信息时激活
首轮对话激活
用户补充标签
真实值
模型-Pair
标签推理
系统提示词
云端大模型
呈现当轮结果
标签映射集合
补充标签
真实值提示
包含标签
激活
否
模型-Seek
是
否
是
需要标签
具体值
否
工具-语种检测
同语种
不通过
是
工具-Seek
Seek自检
通过            
                        
                20. Take Away
模型能
模型能
兜底            
                        
                21. 03
现场演示            
                        
                22.             
                        
                23. 欢迎体验
模型开源:https://huggingface.co/xuanwulab/HaS_4.0_0.6B
Chrome/Edge应 商店:HaS脱敏
维码
HaS开发者交流群
维码
HaS 户意 反馈群            
                        
                24. 04
未来展望            
                        
                25. 图像、
多
持
频、视频、多媒体
档
标
更标准化的接
MCP、A2A、ANP、ACP、NLWeb
成为下
代 Agent OS 的基础组件
快
更
更快的模型推理速度
泛的场景
AI编程、智能体应
定义标签token、扩散模型
交互者由“
HaS 未来展望
更多模态
持
、Agentic 作流
”扩展到 Agent            
                        
                26. HaS多模态脱敏探索
脱敏前
脱敏后            
                        
                27.             
                        
                28. THANKS
模型正在重新定义软件
Large Language Model Is Redefining The Software