隐私不上云,模型放心用:通过结构化语义标签实现隐私防火墙

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1. 隐私不上云,模型放 :通过结构 化语义标签实现隐私防 墙 武实验室 陈昱 腾讯
2.
3. 01 背景与挑战 险 传统 案局限
4. 模型服务隐私泄漏 即清除 • 监控与排障平台常保留完整请求与返回 • 分享 链接或截图会让信息在外部扩散 上下游隐私泄漏隐患 • 在前端暴露 API 密钥会被抓包或反编译直接获取 • 认证与租户隔离粒度不 • 外部调 未设 ,容易出现横向访问与越权 名单易被被诱导执 任意请求 • 推理基础设施漏洞可能导致跨会话串线、数据错配 • 志、缓存与备份未加密, 旦泄露即为明 部署时泄漏隐患 暴露
5. 模型
6. 各场景隐私泄漏点 实 指导场景 可能泄漏点:住址、 常 机号、身份证/护照号、 触发:让模型写投诉/申请/预约、规划出 程(航班/ 次/酒店)、家庭成员信息、银 卡尾号、联系 、处理快递/物业/银 名单 事宜 写作场景 可能泄漏点:简历/邮件/合同/会议纪要 常 触发:润 的姓名、电话、邮箱、公司/部 、客户名单、薪资与绩效,邮件签名与附件名 求职材料、撰写对外邮件、整理会议记录 信息检索场景 可能泄漏点:粘贴内部 号、账号、票据号、IP、设备号、地址;PDF/Doc 元数据(作者、修订历史) 触发:让模型总结内部 wiki、PDF、群聊 常 档/聊天记录中的邮箱、
7. 各场景隐私泄漏点 机号/订单号、IP地址
8. 个 信息输出 险管理 《 成式 智能个 信息保护技术要求 第6 部分:输出阶段管理》 6.2 涉及个 信息输出场景对涉及个 信息的输出场景, 成式 智能服务 提供者在输出阶段应满 如下要求: a) 默认情况下,不应展示已识别个 信息(已公开个 信息、 户提供的个 信 息和已授权使 的个 信息除外) d) 应对展示的个 信息实施基线安全策略。 《 成式 智能个 信息保护技术要求 第 8 部分:供应链管理》 在对第三 提供 户输 数据前,宜先对个 或匿名化处理等安全保护措施 信息进 识别,并采取去标识化 其他要求 训练阶段对其中涉及个 信息部分内容进 剔除,保障训练阶段本身不会引 隐私数据合规 险。对话运 阶段,增加对于涉及隐私问题的检测,对于相关 问题拒绝回答
9. ChatBot 典型场景案例 户:查找腾讯投递简历的官 bot:腾讯社会招聘投递简历的官 址 :https://careers.tencent.com/jobopportunity.html
10. 脱敏需求挖掘 当模型需要披露脱敏实体才能应答时,如“查找腾讯投 递简历的官 址”,若腾讯被脱敏,则需询问 户是 否可提供真实实体
11. 现有隐私保护 案能
12. 02 HaS 的解法
13. HaS: 不只是 next level 脱敏技术,也是 种安全交互 S Hide Annotate Seek 隐私信息识别与隐藏 结构化语义标签标注 隐私信息还原 A H 式
14. Key Insight: 寻找 模型友好的实体表达 层级命名空间
15. Show Case: 脱敏前原
16. Show Case: 标签编译后的 本 <组织[001].企业.英 名>的联系 是谁? **合同编号:** <编号[001].合同编号.代码> **甲 (服务提供 ):** <组织[001].企业.完整名称>(以下简称<组织[001].企业.简称>或<组织[001].企业.英 名>) 注册地址: <地点[001].办公地址.完整地址> 联系 : < 物[001].个 .姓名>(< 物[001].个 .拼 名>) 电话: <电话[001].固定电话.号码> ** (客户):** <组织[002].企业.完整名称>(<组织[002].企业.英 名>,以下简称<组织[002].企业.简称>或<组织[002].企业.英 缩写>) 注册地址: <地点[002].办公地址.完整地址> 联系 : < 物[002].个 .姓名>(< 物[002].个 .拼 名>) 邮箱: <邮箱[001].个 邮箱.地址> **1. 服务内容** <组织[001].企业.简称>向<组织[002].企业.英 缩写>提供名为<产品/服务[001].软件.中 名>(<产品/服务[001].软件.英 名>)的<产品/服务[002].软件服务.完整描述>。<产品/服务[003]. 协议.中 名>(<产品/服务[003].协议.英 名>, <产品/服务[003].协议.英 缩写>)保证<百分 [001].服务指标.数值>的在线时间。<组织[001].企业.简称>将确保该<产品/服务[002].软件服务. 简称>的稳定运 。 **2. 协议期限** 本协议 < 期/时间[001].具体 期.年 >起 效, < 期/时间[002].具体 期.年 >终 ,为期两年。任何 如需提前终 ,需提前< 期/时间[003].时间段.天数>书 通知对 。 <组织[001].企业.英 名>和繁星贸易均应遵守此条款。 **3. 费 与 付** <组织[002].企业.英 缩写>同意 付订阅费 ,总计 币< 额[001].合同 额.中 写> (< 额[001].合同 额.数字符号>/< 额[001].合同 额.英 表述>)。费 需分两次 付:协议 效后< 期/时间[004].时间段. 作 数>内 付<百分 [002]. 付 例.数值>,即< 额[002]. 付 额.中 数字>;第 年服务开始前 付剩余<百分 [002]. 付 例.数值>。 付账户为< 组织[001].企业.简称>在<组织[003]. 融机构.完整名称>(<组织[003]. 融机构.英 缩写>)开设的账户,账号为<编号[002].银 账号.号码>。 **4. 保密条款** <组织[001].企业.英 名>和<组织[002].企业.英 缩写>同意,对在履 本协议过程中获悉的对 商业秘密和技术信息予以保密。此保密义务在本协议终 后持续有效,直 该信息进 公共 领域。
17. <ORGANIZATION> 的联系 是谁? 不同解法对 实体类型标签 合同编号: <CONTRACT_ID> 甲 (服务提供 ): <ORGANIZATION>(以下简称 <ORGANIZATION> 或 <ORGANIZATION>) 联系 : <PERSON>(<PERSON>) ** (客户):** <ORGANIZATION>(<ORGANIZATION>,以下简称 <ORGANIZATION> 或 <ORGANIZATION>) 联系 : <PERSON>(<PERSON>) 指代关系丢失模型 CloudGenius的联系 是谁? SkyGenius 的联系 **合同编号:** SAAS-2024-Q3-8801 **甲 (服务提供 ):** 云创智能有限公司(以下简称 云创智能或CloudGenius) 联系 : 李红(Li Hong) ** (客户):** 繁星贸易集团(Star Trading Group, 以下简称繁星或STG) 联系 : 张英建(Zhang Yingjian) 假名替换 法回答 ❌ 是谁? 合同编号: SAAS-2023-Q2-9732 甲 (服务提供 ): 华新智联科技有限公司(以下简称 华新智联 或 SkyGenius) 联系 : 王敏(Wang Min) ** (客户):** 晨耀贸易集团(Stellar Trading Group,以下简称 晨耀 或 STG) 联系 : 周建业(Zhou Jianye) 违反《个保法》第8条对数据质量的要求,不 <组织[001].企业.英 结构化语义标签 DeepSeek正确作答 名>的联系 是谁? **合同编号:** <编号[001].合同编号.代码> **甲 (服务提供 ):** <组织[001].企业.完整名称>(以下简称<组织[001].企业.简称>或<组织[001].企业.英 名>) 联系 : < 物[001].个 .姓名>(< 物[001].个 .拼 名>) ** (客户):** <组织[002].企业.完整名称>(<组织[002].企业.英 名>,以下简称<组织[002].企业.简称>或<组织[002]. 企业.英 缩写>) 联系 : < 物[002].个 .姓名>(< 物[002].个 .拼 名>) 模型可正确回答,合规, 便解析与校验 ❌ 便解析与校验 ✅
18. HaS Agentic 框架 云 侧 与语义 约束 算 法 端 侧 标签推理 规则 最 信息 披露 任务策略 模板 协 同 编 排 系统提示词 注 程记忆 GestaltTag Align 标签感知分词 隐私实体识别 实体标签编译 多策略映射 搜索 复合标签段 实体裁剪 检召回 兜底链 标签映射拆分 隐私实体还原 具 模 型 能 上下 中间 标签映射 成 多轮映射 累积流 序贯还原 滚动流
19. HaS Workflow 用户输入 模型-Hide_with 模型-NER 识别到 是 否 非首轮对话激活 工具-Pair 包含复合标签 首轮对话激活 是 工具-标签提取 模型-Split 工具-映射合并 否 模型-Hide 指定脱敏类型 映射自检 通过 不通过 需用户补充信息时激活 首轮对话激活 用户补充标签 真实值 模型-Pair 标签推理 系统提示词 云端大模型 呈现当轮结果 标签映射集合 补充标签 真实值提示 包含标签 激活 否 模型-Seek 是 否 是 需要标签 具体值 否 工具-语种检测 同语种 不通过 是 工具-Seek Seek自检 通过
20. Take Away 模型能 模型能 兜底
21. 03 现场演示
22.
23. 欢迎体验 模型开源:https://huggingface.co/xuanwulab/HaS_4.0_0.6B Chrome/Edge应 商店:HaS脱敏 维码 HaS开发者交流群 维码 HaS 户意 反馈群
24. 04 未来展望
25. 图像、 多 持 频、视频、多媒体 档 标 更标准化的接 MCP、A2A、ANP、ACP、NLWeb 成为下 代 Agent OS 的基础组件 快 更 更快的模型推理速度 泛的场景 AI编程、智能体应 定义标签token、扩散模型 交互者由“ HaS 未来展望 更多模态 持 、Agentic 作流 ”扩展到 Agent
26. HaS多模态脱敏探索 脱敏前 脱敏后
27.
28. THANKS 模型正在重新定义软件 Large Language Model Is Redefining The Software

首页 - Wiki
Copyright © 2011-2025 iteam. Current version is 2.147.1. UTC+08:00, 2025-11-04 12:45
浙ICP备14020137号-1 $访客地图$