全民k歌黑产对抗之路

1. 全民k歌黑产对抗之路 17 0 2 C C A --安全体系架构与技术 S 腾讯音乐 chrisluo(罗静)

2. 基础安全-业务安全 17 0 2 C S C A

3. 全民k歌-唱 17 0 2 C S C A

4. 全民k歌-听 17 0 2 C S C A

5. 全民k歌-看 17 0 2 C S C A

6. 安全形势接入账号 DDoS攻击 Xss注入 Sql注入 Csrf攻击 DNS篡改音频恶意注册恶意刷粉私信骚扰刷等级盗取账号视频涉政涉恐传销涉黄诈骗文字 S 涉政涉恐传销涉黄诈骗色情广告招嫖涉政涉恐灌水人身攻击广告谩骂 17 0 2 C C A 图片直播涉政涉恐传销涉黄人身攻击活动恶意刷榜薅羊毛盗取作品盗取资料

7. 安全架构业务层打击效果评估准确率接入层逻辑层举报管理串联频控评论私信直播相册 app接入核心词库防刷机制上传 web接入行为打击图片分析关注贝叶斯过滤音频分析离线分析视频分析运营审核相似度计算直播监控用户画像打击效果评估健康度

8. 接入安全-DDoS保护应用策略： internet Ø DPI检测技术，快速准确地发现针对业务的各种DDoS攻击 Ø 采用运营商黑洞路由、被攻击流量转移到防护中心检测攻击流量检测中心防护中心外网核心ACL、专业清启动保护洗设备等多种手段，形成多层级的防护架构 Ø 防护带宽2T，部署其他地区不受影响正常流量注入 CDN100+，全网调度对抗攻击流量 web dns app 流量清洗

9. 接入安全-web防护 Cgi安全问题扫描： Ø 1、开发提交安全扫描 Ø 2、测试环境自动扫描 Ø 3、线上服务安全防护 Ø 4、发现漏洞提交安全工单 Cgi服务 webserver sql注入、xss、csrf检测： Ø 接受请求，转发到检测服务，阻塞当前请求 Ø 检测服务分析恶意程度，如果非法，拒绝当前请求，合法则返回后端cgi机器IP和端口 Ø Cgi处理后返回正常数据 agent 识别引擎

10. 文字策略-关键词应用策略： Ø 组合关键词 Ø 关键词划分等级 Ø 过滤转义，把全角、异体转为标准内容再进行匹配 Ø 小语种识别，对含有高危小语种的内容单独处置 Ø 中文转拼音，对高危内容进行同音识别

11. 文字策略-相似度文本的基本元素是词汇比较算法： p Jaccard相似度 p Simhash-汉明距离 p 余弦相似度策略： p 单个作品下的评论内容分析 p 同一个用户发出的评论分析

12. 文字策略-贝叶斯文本分类喜欢唱歌私信正常聊天找我私信正常元萬加私信 1.发送评论 10园20萬私信我？应用场景： Ø 支持针对具体业务的训练库算法不仅支持文本文类，还可以用于其他分类场景可以结合业务加入其他纬度数据萬私信恶意概率正常概率拼音分词拼音分词 xi|da|da 0.00102 Ø 园恶意 10园20萬私信 Ø 2.分词 xi|da|da 0.00076 3.计算分析规则计算贝叶斯数据

13. 文字策略-贝叶斯数据层大v评论热门作品采集层存储层签约主播采集数据，补充到训练数据原则：打击数据 p p 数据采集 DB 运营审核正常内用和恶意内容及时补充新样本内容 KV 贝叶斯训练实时打击系统

14. 图片策略行为策略：账号体系、行为分析图像识别：图像DNA、OCR、色情识别人工审核：图片审核、种子库运营恶意图片比例 41% 55% 4% 低俗色情政治敏感恶意广告

15. 图片策略热门黄图特点： p 有组织的人肉作案，量相对小 p 容易对抗和绕过，不汇聚 p 图片自动检测容易误打击打击方案： p 人工确认加历史数据用作决策树训练 p 行为特征分析加上帐号特征 p 图片出现频率和相似度计算 p 图片文字率以及图片ocr识别 p 昵称贝叶斯聚类分析 p 曝光率异常分析 p 自动打击加人工审核

16. 音频策略恶意检测算法： • 重点监控人物提取音频指纹，进行指纹比对分析 • 声音场景识别，分析在唱歌或说话 • 声音内容识别，是否小语种，特征片段匹配等

17. 视频直播

18. 直播监控 1. 直播流旁路推流，可以实时查看直播情况 2. 对直播流进行截图，按图片的敏感度打分提交人工审核 3. 对主播进行实名认证 4. 对问题主播进行警告，随时切断直播信号，严重者进行封号

19. 防刷-频控策略实现方案： Ø 1、结合账号特征和用户画像，精细化管理 Ø 2、实时监控，报表输出，动态调整 Ø 3、命中频控用户需要进行短信或图片码验证 Ø 4、流水查询，可回溯分析

20. 防刷-设备IP分析 IP画像： Ø 基于海量用户分析用户行为，提供ip信用评级 Ø Ip信息分类：代理/vpn，idc服务器、网关、腾讯用户IP、运营商、局域网 Ø 应用场景：恶意爬虫、恶意注册/登录、机器人识别、恶意刷单、刷量设备画像： Ø 后台计算确认移动终端唯一身份 Ø 基于海量用户从设备活跃度、模拟设备、新增设备、常用设备、黑产设备对移动设备进行安全画像 Ø 基于画像实时判断移动设备风险等级

21. 举报管理管理员开发运营外团 Ø 分等级授权、不同等级对应不同操作权限 Ø 综合用户等级、画像、举报次数等排序后审核

22. 离线分析异常检测算法： • 基于已经标记的大数据特征样本 • 适合大数据，并行处理方便 • 可解释，方便问题回溯实现方案： l 标记设备、用户画像等数据 l 行为数据上报到HDFS，通过 Hive/Sparksql跑出可疑用户 l 分析数据的聚集度，排序后抽样确认

23. 审核平台直播监控平台举报审核平台黄图审核运营审核： Ø 可疑数据top Mv审核平台 Top行为审核小语种内容审核排序，人工审核确认清唱作品审核直播监控黑名单实名审核 Ø 只要投入少数人力，审核数据进入恶意样安全健康度审核打击准确率审核封号复核本进行训练

24. 用户行为画像登录点唱信用度评估：听歌 Ø 用户画像关注访客 Ø 历史行为累积 Ø 用户分类预测评论上传实现方案：转发私信直播分享消费 Ø 分维度计算，综合考量 Ø 实时累积、离线计算、分析预测

25. 用户行为分析 logic_svr 行为数据上报 HDFS 批量读取实时计算实时排行规则引擎分析打击运营审核行为计数处罚系统数据训练 MR spark cluster Hive/Sparksql 存储层用户行为数据用户标签数据离线分析

26. 安全策略和效果评估 Ø 效果评估： 1. 平台内容健康度 2. 打击内容准确率 Ø 安全策略评估： 1. 用户数据和打击效果的平衡 2. 打击效果和投入成本的平衡 3. 内容分析结合场景和账号行为 4. 新技术的引入-人工智能 5. 安全对抗长期存在，需review改进

27.