知乎反作弊垃圾文本识别

摘要

知乎是一个拥有超过2亿注册用户的社区平台,近期他们面临着对垃圾信息的治理挑战。他们通过升级名为"悟空"的策略引擎和引入深度学习识别垃圾文本的方法取得了不错的效果。他们发现当前站内的垃圾文本主要包括导流内容、品牌内容、诈骗内容和骚扰内容。为了高效检测这些垃圾文本,他们选择了使用CNN(卷积神经网络)作为算法,因为CNN在训练和预测速度上都快于RNN(循环神经网络)。这种CNN文本分类模型能够准确识别关键词,满足快速垃圾文本检测的需求。

欢迎在评论区写下你对这篇文章的看法。

评论

Home - Wiki
Copyright © 2011-2024 iteam. Current version is 2.129.0. UTC+08:00, 2024-07-03 07:19
浙ICP备14020137号-1 $Map of visitor$