双数组前缀树

摘要

前缀树,又称字典树。常见的场景为大规模词库下做词匹配、词前缀匹配、词频统计等。目前唯一碰到的业务场景只有自建 UGC 风控的违禁词检测。

经典前缀树基于多叉树结构实现,组成字符串的字符全集数量决定了多叉树的阶。如下图为字符串集合 ab, abc, bc, d, da, dda 形成的前缀树。

前缀树的核心思想是空间换时间,利用字符串的公共前缀来降低查询时间的开销,相较于哈希等能够显著降低失配字符串的匹配耗时。

欢迎在评论区写下你对这篇文章的看法。

评论

ホーム - Wiki
Copyright © 2011-2024 iteam. Current version is 2.137.1. UTC+08:00, 2024-11-13 19:47
浙ICP备14020137号-1 $お客様$