单词查找树
1 基本概念
百度百科对字典树的介绍为:
是一种树形结构,是一种哈希树的变种
。
《算法4》对字典树的介绍为:
它由字符串键中的所有字符构造而成,允许使用被查找键中的字符进行查找
。
不管各种材料对它的描述如何,总之它是长成下图这样的。
从图中我们可以很清楚的看到,从字典树的根节点到每个叶子节点的路径都是一个字符串。很显然,这样存储字符串会节约很多空间(例如上图中的NEWS和NOT公共前缀N只存一次就好了),而且便于查找不同字符串的公共前缀。
另外,如果我们想要存储的字符串是已经存好的字符串的子串(前缀),例如上图中我们想要再存储一个NEW。这时候我们只需要在每个节点上额外加一个标志位用来表示
以当前字符结尾的字符串
是不是我们要存储的字符串就好了,例如上图的-1(每个节点都应该有这样的标志位)。
2 字典树的应用
根据字典树的性质,有以下几个应用场景:
-
串的快速检索
:给出N个单词组成的熟词表,以及一篇全用小写英文书写的文章,要求按最早出现的顺序写出所有不在熟词表中的生词。 -
“串”排序
:给定N个互不相同的仅由一个单词构成的英文名,将他们按字典序从小到大输出。用字典树进行排序,采用数组的方式创建字典树,这棵树的每个结点的所有儿子很显然地按照其字母大小排序。对这棵树进行先序遍历即可。 -
最长公共前缀
:对所有串建立字典树,对于两个串的最长公共前缀的长度即他们所在的结点的公共祖先个数,于是,问题就转化为当时公共祖先问题。
3 字典树基本操作的实现
字典树基本操作的简单实现可以通过这道
Leetcode 208题
来完成。
4 参考资料
-
百度百科字典树
- 《算法4》P474 单词查找树
版权声明:本文为qq_39378221原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。