您现在的位置是：首页 > IT要闻

当前栏目

前缀树的设计与实现

2023-02-18 16:36:14 时间

前缀树的设计与实现

作者：Grey

原文地址：

博客园：前缀树的设计与实现

CSDN：前缀树的设计与实现

前缀树即字典树，可以利用字符串的公共前缀来减少查询时间，最大限度地减少无谓的字符串比较。

我们使用搜索引擎的时候，输入 test，后面会自动显示一堆前缀是 test 的东西。这就利用了前缀树结构来实现。

比如我们有一堆字符串

["Trie","apple", "insert","apple", "search", "app","search", "startsWith", "insert", "search"]

问题1.查询字符串列表里面是否有以app，apx为前缀的字符串。

问题2.查询字符串列表里面有没有insert和serac这两个字符串。

我们可以把字符串列表构造成一棵前缀树，如下图

头节点是空串，路径表示字符，节点表示一个字符串的前缀（简称 p 节点），黑色节点表示一个字符串的结尾位置（简称 e 节点）。

有了如上结构，针对问题1，判断是否存在app前缀的字符串，流程如下

头节点开始，先看有没有走向a的路径，有，则移动指针往a的路径走，
然后判断是否有走向p的路径，有，则移动指针往p的路径走，
然后判断是否有走向p的路径，有，则移动指针往p的路径走，

则存在以app为前缀的字符串。

同理，回到头节点，继续判断apx，发现到没有到x的路径，则直接返回不存在以apx为前缀的字符串。

针对问题2，判断是否有insert这个字符串，流程和判断前缀的流程一样，只不过到了末尾位置，判断是否是黑色节点，如果是黑色节点，说明存在这样的字符串，否则不存在。

更进一步，前缀树也可以支持加入元素和删除元素，此时，我们需要在 p 节点和 e 节点记录一个出现次数的信息，如上例，记录次数后，前缀树如下图

如果要删除一个apple字符串，前缀树在apple的路径上依次减一即可

如果要继续增加一个apx字符串，前缀树继续建出apx的路径即可。

依据上述流程，我们可以用 Hash 表实现前缀树，代码如下

import java.util.HashMap;

public class Code_0030_TrieTree {

    public static class Node2 {
        // 某个节点经历了几次
        public int pass;
        // 某个节点是否是结尾位置
        public int end;
        // 是否有走向某个节点的路
        public HashMap<Integer, Node2> nexts;

        public Node2() {
            pass = 0;
            end = 0;
            nexts = new HashMap<>();
        }
    }

    public static class Trie2 {
        private Node2 root;

        public Trie2() {
            root = new Node2();
        }

        public void insert(String word) {
            if (word == null || word.length() < 1) {
                return;
            }
            char[] str = word.toCharArray();
            Node2 cur = root;
            cur.pass++;
            int n = 0;
            for (char v : str) {
                n = v;
                if (!cur.nexts.containsKey(n)) {
                    cur.nexts.put(n, new Node2());
                }
                cur.nexts.get(n).pass++;
                cur = cur.nexts.get(n);
            }
            cur.end++;
        }

        public void delete(String word) {
            if (search(word) == 0) {
                return;
            }
            char[] str = word.toCharArray();
            Node2 cur = root;
            cur.pass--;
            for (char v : str) {
                int n = v;
                if (--cur.nexts.get(n).pass == 0) {
                    cur.nexts.remove(n);
                    return;
                }
                cur = cur.nexts.get(n);
            }
            cur.end--;
        }

        // word这个单词之前加入过几次
        public int search(String word) {
            if (word == null || word.length() < 1) {
                return 0;
            }
            char[] str = word.toCharArray();
            Node2 cur = root;
            for (char v : str) {
                int n = v;
                if (!cur.nexts.containsKey(n)) {
                    return 0;
                }
                cur = cur.nexts.get(n);
            }
            return cur.end;
        }

        // 所有加入的字符串中，有几个是以pre这个字符串作为前缀的
        public int prefixNumber(String pre) {
            if (pre == null || pre.length() < 1) {
                return 0;
            }
            char[] str = pre.toCharArray();
            Node2 cur = root;
            for (char v : str) {
                int n = v;
                if (!cur.nexts.containsKey(n)) {
                    return 0;
                }
                cur = cur.nexts.get(n);
            }
            return cur.pass;
        }
    }
}

如果字符串只由 26 个英文字母组成，那么前缀树的数据结构可以优化成

        class Node {
            int p;
            int e;
            Node[] nodes = new Node[26];
        }

nodes[0] != null：表示有走向a的路，否则则没有走向a的路;

nodes[1] != null：表示有走向b的路，否则则没有走向b的路;

nodes[2] != null：表示有走向c的路，否则则没有走向c的路;

...

nodes[25] != null：表示有走向z的路，否则则没有走向z的路;

LeetCode 有对应的题目链接：见：LeetCode 208. Implement Trie (Prefix Tree)

完整代码如下

class Trie {
        class Node {
            int p;
            int e;
            Node[] nodes = new Node[26];
        }

        Node root;

        public Trie() {
            root = new Node();
        }

        public void insert(String word) {
            char[] str = word.toCharArray();
            Node cur = root;
            for (char c : str) {
                cur.p++;
                if (cur.nodes[c - 'a'] == null) {
                    cur.nodes[c - 'a'] = new Node();
                }
                cur = cur.nodes[c - 'a'];
            }
            cur.e++;
        }

        public boolean search(String word) {
            char[] str = word.toCharArray();
            Node cur = root;
            for (char c : str) {
                if (cur.nodes[c - 'a'] == null) {
                    return false;
                }
                cur = cur.nodes[c - 'a'];
            }
            return cur.e != 0;
        }

        public boolean startsWith(String prefix) {
            char[] str = prefix.toCharArray();
            Node cur = root;
            for (char c : str) {
                if (cur.nodes[c - 'a'] == null) {
                    return false;
                }
                cur = cur.nodes[c - 'a'];
            }
            return true;
        }
    }

本文的所有图例见: processon:前缀树的设计和实现

算法和数据结构笔记

猜你喜欢

谈新手Java SE JDK 下载那个版本好！
Mybatis错误：columnNumber: 6; 不允许有匹配 "[xX][mM][lL]" 的处理指令目标。解决方法
SpringDataJpa 用MySQL语句怎么分页，spring全家桶SpringDataJpa 用MySQL语句怎么分页
SpringCloud是什么？SpringCloud有什么用？
Spring Security安全框架中BCrypt强哈希加密算法使用
大数据Kudu（六）：Kudu Java Api操作
什么是JWT的Token认证机制？
Docker下载\安装Elasticsearch(ES)
break 关键字、continue 关键字、return 关键字，用法和基本介绍！
Java中抽象类简单介绍
Java中接口简单说明
Java Doc简单使用（idea使用生成）
JDK中Jshell简单使用（JDK9版本以上或者JDK9版本）
Java中ArrayList集合的基本使用
Java中字符串对象的大闸蟹
Windows系统朗读一段自定义的话
SpringBoot中很好玩的一个banner启动控制台效果
线性结构和非线性结构简单介绍
Java中StringBuilder类
Java中Map集合常见使用

zl程序教程

当前栏目

前缀树的设计与实现

前缀树的设计与实现

更多

相关文章