字典树

现在的位置: 首页 > 综合 > 正文

2014年10月28日 ⁄ 综合 ⁄ 共 2313字 ⁄ 字号小中大 ⁄ 评论关闭

Trie树就是字典树，其核心思想就是空间换时间。

举个简单的例子。

给你100000个长度不超过10的单词。对于每一个单词，我们要判断他出没出现过，如果出现了，第一次出现第几个位置。
这题当然可以用hash来，但是我要介绍的是trie树。在某些方面它的用途更大。比如说对于某一个单词，我要询问它的前缀是否出现过。这样hash就不好搞了，而用trie还是很简单。
现在回到例子中，如果我们用最傻的方法，对于每一个单词，我们都要去查找它前面的单词中是否有它。那么这个算法的复杂度就是O(n^2)。显然对于100000的范围难以接受。现在我们换个思路想。假设我要查询的单词是abcd，那么在他前面的单词中，以b，c，d，f之类开头的我显然不必考虑。而只要找以a开头的中是否存在abcd就可以了。同样的，在以a开头中的单词中，我们只要考虑以b作为第二个字母的……这样一个树的模型就渐渐清晰了……
假设有b，abc，abd，bcd，abcd，efg，hii这6个单词，我们构建的树就是这样的。

对于每一个节点，从根遍历到他的过程就是一个单词，如果这个节点被标记为红色，就表示这个单词存在，否则不存在。
那么，对于一个单词，我只要顺着他从跟走到对应的节点，再看这个节点是否被标记为红色就可以知道它是否出现过了。把这个节点标记为红色，就相当于插入了这个单词。
这样一来我们询问和插入可以一起完成，所用时间仅仅为单词长度，在这一个样例，便是10。
我们可以看到，trie树每一层的节点数是26^i级别的。所以为了节省空间。我们用动态链表，或者用数组来模拟动态。空间的花费，不会超过单词数×单词长度。

模版一：

/*******************************************************************************

【字典树】

此模板主要是针对都是小写字母的。其他情况在此基础上改一改就可以了，要懂得灵活运用。 

********************************************************************************/

struct trie /*字典树的节点内容*/
{
    int count;/*计算该节点出现的次数*/
    trie *next[26];/*一个节点有26个指针（孩子），即'a'-'z'*/
};

trie *root;

trie* newtrie()/*建立一个节点。（也可以用建立个大的数组，指针指向数组不同位置）*/
{   
    trie *t;   
    t=(trie*)malloc(sizeof(struct trie));   
    memset(t,0,sizeof(struct trie));   
    return t;   
}

void Insert(char *ch) /*插入函数，将该字符串插入到字典树中  */
{   
    int i;   
    trie *t,*s;   
    s=root;   
    for(i=0;ch[i];i++)   
    {   
        if(s->next[ch[i]-'a'])   
        {   
            s=s->next[ch[i]-'a'];   
            s->count=s->count+1;   
        }   
        else  
        {   
            t=newtrie();   
            s->next[ch[i]-'a']=t;   
            s=t;   
            s->count=1;   
        }   
    }   
} 

int Search(char *ch)/*搜索函数，返回0则代表字典树不存在该字符串，反之亦然 */    
{   
    int i;   
    trie *s=root;   
    if(ch[0]==0) return 0;   
    for(i=0;ch[i];i++)   
    {   
        if(s->next[ch[i]-'a'])      
            s=s->next[ch[i]-'a'];      
        else  
            break;   
    }  
    if(ch[i]==0) return s->count;   
    else return 0;   
} 

void Delete(char *ch)/*删除函数，将该字符串从字典树中删除（删除之前记得事先判断存不存在该字符串）*/
{   
    int i;   
    trie *s;   
    s=root;   
    for(i=0;ch[i];i++)   
    {   
        s=s->next[ch[i]-'a'];
        s->count=s->count-1;
    }   
}

模板二：

#include <iostream>
#include <cstdio>
#include <cstring>
using namespace std;
//字典树的数据结构
struct Trie{
    Trie *child[26];//这里数组的大小看是小写字母还是数字还是都有
    int num;
    Trie(){//初始化
        num = 0;
        memset(child , 0 , sizeof(child));
    }
};
Trie *root;
//字典树的构建
void Tree_Insert(char *str){
    Trie *s = root;
    int i = 0;
    while(str[i]){
        int id = str[i] -'a' ;
        if(s -> child[id] == 0)//如果该字节点的字节点为空则要创建中间节点
            s -> child[id] = new Trie();
        s = s -> child[id];

        s -> num++;

        i++；
    }  
}
//字典树的查找
int Tree_Find(char *str){
    Trie *s = root;
    int count ;
    while(str[i]){
        int id = str[i] - 'a';
        if(s -> child[id] == 0){//如果当前指针s的对应于当前字符str[i]在字母表的位置的子节点为空
            return count;//直接返回0
        }
        else{
            s = s -> child[id];
            count = s -> num ;

        }

        i++;
    }
    return count;
}
int main(){
   int i , j;
   //建立一个root分配空间

   root = new Trie();

  
   return 0;
}

【上篇】HDU 3415 Max Sum of Max-K-sub-sequence（单调队列）
【下篇】贾平凹关于女人经典语句

作者: hillinicaible

该日志由 hillinicaible 于10年前发表在综合分类下，最后更新于 2014年10月28日.
转载请注明: 字典树 | 学步园 +复制链接

抱歉!评论已关闭.

学步园

字典树

作者: hillinicaible

书签

最新文章New

本站推荐

返回首页