hihoCoder 1014-Trie树

hihoCoder 1014-Trie树

#1014 : Trie树
时间限制:10000ms
单点时限:1000ms
内存限制:256MB

描述
小Hi和小Ho是一对好朋友,出生在信息化社会的他们对编程产生了莫大的兴趣,他们约定好互相帮助,在编程的学习道路上一同前进。

这一天,他们遇到了一本词典,于是小Hi就向小Ho提出了那个经典的问题:“小Ho,你能不能对于每一个我给出的字符串,都在这个词典里面找到以这个字符串开头的所有单词呢?”

身经百战的小Ho答道:“怎么会不能呢!你每给我一个字符串,我就依次遍历词典里的所有单词,检查你给我的字符串是不是这个单词的前缀不就是了?”

小Hi笑道:“你啊,还是太年轻了!~假设这本词典里有10万个单词,我询问你一万次,你得要算到哪年哪月去?”

小Ho低头算了一算,看着那一堆堆的0,顿时感觉自己这辈子都要花在上面了...

小Hi看着小Ho的囧样,也是继续笑道:“让我来提高一下你的知识水平吧~你知道树这样一种数据结构么?”

小Ho想了想,说道:“知道~它是一种基础的数据结构,就像这里说的一样!”

小Hi满意的点了点头,说道:“那你知道我怎么样用一棵树来表示整个词典么?”

小Ho摇摇头表示自己不清楚。

提示一:Trie树的建立

“你看,我们现在得到了这样一棵树,那么你看,如果我给你一个字符串ap,你要怎么找到所有以ap开头的单词呢?”小Hi又开始考校小Ho。

“唔...一个个遍历所有的单词?”小Ho还是不忘自己最开始提出来的算法。

“笨!这棵树难道就白构建了!”小Hi教训完小Ho,继续道:“看好了!”

提示二:如何使用Trie树

提示三:在建立Trie树时同时进行统计!

“那么现在!赶紧去用代码实现吧!”小Hi如是说道

输入
输入的第一行为一个正整数n,表示词典的大小,其后n行,每一行一个单词(不保证是英文单词,也有可能是火星文单词哦),单词由不超过10个的小写英文字母组成,可能存在相同的单词,此时应将其视作不同的单词。接下来的一行为一个正整数m,表示小Hi询问的次数,其后m行,每一行一个字符串,该字符串由不超过10个的小写英文字母组成,表示小Hi的一个询问。

在20%的数据中n, m<=10,词典的字母表大小<=2.

在60%的数据中n, m<=1000,词典的字母表大小<=5.

在100%的数据中n, m<=100000,词典的字母表大小<=26.

本题按通过的数据量排名哦~

输出
对于小Hi的每一个询问,输出一个整数Ans,表示词典中以小Hi给出的字符串为前缀的单词的个数。

样例输入
5
babaab
babbbaaaa
abba
aaaaabaa
babaababb
5
babb
baabaaa
bab
bb
bbabbaab

样例输出
1
0
3
0
0


这一题题目提示得很清楚,使用Trie树,无奈本人才疏学浅,在看这个题之前不知道什么是Trie树,果断百度之,大意是Trie树是一棵字典树,根节点不存储字母,其余所有节点存储一个字母,所以它最多是一棵26叉树;从根节点到某个节点的一次遍历就是一个单词,这样的数据结构很适合用来字符串查找或者前缀匹配。

常规的Trie树定义如下:

#define MAX 26
typedef struct TrieNode               //Trie结点声明
{
      bool isStr;                      //标记该结点处是否构成单词
      struct TrieNode *next[MAX];      //儿子分支
}Trie;

关于常规Trie树的详细介绍请看此博文

Trie树节点中的isStr是为了查找单词方便而定义的,但是本题只是为了给出以某字符串为前缀的单词的个数,也就是说我们查找的时候只是查找前缀,而不是查找一个完整的单词,所以可以不要isStr成员。

之前看《算法导论》第14章:数据结构的扩张,其中讲到一种顺序统计树的数据结构,该结构就是一棵红黑树,只是在每个节点中额外增加了一个size属性来记录以该节点为根节点的树子树的节点个数。利用这种数据结构可以在O(lgn)时间复杂度内找到第i小的关键字,真是太伟大了。

所以借着这一章的思路,我很快有了本题的解题思路。给Trie树的每个节点增加一个pre属性,用来表示所有以从根节点到该节点构成的字符串为前缀的单词的个数。

题目已经提示我们了

提示三:在建立Trie树时同时进行统计!

所以我们在建立Trie树的时候,通过改造博文中的insert函数,我们每插入一个单词,该单词遍历过的节点的pre值都加1。这样,当我们要查找以字符串s为前缀的单词个数时,只要查找到该字符串s的节点,节点的pre即为以s为前缀的单词的个数。具体的代码实现请看下面:

#include<iostream>
#include<string>
#include<cstdlib>
using namespace std;

const int MAX_C=26;

typedef struct Tri_Node
{
     int pre;//以“从根节点到该节点构成的字符串”为前缀的单词的个数
     struct Tri_Node *next[MAX_C];
}Trie;

//初始化一棵树
void init_Trie(Trie** t)//二级指针
{
     *t=(Trie*)malloc(sizeof(Trie));
     (*t)->pre=0;//参数用了二级指针,这样才将修改的pre的值传出去
     for(int i=0;i<MAX_C;i++)
     {
          (*t)->next[i]=NULL;
     }
}

//将字符串s插入到树中
void insert_node(Trie* root,const string s)
{
     if(root==NULL||s=="")
          return;
     int s_size=s.size();
     Trie *p=root;
     for(int i=0;i<s_size;i++)
     {
          if(p->next[s[i]-'a']==NULL)
          {
               Trie *tmp=NULL;
               init_Trie(&tmp);
               tmp->pre++;
               p->next[s[i]-'a']=tmp;
               p=p->next[s[i]-'a'];
          }
          else
          {
               p=p->next[s[i]-'a'];
               p->pre++;
          }
     }
}

//查找以s为前缀的单词的个数
int search_pre(Trie* root, const string s)
{
     int s_size=s.size();
     Trie* p=root;
     int i=0;
     int rs=0;
     for(i=0;i<s_size;i++)
     {
          if(p->next[s[i]-'a']!=NULL)
          {
               p=p->next[s[i]-'a'];
               rs=p->pre;
          }
          else
               break;
     }
     if(i==s_size)
          return rs;
     else
          return 0;
}
int main()
{
     int n,m;
     cin>>n;
     string s;

     Trie* root=NULL;
     init_Trie(&root);

     while(n--)
     {
          cin>>s;
          insert_node(root,s);
     }
     cin>>m;
     while(m--)
     {
          cin>>s;
          cout<<search_pre(root,s)<<endl;
     }
     return 0;
}

该代码提交的结果:AC,用时1728ms,内存67MB。

由于对C语言及其指针不熟,中间还出现过一些小错误,比如init_Trie(Trie** t);的参数需要使用二级指针才能将值传出去;malloc需要cstdlib头文件等。

One thought on “hihoCoder 1014-Trie树

  1. Pingback: LeetCode Implement Trie (Prefix Tree) | bitJoy > code

Leave a Reply

Your email address will not be published. Required fields are marked *