字符串處理的方法有很多比如說(shuō)Hash,Trie,但主要還是想說(shuō)三叉樹(shù),
這里有篇博文講的挺好。
Hash主要是通過(guò)一個(gè)hash函數(shù)來(lái)建立一個(gè)字符串與目標(biāo)的映射,Hash函數(shù)的選擇與查找效率有很大關(guān)系,網(wǎng)上很多這方面的介紹。
Trie樹(shù)是一種樹(shù)狀結(jié)構(gòu),
這里有說(shuō)明。當(dāng)然網(wǎng)上還可以找到更好的介紹。其沒(méi)擴(kuò)展一個(gè)節(jié)點(diǎn)會(huì),會(huì)擴(kuò)展出26(若是只處理普通字符,不區(qū)分大小寫(xiě))個(gè)節(jié)點(diǎn),大大的浪費(fèi)了存儲(chǔ)空間。其代碼如下:
1 const int M=26;
2 const char CH='A';
3 struct node
4 {
5 bool isend;
6 node* child[M];
7 node()
8 {
9 isend=false;
10 for(int i=0;i<M;++i)
11 child[i]=NULL;
12 }
13 };
14 node *root;
15 void Insert(char str[],node* &root)
16 {
17 if(root==NULL)
18 root=new node;
19 node* p=root;
20 int i=0;
21 while(str[i]!='\0')
22 {
23 if(p->child[str[i]-CH]==NULL)
24 p->child[str[i]-CH]=new node;
25 p=p->child[str[i]-CH];
26 ++i;
27 }
28 p->isend=true;
29 }
30 bool Seach(char str[],node* root)
31 {
32 node* p=root;
33 int i=0;
34 while(str[i]!='\0')
35 {
36 if(p->child[str[i]-CH]==NULL)
37 return false;
38 else p=p->child[str[i]-CH];
39 ++i;
40 }
41 if(p->isend) return true;
42 else return false;
43
44 }
三叉樹(shù)有trie的優(yōu)點(diǎn),卻又比trie占用的空間小,好像這個(gè)東西比trie更加實(shí)用,并且效率不賴(lài),很多網(wǎng)站的實(shí)時(shí)補(bǔ)充單詞(即,輸入單詞的前綴會(huì)自動(dòng)補(bǔ)充后半部分單詞)就是用它。三叉樹(shù)的每個(gè)節(jié)點(diǎn)會(huì)有一個(gè)key,左子樹(shù),右子樹(shù),中間子樹(shù)。查找或是插入類(lèi)似于二叉樹(shù),若是插入的數(shù)據(jù)大于key就插入左子樹(shù),若是大于key就插入右子樹(shù),等于key插入中間子樹(shù)(好像叫起來(lái)不順口),當(dāng)然反之亦可。其具體實(shí)現(xiàn)代碼如下:
1 struct node
2 {
3 node* l;
4 node* r;
5 node* mid;
6 char key;
7 bool isend;
8 node():l(NULL),r(NULL),mid(NULL),isend(false),key(0){}
9 };
10 void insert(char *str,node* &root)
11 {
12 if(root==NULL)
13 {
14 root=new node;
15 root->key=str[0];
16 }
17 node* p=root;
18 node* t=p;
19 while(*str)
20 {
21 if(*str>p->key)
22 {
23 if(p->r==NULL)
24 {
25 p->r=new node;
26 p->r->key=*str;
27 }
28 p=p->r;
29 }
30 else if(*str<p->key)
31 {
32 if(p->l==NULL)
33 {
34 p->l=new node;
35 p->l->key=*str;
36 }
37 p=p->l;
38 }
39 else
40 {
41 ++str;
42 if(*str=='\0') break;
43 if(p->mid==NULL)
44 {
45 p->mid=new node;
46 p->mid->key=*str;
47 }
48 p=p->mid;
49 }
50 }
51 p->isend=true;
52 }
53 bool search(char *str,node* root)
54 {
55 while(*str)
56 {
57 if(*str> root->key)
58 {
59 root=root->r;
60 }
61 else if(*str<root->key)
62 {
63 root=root->l;
64 }
65 else
66 {
67 ++str;
68 if(*str!='\0')
69 root=root->mid;
70 }
71 if(root==NULL) return false;
72 }
73 if(root->isend) return true;
74 else return false;
75 }