• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            小四的海市蜃樓
            Never surrender to complexity
            posts - 21,comments - 59,trackbacks - 0

            寫了一個哈希表模板類,用于統(tǒng)計一篇文章中不同單詞出現(xiàn)的次數(shù)。哈希表使用char*作為key,使用桶式鏈表指針數(shù)組(指向結(jié)點鏈表的指針數(shù)組)來索引,字符串哈希函數(shù)是在網(wǎng)上搜來的。模板參數(shù)一個是值類型,另一個NBARREL是指針數(shù)組的大小,通常是越大哈希值沖突就越少,結(jié)點鏈表長度也就越短,當(dāng)然查找就越快。

            為了方便統(tǒng)計,為哈希表增加了一個IncValue函數(shù),提高效率。統(tǒng)計的時候使用了快速排序,為了提高效率,
            把上次的快排模板稍微修改了一下,直接對指針數(shù)組進行排序,就不用進行值的交換了。

             

            /********************************************************************
                created:    2007/12/30
                filename:   hashtable.h
                author:     dj
                purpose:    哈希表模板類
            *********************************************************************/


               #ifndef __HASHTABLE_H__
            #define __HASHTABLE_H__

            #define SAFE_DELETE(p) {if(p) { delete [] (p); (p) = NULL;}}

            template
            <typename T>
            void quicksort(T* v, int n)
            {
                
            if (n<=1)
                    
            return;
                
            int last = 0;
                
            int pivot = rand()%n;
                swap(v, 
            0, pivot);
                
            for (int i = 1; i < n; i++)
                
            {
                    
            if ((*v[i])>(*v[0]))
                        swap(v, 
            ++last, i);
                }

                swap(v, last, 
            0);
                quicksort(
            &v[0], last);
                quicksort(
            &v[last+1], n-last-1);
            }


            template
            <typename T>
            void swap(T* v, int i, int j)
            {
                T tmp 
            = v[i];
                v[i] 
            = v[j];
                v[j] 
            = tmp;    
            }



            template
            <typename T, int NBARREL = 100>
            class HashTable
            {
            public:
                HashTable():m_nCount(
            0)
                
            {
                    memset(m_pNodes, NULL, 
            sizeof(void*)*NBARREL);
                }

                
            ~HashTable()
                
            {
                    FreeTable();
                }

                
            bool Exists(const char* sName)
                
            {
                    
            int h = Hash(sName);
                    HashNode
            * p = m_pNodes[h];
                    
            while(p)
                    
            {
                        
            if (strcmp(p->name, sName)==0)
                            
            return true;
                        p 
            = p->next;
                    }

                    
            return false;
                }

                
            bool AddNode(const char* sName, const T& tValue)
                
            {
                    
            if (Exists(sName))
                        
            return false;
                    
            int h = Hash(sName);
                    HashNode
            * node = new HashNode(sName, tValue);
                    node
            ->next = m_pNodes[h];
                    m_pNodes[h] 
            = node;
                    m_nCount
            ++;
                    
            return true;
                }

                T GetValue(
            const char* sName)
                
            {
                    
            int h = Hash(sName);
                    HashNode
            * p = m_pNodes[h];
                    
            while(p)
                    
            {
                        
            if (strcmp(p->name, sName)==0)
                            
            return p->value;
                        p 
            = p->next;
                    }

                    
            return NULL;
                }

                
            bool SetValue(const char* sName, const T& tValue)
                
            {
                    
            int h = Hash(sName);
                    HashNode
            * p = m_pNodes[h];
                    
            while(p)
                    
            {
                        
            if (strcmp(p->name, sName)==0)
                        
            {
                            p
            ->value = tValue;
                            
            return true;
                        }

                        p 
            = p->next;
                    }

                }

                
            void IncValue(const char* sName)
                
            {
                    
            int h = Hash(sName);
                    HashNode
            * p = m_pNodes[h];
                    
            while(p)
                    
            {
                        
            if (strcmp(p->name, sName)==0)
                        
            {
                            p
            ->value++;
                            
            return;
                        }

                        p 
            = p->next;
                    }
                    
                    HashNode
            * node = new HashNode(sName, 1);
                    node
            ->next = m_pNodes[h];
                    m_pNodes[h] 
            = node;
                    m_nCount
            ++;
                }

                
            void Dump(const char* sFile)
                
            {
                    ofstream file(sFile);
                    assert(file
            !=NULL);
                    HashNode
            ** pNodes = new HashNode*[m_nCount];
                    
            int i, counter = 0;
                    
            for(i = 0; i < NBARREL; i++)
                    
            {
                        HashNode
            * p = m_pNodes[i];
                        
            while(p)
                        
            {
                            pNodes[counter
            ++= p;
                            p 
            = p->next;
                        }

                    }

                    quicksort(pNodes, m_nCount);
                    
            for (i = 0; i < m_nCount; i++)
                    
            {
                        file
            <<pNodes[i]->value<<"  "<<pNodes[i]->name<<endl;
                    }


                    SAFE_DELETE(pNodes);
                    file.close();
                }

            private:
                
            int Hash(const char* c)
                
            {
                    
            int ret=0
                    
            int n, v, r; 
                    
            if ((c == NULL) || (*== '\0')) 
                    
            return(ret); 
                    n
            =0x100
                    
            while (*c) 
                    

                        v
            =n|(*c); 
                        n
            +=0x100
                        r
            = (int)((v>>2)^v)&0x0f
                        ret
            =(ret!=(32-r)); 
                        ret
            &=0xFFFFFFFFL
                        ret
            ^=v*v; 
                        c
            ++
                    }
             
                    
            return(((ret>>16)^ret)%NBARREL);         
                }

                
            void FreeTable()
                
            {
                    
            for(int i = 0; i < NBARREL; i++)
                    
            {
                        HashNode
            * p = m_pNodes[i];
                        
            while(p)
                        
            {
                            HashNode
            * pnext = p->next;
                            delete p;
                            p 
            = pnext;
                        }

                    }

                }

            private:
                
            struct HashNode
                
            {
                    HashNode(
            const char* c, const T& v)
                    
            {
                        name 
            = new char[strlen(c)+1];
                        strcpy(name, c);
                        value 
            = v;
                    }

                    
            ~HashNode()
                    
            {
                        SAFE_DELETE(name);
                    }

                    
            bool operator > (const HashNode& node) const
                    
            {
                        
            return (this->value > node.value);
                    }

                    
            bool operator < (const HashNode& node) const
                    
            {
                        
            return (this->value < node.value);
                    }

                    
            bool operator == (const HashNode& node) const
                    
            {
                        
            return (this->value == node.value);
                    }

                    
            char* name;
                    T value;
                    HashNode
            * next;
                }
            ;
                HashNode
            * m_pNodes[NBARREL];
                
            int m_nCount;
            }
            ;


            #endif //__HASHTABLE_H__


            測試程序如下

            int main(int argc, char* argv[])
            {
                HashTable
            <int500> h;
                ifstream f(
            "c:\\test.txt");
                
            string s;
                
            while(f>>s)
                
            {
            //        if (h.Exists(s.c_str()))
            //        {
            //            h.SetValue(s.c_str(), h.GetValue(s.c_str())+1);
            //        }
            //        else
            //        {
            //            h.AddNode(s.c_str(), 1);
            //        }
                    h.IncValue(s.c_str());
                }

                h.Dump(
            "c:\\stat.txt");    
                
            return 0;
            }

            隨便在google上找了幾個英文網(wǎng)頁來統(tǒng)計,
            發(fā)現(xiàn)排第一位的單詞是"2007",第二位的居然是"die"

            程序設(shè)計實踐上說,用素數(shù)作為數(shù)組的大小是明智的,因為這樣能保證在數(shù)組大小、散列的乘數(shù)和可能的數(shù)據(jù)值之間不存在公因子,我覺得他特指java的散列函數(shù)
            enum{MULTIPLIER = 37}
            unsigned 
            int hash(char* str)

               unsigned 
            int h = 0;
               unsigned 
            char* p;
               
            for(p=str;*p!=0;p++)
                  h 
            = MULTIPLIER*h+*p;
               
            return h%NHASH;
            }


            最后附幾個經(jīng)典字符串哈希函數(shù)來自
            http://www.oioj.net/blog/user3/28679/archives/2005/166870.shtml

            posted on 2007-12-30 15:13 小四 閱讀(552) 評論(0)  編輯 收藏 引用 所屬分類: 算法與數(shù)據(jù)結(jié)構(gòu)
            香蕉99久久国产综合精品宅男自| 久久精品中文字幕久久| 久久精品嫩草影院| 热综合一本伊人久久精品| 久久99精品久久久大学生| 久久综合欧美成人| 婷婷久久五月天| 久久久久夜夜夜精品国产| 精品国产日韩久久亚洲| 亚洲一区中文字幕久久| 少妇高潮惨叫久久久久久 | 综合久久久久久中文字幕亚洲国产国产综合一区首 | 精品久久久久成人码免费动漫| 久久国产高潮流白浆免费观看| 久久婷婷色综合一区二区| 91久久婷婷国产综合精品青草| 久久久国产视频| 久久久久香蕉视频| 热久久这里只有精品| 久久夜色精品国产网站| 精品国产日韩久久亚洲| 欧美亚洲另类久久综合婷婷| 久久99国产精品久久| 久久国产精品无码一区二区三区 | 国内精品伊人久久久久影院对白| 亚洲AV日韩AV永久无码久久| 久久福利资源国产精品999| 久久国产成人午夜AV影院| 一级做a爰片久久毛片16| 91久久香蕉国产熟女线看| 久久精品国产99国产电影网| 996久久国产精品线观看| 人妻少妇久久中文字幕一区二区| 久久久亚洲欧洲日产国码是AV| 欧美成人免费观看久久| 久久综合鬼色88久久精品综合自在自线噜噜 | 99久久国产精品免费一区二区| 国产精品久久婷婷六月丁香| 亚洲国产成人精品女人久久久 | 午夜久久久久久禁播电影| 精品久久久久久久久免费影院 |