• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            sunrise

            每天不斷學習,才能不斷提升自己。

              C++博客 :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理 ::
              64 隨筆 :: 0 文章 :: 92 評論 :: 0 Trackbacks
            終于該好了,該字典樹能夠實現對于數據的模糊匹配。代碼如下:
            #!/usr/bin/env python
            #
            -*- coding: UTF-8 -*-

            class Node:
              def __init__(self):
                self.map = {}
                self.indexnum = 0
                self.endflag = False
              def contain(self,key):
                return self.map.__contains__(key)
              def __getitem__(self,key):
                return self.map[key]
              def __setitem__(self,key,value):
                self.map[key] =value

            class TrieTree:
              def  __init__(self):
                self.subNum = 0
                self.indexNum = 0
                self.subNode = Node()
              def add(self,key,trieTree):
                self.subNum += 1
                self.subNode[key] = trieTree

              def __chinese(self,char):
                char = unicode(char,"utf8")
                buf = []
                for word in char:
                    if word >= u'\u4e00'and word <= u'\u9fa5':
                      buf.append(word.encode('utf-8'))
                    elif word == '\n':
                      #在這里對索引進行標記
                      self.indexNum+=1
                return buf

              def search(self,buf):
                buf = self.__chinese(buf)
                current = self
                for i in range(len(buf)):
                  #轉化成每個漢字
                  #print buf[i]
                  if current.subNode.contain(buf[i]):
                    if current.subNode[buf[i]].subNode.endflag == True:
                      return current.subNode.contain(buf[i])
                    else:
                      current = current.subNode[buf[i]]
                  else:
                     #如果沒有匹配上,直接進入下一層
                    continue

              def load(self,filename):
                try:
                  sock = open(filename,'r')
                  buf = sock.read().split('\n')
                  sock.close()
                except IOError:
                  return None

                #讀取每個詞語
                for i  in range(len(buf)):
                  buftmp = self.__chinese(buf[i])
                  tree = self
                  #讀取每個漢字
                  current = tree
                  for j in range(len(buftmp)):
                    if current.subNode.contain(buftmp[j]):
                      current = current.subNode[buftmp[j]]
                    else:
                      sub = TrieTree()
                      current.add(buftmp[j],sub)
                      current = sub
                    if j  == len(buftmp) - 1:
                      current.subNode.endflag = True
                      current.subNode.indexnum = self.indexNum

            if __name__=='__main__':
              s = TrieTree()
              s.load('citynames')
              print s.search('我你')
            #  s.printSelf()
            posted on 2012-08-24 10:15 SunRise_at 閱讀(3185) 評論(3)  編輯 收藏 引用 所屬分類: 數據結構

            評論

            # re: 字典樹改進版(對數據進行模糊匹配) 2012-08-24 12:38 C小加
            學習了,頂LZ  回復  更多評論
              

            # re: 字典樹改進版(對數據進行模糊匹配) 2012-08-28 18:40 izualzhy
            請問lz,Clicki在注冊成功后咋用在cppblog里啊?  回復  更多評論
              

            # re: 字典樹改進版(對數據進行模糊匹配) 2012-08-29 10:43 SunRise_at
            復制那個標簽的代碼到一個地方,你好好看看那個說明,我弄了好久了,忘了 要把代碼粘哪兒了@izualzhy
            @izualzhy
            @izualzhy
            @izualzhy
              回復  更多評論
              

            久久91精品国产91| 中文精品久久久久人妻| 久久青青草原亚洲av无码app| 97久久久久人妻精品专区| 久久男人AV资源网站| 国产一区二区三区久久精品| 久久99热这里只频精品6| 久久久无码精品亚洲日韩蜜臀浪潮 | av国内精品久久久久影院| 亚洲国产精品无码久久青草| 午夜久久久久久禁播电影| 性高湖久久久久久久久AAAAA| 亚洲国产精品久久66| 久久精品国产免费一区| 狠狠色丁香婷婷久久综合| 久久精品国产91久久麻豆自制| 久久人妻少妇嫩草AV蜜桃| 国产福利电影一区二区三区久久久久成人精品综合 | 人妻无码αv中文字幕久久 | 东方aⅴ免费观看久久av| 欧美国产成人久久精品| 亚洲综合婷婷久久| 久久国产色AV免费看| 一本久久a久久精品亚洲| 久久国产精品视频| 国产成人精品免费久久久久| 日韩欧美亚洲综合久久| 日韩欧美亚洲国产精品字幕久久久| 波多野结衣中文字幕久久| 亚洲色欲久久久综合网东京热| 欧美久久综合九色综合| 精品久久久久久久久久中文字幕| 久久精品成人免费看| 久久精品视频网| 久久国产色AV免费观看| 久久亚洲精品人成综合网| 亚洲国产精品一区二区久久hs| 久久九九兔免费精品6| 久久精品日日躁夜夜躁欧美| 精产国品久久一二三产区区别| 国产精品久久久久免费a∨|