• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            sunrise

            每天不斷學習,才能不斷提升自己。

              C++博客 :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理 ::
              64 隨筆 :: 0 文章 :: 92 評論 :: 0 Trackbacks
            終于該好了,該字典樹能夠實現對于數據的模糊匹配。代碼如下:
            #!/usr/bin/env python
            #
            -*- coding: UTF-8 -*-

            class Node:
              def __init__(self):
                self.map = {}
                self.indexnum = 0
                self.endflag = False
              def contain(self,key):
                return self.map.__contains__(key)
              def __getitem__(self,key):
                return self.map[key]
              def __setitem__(self,key,value):
                self.map[key] =value

            class TrieTree:
              def  __init__(self):
                self.subNum = 0
                self.indexNum = 0
                self.subNode = Node()
              def add(self,key,trieTree):
                self.subNum += 1
                self.subNode[key] = trieTree

              def __chinese(self,char):
                char = unicode(char,"utf8")
                buf = []
                for word in char:
                    if word >= u'\u4e00'and word <= u'\u9fa5':
                      buf.append(word.encode('utf-8'))
                    elif word == '\n':
                      #在這里對索引進行標記
                      self.indexNum+=1
                return buf

              def search(self,buf):
                buf = self.__chinese(buf)
                current = self
                for i in range(len(buf)):
                  #轉化成每個漢字
                  #print buf[i]
                  if current.subNode.contain(buf[i]):
                    if current.subNode[buf[i]].subNode.endflag == True:
                      return current.subNode.contain(buf[i])
                    else:
                      current = current.subNode[buf[i]]
                  else:
                     #如果沒有匹配上,直接進入下一層
                    continue

              def load(self,filename):
                try:
                  sock = open(filename,'r')
                  buf = sock.read().split('\n')
                  sock.close()
                except IOError:
                  return None

                #讀取每個詞語
                for i  in range(len(buf)):
                  buftmp = self.__chinese(buf[i])
                  tree = self
                  #讀取每個漢字
                  current = tree
                  for j in range(len(buftmp)):
                    if current.subNode.contain(buftmp[j]):
                      current = current.subNode[buftmp[j]]
                    else:
                      sub = TrieTree()
                      current.add(buftmp[j],sub)
                      current = sub
                    if j  == len(buftmp) - 1:
                      current.subNode.endflag = True
                      current.subNode.indexnum = self.indexNum

            if __name__=='__main__':
              s = TrieTree()
              s.load('citynames')
              print s.search('我你')
            #  s.printSelf()
            posted on 2012-08-24 10:15 SunRise_at 閱讀(3186) 評論(3)  編輯 收藏 引用 所屬分類: 數據結構

            評論

            # re: 字典樹改進版(對數據進行模糊匹配) 2012-08-24 12:38 C小加
            學習了,頂LZ  回復  更多評論
              

            # re: 字典樹改進版(對數據進行模糊匹配) 2012-08-28 18:40 izualzhy
            請問lz,Clicki在注冊成功后咋用在cppblog里啊?  回復  更多評論
              

            # re: 字典樹改進版(對數據進行模糊匹配) 2012-08-29 10:43 SunRise_at
            復制那個標簽的代碼到一個地方,你好好看看那個說明,我弄了好久了,忘了 要把代碼粘哪兒了@izualzhy
            @izualzhy
            @izualzhy
            @izualzhy
              回復  更多評論
              

            亚洲综合精品香蕉久久网97| 亚洲国产天堂久久久久久| 久久99精品久久只有精品| 精品久久久久久无码中文字幕一区| 国产成人无码久久久精品一| 99久久免费只有精品国产| 伊人久久大香线蕉无码麻豆| 99久久99这里只有免费费精品| 久久精品国产黑森林| 国产成年无码久久久免费| 丁香五月网久久综合| 久久婷婷是五月综合色狠狠| 国产精品久久久久久久久鸭| 欧美色综合久久久久久| 久久国产精品成人免费| 中文精品久久久久人妻| 狠狠色婷婷综合天天久久丁香| 精品久久久久中文字| 精品熟女少妇av免费久久| 人妻丰满?V无码久久不卡| 国产精品久久99| 久久久久久亚洲Av无码精品专口 | 久久久久人妻一区精品| 午夜久久久久久禁播电影| 狠狠色综合网站久久久久久久| 国产麻豆精品久久一二三| 精品伊人久久大线蕉色首页| 久久精品亚洲福利| 精品多毛少妇人妻AV免费久久| 人妻精品久久久久中文字幕69| 亚洲国产成人久久综合区| 久久精品国产亚洲一区二区三区| 久久精品一区二区国产| 狠狠88综合久久久久综合网| 久久久久se色偷偷亚洲精品av| 欧美久久亚洲精品| 久久精品国产欧美日韩| 久久国产综合精品五月天| 久久久久亚洲AV综合波多野结衣| 国产亚洲婷婷香蕉久久精品| 国产精品久久久久久影院|