• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            sunrise

            每天不斷學習,才能不斷提升自己。

              C++博客 :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理 ::
              64 隨筆 :: 0 文章 :: 92 評論 :: 0 Trackbacks
            終于該好了,該字典樹能夠實現對于數據的模糊匹配。代碼如下:
            #!/usr/bin/env python
            #
            -*- coding: UTF-8 -*-

            class Node:
              def __init__(self):
                self.map = {}
                self.indexnum = 0
                self.endflag = False
              def contain(self,key):
                return self.map.__contains__(key)
              def __getitem__(self,key):
                return self.map[key]
              def __setitem__(self,key,value):
                self.map[key] =value

            class TrieTree:
              def  __init__(self):
                self.subNum = 0
                self.indexNum = 0
                self.subNode = Node()
              def add(self,key,trieTree):
                self.subNum += 1
                self.subNode[key] = trieTree

              def __chinese(self,char):
                char = unicode(char,"utf8")
                buf = []
                for word in char:
                    if word >= u'\u4e00'and word <= u'\u9fa5':
                      buf.append(word.encode('utf-8'))
                    elif word == '\n':
                      #在這里對索引進行標記
                      self.indexNum+=1
                return buf

              def search(self,buf):
                buf = self.__chinese(buf)
                current = self
                for i in range(len(buf)):
                  #轉化成每個漢字
                  #print buf[i]
                  if current.subNode.contain(buf[i]):
                    if current.subNode[buf[i]].subNode.endflag == True:
                      return current.subNode.contain(buf[i])
                    else:
                      current = current.subNode[buf[i]]
                  else:
                     #如果沒有匹配上,直接進入下一層
                    continue

              def load(self,filename):
                try:
                  sock = open(filename,'r')
                  buf = sock.read().split('\n')
                  sock.close()
                except IOError:
                  return None

                #讀取每個詞語
                for i  in range(len(buf)):
                  buftmp = self.__chinese(buf[i])
                  tree = self
                  #讀取每個漢字
                  current = tree
                  for j in range(len(buftmp)):
                    if current.subNode.contain(buftmp[j]):
                      current = current.subNode[buftmp[j]]
                    else:
                      sub = TrieTree()
                      current.add(buftmp[j],sub)
                      current = sub
                    if j  == len(buftmp) - 1:
                      current.subNode.endflag = True
                      current.subNode.indexnum = self.indexNum

            if __name__=='__main__':
              s = TrieTree()
              s.load('citynames')
              print s.search('我你')
            #  s.printSelf()
            posted on 2012-08-24 10:15 SunRise_at 閱讀(3185) 評論(3)  編輯 收藏 引用 所屬分類: 數據結構

            評論

            # re: 字典樹改進版(對數據進行模糊匹配) 2012-08-24 12:38 C小加
            學習了,頂LZ  回復  更多評論
              

            # re: 字典樹改進版(對數據進行模糊匹配) 2012-08-28 18:40 izualzhy
            請問lz,Clicki在注冊成功后咋用在cppblog里啊?  回復  更多評論
              

            # re: 字典樹改進版(對數據進行模糊匹配) 2012-08-29 10:43 SunRise_at
            復制那個標簽的代碼到一個地方,你好好看看那個說明,我弄了好久了,忘了 要把代碼粘哪兒了@izualzhy
            @izualzhy
            @izualzhy
            @izualzhy
              回復  更多評論
              

            精品国产日韩久久亚洲| 久久精品国产日本波多野结衣 | 72种姿势欧美久久久久大黄蕉| 91久久精品91久久性色| 日本三级久久网| 久久久久久久人妻无码中文字幕爆| 久久久久九九精品影院| 99久久精品国产高清一区二区| 久久这里只有精品久久| 婷婷国产天堂久久综合五月| 91麻豆精品国产91久久久久久 | 久久久久久国产精品美女| 午夜精品久久久久| 欧美亚洲国产精品久久蜜芽| 污污内射久久一区二区欧美日韩| 狠狠色综合网站久久久久久久| 九九久久99综合一区二区| 久久久精品人妻一区二区三区四| 国产精品成人99久久久久| 国产精品狼人久久久久影院| 无码人妻久久一区二区三区 | 亚洲精品WWW久久久久久| 国产成人久久精品麻豆一区| 无码日韩人妻精品久久蜜桃| 香蕉久久永久视频| 品成人欧美大片久久国产欧美| 亚洲国产欧洲综合997久久| 欧美麻豆久久久久久中文| 99久久99久久精品国产| 99久久人妻无码精品系列 | 青青草国产成人久久91网| 亚洲av日韩精品久久久久久a| 四虎亚洲国产成人久久精品| 久久综合狠狠综合久久激情 | 久久亚洲高清综合| 久久久久这里只有精品| 国产精品99久久精品| 久久精品国产亚洲AV麻豆网站| 久久免费看黄a级毛片| 一本一本久久a久久精品综合麻豆| 国产精品99久久久久久猫咪 |