• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            sunrise

            每天不斷學習,才能不斷提升自己。

              C++博客 :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理 ::
              64 隨筆 :: 0 文章 :: 92 評論 :: 0 Trackbacks
            終于該好了,該字典樹能夠實現對于數據的模糊匹配。代碼如下:
            #!/usr/bin/env python
            #
            -*- coding: UTF-8 -*-

            class Node:
              def __init__(self):
                self.map = {}
                self.indexnum = 0
                self.endflag = False
              def contain(self,key):
                return self.map.__contains__(key)
              def __getitem__(self,key):
                return self.map[key]
              def __setitem__(self,key,value):
                self.map[key] =value

            class TrieTree:
              def  __init__(self):
                self.subNum = 0
                self.indexNum = 0
                self.subNode = Node()
              def add(self,key,trieTree):
                self.subNum += 1
                self.subNode[key] = trieTree

              def __chinese(self,char):
                char = unicode(char,"utf8")
                buf = []
                for word in char:
                    if word >= u'\u4e00'and word <= u'\u9fa5':
                      buf.append(word.encode('utf-8'))
                    elif word == '\n':
                      #在這里對索引進行標記
                      self.indexNum+=1
                return buf

              def search(self,buf):
                buf = self.__chinese(buf)
                current = self
                for i in range(len(buf)):
                  #轉化成每個漢字
                  #print buf[i]
                  if current.subNode.contain(buf[i]):
                    if current.subNode[buf[i]].subNode.endflag == True:
                      return current.subNode.contain(buf[i])
                    else:
                      current = current.subNode[buf[i]]
                  else:
                     #如果沒有匹配上,直接進入下一層
                    continue

              def load(self,filename):
                try:
                  sock = open(filename,'r')
                  buf = sock.read().split('\n')
                  sock.close()
                except IOError:
                  return None

                #讀取每個詞語
                for i  in range(len(buf)):
                  buftmp = self.__chinese(buf[i])
                  tree = self
                  #讀取每個漢字
                  current = tree
                  for j in range(len(buftmp)):
                    if current.subNode.contain(buftmp[j]):
                      current = current.subNode[buftmp[j]]
                    else:
                      sub = TrieTree()
                      current.add(buftmp[j],sub)
                      current = sub
                    if j  == len(buftmp) - 1:
                      current.subNode.endflag = True
                      current.subNode.indexnum = self.indexNum

            if __name__=='__main__':
              s = TrieTree()
              s.load('citynames')
              print s.search('我你')
            #  s.printSelf()
            posted on 2012-08-24 10:15 SunRise_at 閱讀(3194) 評論(3)  編輯 收藏 引用 所屬分類: 數據結構

            評論

            # re: 字典樹改進版(對數據進行模糊匹配) 2012-08-24 12:38 C小加
            學習了,頂LZ  回復  更多評論
              

            # re: 字典樹改進版(對數據進行模糊匹配) 2012-08-28 18:40 izualzhy
            請問lz,Clicki在注冊成功后咋用在cppblog里?。?nbsp; 回復  更多評論
              

            # re: 字典樹改進版(對數據進行模糊匹配) 2012-08-29 10:43 SunRise_at
            復制那個標簽的代碼到一個地方,你好好看看那個說明,我弄了好久了,忘了 要把代碼粘哪兒了@izualzhy
            @izualzhy
            @izualzhy
            @izualzhy
              回復  更多評論
              

            久久久久免费精品国产| 欧美亚洲国产精品久久高清| 狠狠久久亚洲欧美专区| 人人狠狠综合久久亚洲婷婷 | 18岁日韩内射颜射午夜久久成人| 狠狠色丁香婷婷综合久久来| 久久精品无码一区二区日韩AV | 热re99久久6国产精品免费| 亚洲国产精品久久久久婷婷软件| 久久人人爽人人爽AV片| 99久久精品午夜一区二区| 亚洲精品成人久久久| 成人精品一区二区久久| 色综合久久久久综合体桃花网| 久久精品无码一区二区日韩AV | 久久亚洲高清观看| 久久久国产精华液| 久久亚洲av无码精品浪潮| av无码久久久久不卡免费网站| 2021国内久久精品| 久久精品国产99国产精品| 精品乱码久久久久久久| 亚洲人成无码网站久久99热国产 | 中文字幕亚洲综合久久菠萝蜜| 色综合久久中文综合网| 久久久久久久97| 伊人久久大香线蕉综合影院首页 | 久久综合伊人77777麻豆| 99热成人精品免费久久| 99久久777色| 国产99精品久久| 久久99国产精品二区不卡| 久久丫精品国产亚洲av不卡| 人妻精品久久无码区| 99久久99久久精品国产片果冻| 伊人久久五月天| 久久99精品国产麻豆宅宅| 久久久亚洲欧洲日产国码是AV | 欧美与黑人午夜性猛交久久久| 久久93精品国产91久久综合| 狠狠色综合网站久久久久久久|