久久蜜桃香蕉精品一区二区三区,免费在线观看日韩欧美,国产精品swaghttp://www.shnenglu.com/yefeng/category/12510.html夜風'blogzh-cnSun, 02 Dec 2012 23:44:15 GMTSun, 02 Dec 2012 23:44:15 GMT60min(x,y)高效算法http://www.shnenglu.com/yefeng/archive/2011/08/22/154091.html夜風夜風Mon, 22 Aug 2011 15:58:00 GMThttp://www.shnenglu.com/yefeng/archive/2011/08/22/154091.htmlhttp://www.shnenglu.com/yefeng/comments/154091.htmlhttp://www.shnenglu.com/yefeng/archive/2011/08/22/154091.html#Feedback16http://www.shnenglu.com/yefeng/comments/commentRss/154091.htmlhttp://www.shnenglu.com/yefeng/services/trackbacks/154091.html求較小值的帖子,讓我突然想起一年前一次折騰逆向工程的嘗試,當時用IDA進行反匯編,看到一串匯編代碼,非常精妙,最終發(fā)現(xiàn)僅僅是為了計算兩個整數(shù)的較小值。可現(xiàn)在非常努力的回憶,就是想不起來是怎么做的。
     真的非常想再現(xiàn)那串算法,于是自己開始推敲。我來談談我推敲的過程。
     命題:給定整數(shù)x,y,計算較小值m。
     兩個數(shù)的差異,在于他們的差,于是想到計算z = x - y,我想也許可以利用這個中間值,利用一些巧妙的位運算求出,可是貌似還是比較困難。于是我打算重新理一下思路:
可能出現(xiàn)的情況:(暫時忽略特殊情況 z = 0)
1. x < y
    z < 0
    就是要找到一個函數(shù)f,滿足f(y , z) = x
2. x > y
    z > 0
    就需要這個f不僅滿足1,而且滿足此時f(y , z) = y

    因為算法的目的是使用加減法、位運算這些基本運算,盡可能簡單的計算。所以我選擇了加法運算
    y + g(z) = x , z = x - y < 0;
    y + g(z) = y , z = x - y > 0;
    最終變成尋求一元函數(shù)g
    就是
    g(z) = z, z < 0
    g(z) = 0, z > 0
    也就是要找到一個一元分段函數(shù),而且需要運算簡單,于是我想到了g(z) = (z >> 31) & z
    如果z < 0,z>>31得到的是FFFFFFFF,再與上一個z,還是z,
    如果z > 0,  z>>31得到的是0000000,最終還是0
    所以最終的算法是
    z = x - y
    m = ((z >> 31) & z) + y;
    這個算法應該跟當初看到的比較接近了。它的優(yōu)點很顯然,全部是最基本的運算,而且不包含控制指令,而且完全可以直接由寄存器計算完成,效率很高。
   
    算法本身并非什么驚天地泣鬼神大算法,而且在編譯器里肯定會有自己做這樣的優(yōu)化,其實最讓我欣慰的是我這次的思路,思路非常清晰,很久沒有動腦子的我,居然還能這么思考,我已經很高興了。其中主要包含兩種思想:分類討論、降低元數(shù)(降二元為一元)。這也是使用非常廣泛的方法了,前者主要幫助理清思路,后者主要降低復雜度。

Updated:
    之前用的是z>>32,用gcc編譯會出現(xiàn)一個警告:
    right shift count >= width of type [enabled by default]
    但還不清楚會存在什么樣的隱患,所以改成31

夜風 2011-08-22 23:58 發(fā)表評論
]]>
Aho-Corasick算法實踐http://www.shnenglu.com/yefeng/archive/2009/12/06/102671.html夜風夜風Sun, 06 Dec 2009 14:51:00 GMThttp://www.shnenglu.com/yefeng/archive/2009/12/06/102671.htmlhttp://www.shnenglu.com/yefeng/comments/102671.htmlhttp://www.shnenglu.com/yefeng/archive/2009/12/06/102671.html#Feedback0http://www.shnenglu.com/yefeng/comments/commentRss/102671.htmlhttp://www.shnenglu.com/yefeng/services/trackbacks/102671.html

Aho-Corasick算法實踐

摘要:

    Aho-Corasick算法可以在文本串中識別一組關鍵字,所需時間和文本長度以及所有關鍵字的總長度成正比。該算法使用了一種稱為“trie”的特殊形式的狀態(tài)裝換圖。Trie是一個樹形結構的狀態(tài)裝換圖,從一個結點到它的各個子結點的邊上有不同的標號。Trie的葉子結點表示識別到的關鍵字。

    在這里,將著重討論算法的實現(xiàn)。算法包含兩個部分,一是經典的KMP算法,二是KMP的擴展算法Aho-Corasick算法。前者實現(xiàn)單關鍵字的模式匹配,后者實現(xiàn)多關鍵字的匹配。(參考龍書詞法分析部分內容)

   【源代碼:http://www.shnenglu.com/Files/yefeng/ACKMP.rar(vc9.0下測試通過) 】

一、經典KMP算法

    當初,初學KMP算法時,總是通過反復的舉例去理解,沒有一種好的表達方式,而龍書描述這個算法使用了trie樹,也就是一個單鏈的狀態(tài)轉換圖。如模式b0b1...bn-1,trie樹如下:

    

    對模式串定義失效函數(shù)f:x->y,x,y in S,描述狀態(tài)轉移,f(s)表示在狀態(tài)s處,當下一個字符不是bs時轉向狀態(tài)f(s)繼續(xù)匹配。因此設置f(s)成為關鍵問題。

    f(s)的存在其實主要是為了消除回溯。細節(jié)就不再多說了,這里只從原理上簡單說明。

    設模式串為W,用文法描述,U、V表示W的一部分,w表示一個字符:

    W -> UwV,

    當U識別完成后,進入狀態(tài)s,識別w時,發(fā)現(xiàn)到來的字符不等于w,則需要轉向狀態(tài)f(s),f(s)到哪里去找呢?

    那就要看U是什么樣子了。不管什么情況,只要U非空串,總可以表示成:

       U -> uXu,或 U -> u,或U-> uXx,(x != u)

    可以發(fā)現(xiàn),前綴u是,如果后綴也是u,意味著主串中u已經被識別,如果還從模式串頭匹配u無疑是多余的,所以f(s)應該是識別前綴u后進入的狀態(tài)。然后再匹配下一個字符。而滿足條件的u可能會有多個,所以總是選擇最長的那個。偽代碼如下:

   

    到此為止,應該算是可以結束KMP了,但實際情況下還可以對f函數(shù)進行優(yōu)化。很多書本上描述的next數(shù)組就可以從f函數(shù)推導過來。

    其實也顯然,設狀態(tài)s接收字符w,當與輸入字符c不等于c時,轉向狀態(tài)t,倘若t狀態(tài)也只接收字符w,顯然再次比較w與c是多余的,之后必然再次轉向狀態(tài)f(t)。在運行的時候,這些狀態(tài)轉換時沒有意義的,可以在構造f之后,直接將f(s)設置為f(t)提高運行效率(不過此時f函數(shù)的意義已經不同了)。f優(yōu)化如下:

   

二、多關鍵字匹配與Aho-Corasick算法

    Aho和Corasick對KMP算法進行了推廣,使它可以在一個文本串識別一個關鍵字集合中的任何關鍵字。在這種情況下,trie是一棵真正的樹,從其根結點開始就會出現(xiàn)分支。如果一個字符串是某個關鍵字的前綴,那么在trie中就又一個和該字符串對應的狀態(tài)。如關鍵字集合{he,she,his,hers},trie樹如下:

   

   

    類似的,仍然構造類似KMP算法中那樣的實效函數(shù)。對于上面的例子,失效函數(shù)如下:

s

0

1

2

3

4

5

6

7

8

9

f(s)

-1

0

0

0

1

2

0

3

0

3


  1.構造失效函數(shù)

    類似KMP算法,同樣采用實效實效函數(shù)推進的方法,假設當前狀態(tài)為s,s的一個孩子結點的根結點根節(jié)點t狀態(tài),如果當前的失效函數(shù)已知為f(s),則顯然地,f(t)必定是f(s)的孩子結點狀態(tài),所要做的就是在狀態(tài)f(s)處尋找接受字符同s->t下一個狀態(tài),如果能找到,那就是f(t),否則說明到s處匹配串的前綴長度太長,需縮減,所以需要找到更短的后綴,于是就到f(s)處繼續(xù),如果仍然找不到,則轉到f(f(s))處,形成狀態(tài)的遞歸轉移。構造中需要遍歷之前結點的所有孩子,所以需采用廣度優(yōu)先遍歷,偽代碼如下:

   

    具體的構造如下:

   

  2.構造Trie樹

    具體實現(xiàn)當然需要用到樹形結構了,顯然采用靜態(tài)鏈表應該是最適合的,因為樹構造完就不需要改變,而且當模式串比較多的時候可以減少內存碎片。

    每一個結點有5個域:接受字符,下一個兄弟結點,第一個孩子結點,失效函數(shù)值,結點狀態(tài)。

但是有一種特殊情況,如上面的第二個圖,在進行匹配時,hers是永遠不會被匹配,因為he總是先于hers被匹配。這里就不考慮在內點狀態(tài)結束,這個問題暫時無法解決。于是可以做個特殊處理,只使用4個域,因為此時匹配成功后狀態(tài)就到了葉子結點,葉子結點不存在孩子域,這個域被浪費了,這里就可以借用一下,比如此域值為x,當x<0時,使用x xor 0x80000000表示識別到的模式串編號。

    另一個棘手的問題是結點個數(shù)問題,這個數(shù)組到底多大?如何確定?

    可以使用分值算法計算,先把模式串按字典順序排好序,設想n個排好序的模式串第i位排在一起,相同字符的組成一組,如AiBi…Xi,再把每組下一個字符,也就是第i+1位排在一起,相同字符的組成一組,如A’iB’I…X’i,以此遞歸運算。偽代碼如下:

    

  3.缺點

    水平有限,程序缺點很多,很多問題都沒有解決。

    1.如果存在兩個模式串,一個是另一個的子串,那么后者將無法被匹配。

    2.無法處理動態(tài)決定大小寫敏感性

    3.不夠完整,只能向后匹配



夜風 2009-12-06 22:51 發(fā)表評論
]]>
青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            欧美激情一区二区久久久| 亚洲一区观看| 久久综合福利| 在线成人小视频| 欧美国产日韩在线观看| 欧美高清一区| 亚洲欧美不卡| 羞羞漫画18久久大片| 一色屋精品视频在线看| 欧美黄网免费在线观看| 欧美日韩激情小视频| 亚洲一区二区三区四区五区午夜| 制服丝袜激情欧洲亚洲| 国产人成精品一区二区三| 久久嫩草精品久久久久| 女同一区二区| 亚洲影视九九影院在线观看| 午夜电影亚洲| 亚洲免费观看在线观看| 亚洲无限av看| 亚洲激情视频| 亚洲欧洲99久久| 91久久精品一区| 亚洲永久在线| 亚洲精品免费观看| 午夜精品久久久久久| 亚洲欧洲综合另类| 午夜精品成人在线视频| 欧美高清视频在线播放| 欧美一区二区高清| 欧美精品v日韩精品v国产精品 | 欧美电影在线播放| 亚洲欧美在线aaa| 男同欧美伦乱| 欧美在线一级va免费观看| 欧美成人有码| 久久色中文字幕| 国产精品久久久久久亚洲毛片| 欧美 日韩 国产 一区| 国产精品入口夜色视频大尺度 | 久久影院午夜论| 国产精品福利网| 亚洲福利电影| 国产精品美女一区二区| 亚洲精品中文字幕女同| 亚洲国产专区| 久久久久久999| 久久精视频免费在线久久完整在线看| 欧美精品日日鲁夜夜添| 免费成人在线视频网站| 国产亚洲欧美日韩日本| 亚洲尤物精选| 西瓜成人精品人成网站| 欧美日韩一区二区三区在线| 亚洲承认在线| 亚洲第一中文字幕在线观看| 午夜一级久久| 欧美主播一区二区三区| 国产精品久久久久77777| 亚洲毛片一区二区| 亚洲免费观看| 欧美日韩国产小视频| 亚洲国产日韩欧美一区二区三区| 在线不卡中文字幕| 久久永久免费| 欧美二区视频| 亚洲精品婷婷| 欧美日韩国产亚洲一区| 一本不卡影院| 午夜激情一区| 国产欧美日韩在线视频| 欧美亚洲视频在线观看| 久久久天天操| 在线观看日韩av电影| 久久蜜桃香蕉精品一区二区三区| 麻豆国产精品va在线观看不卡| 韩国一区电影| 久久久精品国产一区二区三区| 蜜乳av另类精品一区二区| 亚洲第一区在线| 欧美精品久久99| 在线一区二区三区四区| 欧美资源在线| 在线日韩av片| 欧美精品三级| 亚洲欧美日韩精品在线| 美日韩精品免费观看视频| 亚洲欧洲一区二区三区| 欧美偷拍一区二区| 久久精品国产一区二区电影| 欧美电影在线观看| 欧美日韩免费视频| 欧美大胆成人| 夜夜爽av福利精品导航| 国产精品久线观看视频| 欧美综合激情网| 亚洲精品一区久久久久久| 欧美一区二区三区日韩| 亚洲国产精品久久| 国产精品美女久久久久aⅴ国产馆| 欧美一区二区三区四区在线观看| 欧美激情一区二区三区在线视频观看 | 亚洲自拍另类| 伊人久久亚洲热| 欧美日韩一区二区免费视频| 午夜精品视频在线观看一区二区| 欧美成人综合| 欧美在线视频观看| 一本久道综合久久精品| 国产综合色精品一区二区三区| 欧美激情亚洲一区| 久久久久9999亚洲精品| 日韩亚洲国产欧美| 欧美成人日韩| 久久久91精品国产| 亚洲视频在线观看免费| 亚洲二区在线| 国产一区二区三区丝袜| 国产精品成人一区二区艾草| 美女脱光内衣内裤视频久久网站| 亚洲免费视频网站| 99国内精品久久| 亚洲国产成人午夜在线一区| 久久久999国产| 亚洲欧美www| 一本色道久久综合亚洲精品不| 影音先锋久久| 国内精品久久久久影院优| 欧美日韩在线大尺度| 欧美国产精品| 欧美aⅴ99久久黑人专区| 久久久久久久综合日本| 欧美一区中文字幕| 欧美一级欧美一级在线播放| 亚洲一二三区精品| 亚洲视频在线观看视频| a4yy欧美一区二区三区| 亚洲精品久久久久久久久久久久 | 亚洲老司机av| 亚洲精品久久久久中文字幕欢迎你 | 亚洲欧美另类在线观看| 一区二区三区久久| 一区二区三区成人| 99视频一区| 中文亚洲字幕| 亚洲视频在线看| 亚洲尤物在线视频观看| 亚洲私拍自拍| 午夜亚洲性色福利视频| 午夜精品久久| 久久精品欧美| 蜜桃av一区二区| 亚洲国产一区二区精品专区| 在线精品视频免费观看| 欧美日韩精品一区二区三区四区| 欧美激情综合色综合啪啪| 欧美日韩精品久久久| 欧美日韩亚洲综合| 国产九九精品视频| 国产有码一区二区| 亚洲国产美女精品久久久久∴| 91久久国产综合久久| 亚洲午夜羞羞片| 欧美在线综合视频| 欧美大香线蕉线伊人久久国产精品| 欧美激情亚洲另类| 日韩系列欧美系列| 性欧美18~19sex高清播放| 久久国产福利| 欧美激情一区二区三区在线视频观看| 欧美日韩激情网| 国产在线欧美日韩| 日韩亚洲欧美综合| 香蕉免费一区二区三区在线观看| 久久久免费观看视频| 亚洲破处大片| 欧美在线视频免费播放| 欧美bbbxxxxx| 国产日韩欧美亚洲一区| 亚洲精品色婷婷福利天堂| 亚洲一区国产视频| 麻豆九一精品爱看视频在线观看免费 | 亚洲国产精品成人综合色在线婷婷 | 免费的成人av| 国产精品夜色7777狼人| 亚洲第一中文字幕| 欧美一区二区三区在线观看| 欧美国产三级| 欧美中文日韩| 欧美午夜精品久久久久久人妖| 在线成人www免费观看视频| 亚洲一区二区三区免费在线观看 | 久久婷婷综合激情| av成人老司机| 欧美fxxxxxx另类| 国产亚洲一区二区精品| 亚洲一区二区在线| 亚洲国产成人不卡| 久久免费99精品久久久久久| 国产精品国产亚洲精品看不卡15|