• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            那誰的技術(shù)博客

            感興趣領(lǐng)域:高性能服務(wù)器編程,存儲,算法,Linux內(nèi)核
            隨筆 - 210, 文章 - 0, 評論 - 1183, 引用 - 0
            數(shù)據(jù)加載中……

            KMP算法的實現(xiàn)

            KMP算法是一種用于字符串匹配的算法,這個算法的高效之處在于當(dāng)在某個位置匹配不成功的時候可以根據(jù)之前的匹配結(jié)果從模式字符串的另一個位置開始,而不必從頭開始匹配字符串.
            因此這個算法的關(guān)鍵在于,當(dāng)某個位置的匹配不成功的時候,應(yīng)該從模式字符串的哪一個位置開始新的比較.假設(shè)這個值存放在一個next數(shù)組中,其中next數(shù)組中的元素滿足這個條件:next[j] = k,表示的是當(dāng)模式字符串中的第j + 1個(這里是遵守標準C語言中數(shù)組元素從0開始的約定,以下不再說明)發(fā)生匹配不成功的情況時,應(yīng)該從模式字符串的第k + 1個字符開始新的匹配.如果已經(jīng)得到了模式字符串的next數(shù)組,那么KMP算法的實現(xiàn)如下:

            //?KMP字符串模式匹配算法
            //?輸入:?S是主串,T是模式串,pos是S中的起始位置
            //?輸出:?如果匹配成功返回起始位置,否則返回-1
            int?KMP(PString?S,?PString?T,?int?pos)
            {
            ????assert(NULL?
            !=?S);
            ????assert(NULL?
            !=?T);
            ????assert(pos?
            >=?0);
            ????assert(pos?
            <?S->length);
            ????
            ????
            if?(S->length?<?T->length)
            ????????
            return?-1;

            ????printf(
            "主串\t?=?%s\n",?S->str);
            ????printf(
            "模式串\t?=?%s\n",?T->str);

            ????
            int?*next?=?(int?*)malloc(T->length?*?sizeof(int));
            ????
            //?得到模式串的next數(shù)組
            ????GetNextArray(T,?next);

            ????
            int?i,?j;
            ????
            for?(i?=?pos,?j?=?0;?i?<?S->length?&&?j?<?T->length;?)
            ????
            {
            ????????
            //?i是主串游標,j是模式串游標
            ????????if?(-1?==?j?||????????????????//?模式串游標已經(jīng)回退到第一個位置
            ????????????S->str[i]?==?T->str[j])?//?當(dāng)前字符匹配成功
            ????????{
            ????????????
            //?滿足以上兩種情況時兩個游標都要向前進一步
            ????????????++i;
            ????????????
            ++j;
            ????????}

            ????????
            else????????????????????????//??匹配不成功,模式串游標回退到當(dāng)前字符的next值
            ????????{
            ????????????j?
            =?next[j];
            ????????}

            ????}


            ????free(next);

            ????
            if?(j?>=?T->length)
            ????
            {
            ????????
            //?匹配成功
            ????????return?i?-?T->length;
            ????}

            ????
            else
            ????
            {
            ????????
            //?匹配不成功
            ????????return?-1;
            ????}

            }


            下面看看如何得到next數(shù)組.
            這是一個遞推求解的過程,初始的情況是next[0] = -1.
            假設(shè)在某一個時刻有如下的等式成立:str[0...k-1] = str[j - k...j - 1],那么next[j] = k,在這個前提下,繼續(xù)進行下一個字符的匹配.
            1)如果str[0...k] = str[j - k...j],那么next[j + 1] = next[j] + 1 = k + 1.
            2)反之,如果上面的匹配不成立,那么就要從next[k]開始進行新的匹配,如果成功的話,那么:
            next[j + 1] = next[next[j]] + 1 = next[k] + 1;
            如果還是不能匹配成功就再從next[next[k]]的位置開始進行的新的匹配,直到匹配成功為止.如果這個過程一直進行下去都沒有找到可以成功匹配的字符的話,那么next[j + 1] = 0,這時表示要從字符串的第一個位置開始新的匹配了.
            用一個公式表示上述的算法,那么可以寫作:
            next[j] =
            1)-1,當(dāng)j = 0時;
            2) Max{k | 0 <= k < j && str[0..k - 1] = str[j - k...j - 1]};
            3)0,其他情況,此時匹配要從第一個位置重新開始.
            尋找next數(shù)組的算法如下:

            // ?得到字符串的next數(shù)組
            void ?GetNextArray(PString?pstr,? int ?next[])
            {
            ????assert(NULL?
            != ?pstr);?
            ????assert(NULL?
            != ?next);
            ????assert(pstr
            -> length? > ? 0 );

            ????
            // ?第一個字符的next值是-1,因為C中的數(shù)組是從0開始的
            ????next[ 0 ]? = ? - 1 ;
            ????
            for ?( int ?i? = ? 0 ,?j? = ? - 1 ;?i? < ?pstr -> length? - ? 1 ;?)
            ????
            {
            ????????
            // ?i是主串的游標,j是模式串的游標
            ????????
            // ?這里的主串和模式串都是同一個字符串
            ???????? if ?( - 1 ? == ?j? || ???????????????????????? // ?如果模式串游標已經(jīng)回退到第一個字符
            ????????????pstr -> str[i]? == ?pstr -> str[j])???? // ?如果匹配成功
            ???????? {
            ????????????
            // ?兩個游標都向前走一步
            ???????????? ++ i;
            ????????????
            ++ j;
            ????????????
            // ?存放當(dāng)前的next值為此時模式串的游標值
            ????????????next[i]? = ?j;
            ????????}

            ????????
            else ???????????????????????????????? // ?匹配不成功j就回退到上一個next值
            ???????? {
            ????????????j?
            = ?next[j];
            ????????}

            ????}

            }



            完整的算法如下:
            /* *******************************************************************
            ????created:????2006/07/02
            ????filename:?????KMP.cpp
            ????author:????????李創(chuàng)
            ????????????????
            http://www.shnenglu.com/converse/
            ????????????????
            ????????????????參考資料:?嚴蔚敏<<數(shù)據(jù)結(jié)構(gòu)>>

            ????purpose:????KMP字符串匹配算法的演示
            ********************************************************************
            */


            #include?
            < stdio.h >
            #include?
            < stdlib.h >
            #include?
            < assert.h >
            #include?
            < string .h >

            #define ?MAX_LEN_OF_STR????30???????????? // ?字符串的最大長度

            typedef?
            struct ?String???????????????? // ?這里需要的字符串?dāng)?shù)組,存放字符串及其長度
            {
            ????
            char ????str[MAX_LEN_OF_STR];???? // ?字符數(shù)組
            ???? int ????????length;???????????????????? // ?字符串的實際長度
            }
            String,? * PString;

            // ?得到字符串的next數(shù)組
            void ?GetNextArray(PString?pstr,? int ?next[])
            {
            ????assert(NULL?
            != ?pstr);?
            ????assert(NULL?
            != ?next);
            ????assert(pstr
            -> length? > ? 0 );

            ????
            // ?第一個字符的next值是-1,因為C中的數(shù)組是從0開始的
            ????next[ 0 ]? = ? - 1 ;
            ????
            for ?( int ?i? = ? 0 ,?j? = ? - 1 ;?i? < ?pstr -> length? - ? 1 ;?)
            ????
            {
            ????????
            // ?i是主串的游標,j是模式串的游標
            ????????
            // ?這里的主串和模式串都是同一個字符串
            ???????? if ?( - 1 ? == ?j? || ???????????????????????? // ?如果模式串游標已經(jīng)回退到第一個字符
            ????????????pstr -> str[i]? == ?pstr -> str[j])???? // ?如果匹配成功
            ???????? {
            ????????????
            // ?兩個游標都向前走一步
            ???????????? ++ i;
            ????????????
            ++ j;
            ????????????
            // ?存放當(dāng)前的next值為此時模式串的游標值
            ????????????next[i]? = ?j;
            ????????}

            ????????
            else ???????????????????????????????? // ?匹配不成功j就回退到上一個next值
            ???????? {
            ????????????j?
            = ?next[j];
            ????????}

            ????}

            }


            // ?KMP字符串模式匹配算法
            // ?輸入:?S是主串,T是模式串,pos是S中的起始位置
            // ?輸出:?如果匹配成功返回起始位置,否則返回-1
            int ?KMP(PString?S,?PString?T,? int ?pos)
            {
            ????assert(NULL?
            != ?S);
            ????assert(NULL?
            != ?T);
            ????assert(pos?
            >= ? 0 );
            ????assert(pos?
            < ?S -> length);
            ????
            ????
            if ?(S -> length? < ?T -> length)
            ????????
            return ? - 1 ;

            ????printf(
            " 主串\t?=?%s\n " ,?S -> str);
            ????printf(
            " 模式串\t?=?%s\n " ,?T -> str);

            ????
            int ? * next? = ?( int ? * )malloc(T -> length? * ? sizeof ( int ));
            ????
            // ?得到模式串的next數(shù)組
            ????GetNextArray(T,?next);

            ????
            int ?i,?j;
            ????
            for ?(i? = ?pos,?j? = ? 0 ;?i? < ?S -> length? && ?j? < ?T -> length;?)
            ????
            {
            ????????
            // ?i是主串游標,j是模式串游標
            ???????? if ?( - 1 ? == ?j? || ???????????????? // ?模式串游標已經(jīng)回退到第一個位置
            ????????????S -> str[i]? == ?T -> str[j])? // ?當(dāng)前字符匹配成功
            ???????? {
            ????????????
            // ?滿足以上兩種情況時兩個游標都要向前進一步
            ???????????? ++ i;
            ????????????
            ++ j;
            ????????}

            ????????
            else ???????????????????????? // ??匹配不成功,模式串游標回退到當(dāng)前字符的next值
            ???????? {
            ????????????j?
            = ?next[j];
            ????????}

            ????}


            ????free(next);

            ????
            if ?(j? >= ?T -> length)
            ????
            {
            ????????
            // ?匹配成功
            ???????? return ?i? - ?T -> length;
            ????}

            ????
            else
            ????
            {
            ????????
            // ?匹配不成功
            ???????? return ? - 1 ;
            ????}

            }

            posted on 2006-07-05 17:44 那誰 閱讀(7361) 評論(8)  編輯 收藏 引用 所屬分類: 算法與數(shù)據(jù)結(jié)構(gòu)

            評論

            # re: KMP算法的實現(xiàn)  回復(fù)  更多評論   

            數(shù)據(jù)結(jié)構(gòu)課程上給過的算法.
            說實話,我一直不能從書上那簡單的描述中理解這個算法,直到現(xiàn)在仍然如此,慚愧.
            2006-07-05 18:13 | LOGOS

            # re: KMP算法的實現(xiàn)  回復(fù)  更多評論   

            沒關(guān)系,我也是花了好長時間才整明白的,自己實現(xiàn)一下估計就能清楚好多了~~
            2006-07-05 18:18 | 創(chuàng)系

            # re: KMP算法的實現(xiàn)  回復(fù)  更多評論   

            求next函數(shù)其實就是自己和自己比一次。。kmp最重要就是求next函數(shù)了。。畫畫圖模擬一下,應(yīng)該比較容易理解的:)
            2006-07-08 12:18 |

            # re: KMP算法的實現(xiàn)  回復(fù)  更多評論   

            收藏
            2006-12-08 15:12 | todaygood

            # re: KMP算法的實現(xiàn)  回復(fù)  更多評論   

            2011-10-07 19:16 | kol

            # re: KMP算法的實現(xiàn)  回復(fù)  更多評論   

            這個應(yīng)該有簡單的算法吧 ~~ 不用這么多的函數(shù) ~~
            2011-10-07 19:25 | kol

            # re: KMP算法的實現(xiàn)  回復(fù)  更多評論   

            算法貌似錯了
            計算
            bacbabababacaca
            ababaca 的時候
            前綴是
            -1 0 -1 0 -1 3 -1
            結(jié)果 next[-1] 越界了
            2012-04-26 12:01 | Davis

            # re: KMP算法的實現(xiàn)  回復(fù)  更多評論   

            哦,不好意思,看錯了
            2012-04-26 12:11 | Davis
            7777精品久久久大香线蕉 | 久久久久99精品成人片牛牛影视| 欧美综合天天夜夜久久| 国产农村妇女毛片精品久久| 久久久久久国产精品美女| 伊人色综合久久天天| 久久久久人妻一区二区三区| 99久久精品免费国产大片| 亚洲精品高清国产一线久久| 国产激情久久久久影院| 久久成人国产精品| | 最新久久免费视频| 一本大道加勒比久久综合| 一本色道久久HEZYO无码| 国产精品青草久久久久福利99| 精品综合久久久久久888蜜芽| 性做久久久久久久久| 久久精品国产99久久丝袜| 国产精品美女久久久久网| 午夜精品久久久久久久久| 亚洲欧洲精品成人久久奇米网| 99久久精品免费看国产免费| 久久天天躁狠狠躁夜夜avapp| 久久久久av无码免费网| 亚洲国产精品一区二区三区久久| 狠狠人妻久久久久久综合| 色综合久久最新中文字幕| 狠狠色丁香久久综合五月| 久久精品a亚洲国产v高清不卡| 无码人妻精品一区二区三区久久久| 少妇久久久久久被弄到高潮| 久久国产精品一区| 亚洲国产天堂久久久久久| 亚洲国产精品成人久久蜜臀| 亚洲精品NV久久久久久久久久| 久久久久免费视频| 亚洲国产精品成人久久蜜臀| 久久精品亚洲AV久久久无码| 国产A级毛片久久久精品毛片| 亚洲AV日韩AV永久无码久久|