• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            天之道

            享受編程的樂趣。
            posts - 118, comments - 7, trackbacks - 0, articles - 0
              C++博客 :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理

            最長重復子串

            Posted on 2012-12-05 17:58 hoshelly 閱讀(1140) 評論(0)  編輯 收藏 引用 所屬分類: Programming
            描述
            對于一個字符串S1,其中S2是他的一個子串(長度嚴格小于S1長度),如果S2在S1中出現次數超過1次,那么S2就是一個重復子串,現在的要求是給定S1,請求出他的最長重復子串;

            如果有多個長度一樣的最長子串,請輸入字典序最小那個串;

            比如bbbaaaccc

            那么最長子串就是aa

            輸入
            第一行包含一個整數T,表示有T組數據

            對于每組數據包含一行,該行有一個字符串,長度小于10,000

            輸出
            對于每組數據請輸出他的最長重復子串,保證每組數據都有;

            樣例輸入
            2
            abacabac
            abacabbac

            樣例輸出
            abac
            bac

            代碼測試通過(普通版):

            #include<stdio.h>
            #include<string.h>
            #define N 10000
            int main()
            {
                char a[N];
                int i,j,n,t,p,max,t1;
                scanf("%d",&t1);
                while(t1--)
                {
                max = 0;
                scanf("%s",a);
                n=strlen(a);
                for(i=0;i<n;i++)
                {
                    for(j=i+1;j<n;j++)
                    {
                        t=0;
                        while(a[i+t]==a[j+t]&&(j+t)<n)
                            t++;
                        if(t>max)
                        {
                            max=t;
                            p=i;
                        }
                        else if(t == max) //如果有長度一樣的最長重復子串,那么比較它們的字典序
                        {
                            if(a[i]<a[p])
                            {
                                max = t;
                                p = i;
                            }
                        }
                    }
                }
                for(i=p;i<p+max;i++)
                    printf("%c",a[i]);
                printf("\n");
                }
                return 0;
            }
            普通算法效率較低,為O(n²)。


            第二種方法是用后綴數組實現。轉自:http://hi.baidu.com/qwertlooker/item/44f3fe52ad772cdbd58bacfd

            如果程序至多可以處理MAXN個字符,這些字符被存儲在數組c中:
            #define MAXN 5000000
            char c[MAXN], *a[MAXN];
             在讀取輸入時,首先初始化a,這樣,每個元素就都指向輸入字符串中的相應字符:
            while (ch = getchar()) != EOF
            a[n] = &c[n];
            c[n++] = ch;
            c[n] = 0 //將數組c中的最后一個元素設為空字符,以終止所有字符串
            這樣,元素a[0]指向整個字符串,下一個元素指向以第二個字符開始的數組的后綴,等等。如若輸入字符串為"banana",該數組將表示這些后綴:
            a[0]:banana
            a[1]:anana
            a[2]:nana
            a[3]:ana
            a[4]:na
            a[5]:a
            由于數組a中的指針分別指向字符串中的每個后綴,所以將數組a命名為"后綴數組"
            第二,對后綴數組進行快速排序,以將后綴相近的(變位詞)子串集中在一起
            qsort(a, n, sizeof(char*), pstrcmp)后
            a[0]:a
            a[1]:ana
            a[2]:anana
            a[3]:banana
            a[4]:na
            a[5]:nana
            第三,使用以下comlen函數對數組進行掃描比較鄰接元素,以找出最長重復的字符串:
            for i = [0, n)
                 if comlen(a[i], a[i+1]) > maxlen
                     maxlen = comlen(a[i], a[i+1])
                     maxi = i
            printf("%.*s\n", maxlen, a[maxi])
            由于少了內層循環,只是多了一次排序,因此該算法的運行時間為O(n logn). (nlogn比n大,取nlogn)

            實現代碼如下:

            #include <stdio.h>
            #include <stdlib.h>
            #include <string.h>

            #define MAXCHAR 10000 //最長處理10000個字符

            char c[MAXCHAR], *a[MAXCHAR];

            int comlen( char *p, char *q ){  //計算最長重復子串的長度
                int i = 0;
                while( *p && (*p++ == *q++) )
                    ++i;
                return i;
            }

            int pstrcmp( const void *p1, const void *p2 ){
                return strcmp( *(charconst *)p1, *(charconst*)p2 );
            }

            int main( ){
                int t;
                char ch;
                int i, temp;
                scanf("%d\n",&t);
                while(t--)
                {   
                    int n=0;
                    int maxlen=0, maxi=0;

                  while( (ch=getchar())!='\n' ){
                    a[n]=&c[n];
                    c[n++]=ch;
                }
                c[n]='\0';
                qsort( a, n, sizeof(char*), pstrcmp ); //快速排序對后綴數組進行排序,以使后綴相同的子串集中在一起,
                                                       
            //以便接下來comlen函數對這些子串進行計算其最長重復子串
                for(i=0; i<n-1; ++i ){
                    temp=comlen( a[i], a[i+1] );
                    if( temp>maxlen )
                    {
                        maxlen=temp;
                        maxi=i;
                    }
                }
                printf("%.*s\n",maxlen, a[maxi]); //輸出最長重復子串
                }
                return 0;
            }

            第三種方法似乎可以用后綴樹實現,效率可以提高到O(n),具體的后綴樹講解可以參照這篇文章:
            http://blog.csdn.net/v_july_v/article/details/6897097(PS:智商有限,后面部分講解理解不了)
            性欧美丰满熟妇XXXX性久久久| 国产精品内射久久久久欢欢| 一本色综合网久久| 久久综合久久自在自线精品自| 国内精品久久九九国产精品| 久久午夜福利电影| 久久精品午夜一区二区福利| 久久九九免费高清视频| 久久精品国产亚洲av水果派| 久久精品国产亚洲AV不卡| 久久久av波多野一区二区| 久久久亚洲精品蜜桃臀| 久久九九精品99国产精品| 久久笫一福利免费导航 | 中文精品99久久国产| 91精品国产色综合久久| 久久精品一区二区三区AV| 久久国产精品久久久| 国产亚洲精品自在久久| 国产毛片欧美毛片久久久| 久久九九久精品国产| 亚洲国产精品久久久久久| 久久久久久九九99精品| 无码日韩人妻精品久久蜜桃| 日韩十八禁一区二区久久| 久久亚洲欧美日本精品| 久久青青草原亚洲av无码app| 久久精品国产99国产精品亚洲| 久久影视综合亚洲| 欧美久久综合九色综合| 久久久精品国产亚洲成人满18免费网站| 午夜天堂精品久久久久| 亚洲AV无码久久| 无码专区久久综合久中文字幕| 久久精品国产99国产精品导航| 亚洲中文字幕伊人久久无码 | 亚洲国产精品无码久久SM| 久久SE精品一区二区| 亚洲精品乱码久久久久66| 亚洲狠狠婷婷综合久久蜜芽| 一本一本久久a久久综合精品蜜桃|