亚洲桃色在线一区,尤物九九久久国产精品的分类,国内视频一区

最長(zhǎng)重復(fù)子串

Posted on 2012-12-05 17:58 hoshelly 閱讀(1155) 評(píng)論(0) 編輯收藏引用所屬分類: Programming

描述

對(duì)于一個(gè)字符串S1，其中S2是他的一個(gè)子串（長(zhǎng)度嚴(yán)格小于S1長(zhǎng)度），如果S2在S1中出現(xiàn)次數(shù)超過(guò)1次，那么S2就是一個(gè)重復(fù)子串，現(xiàn)在的要求是給定S1，請(qǐng)求出他的最長(zhǎng)重復(fù)子串；

如果有多個(gè)長(zhǎng)度一樣的最長(zhǎng)子串，請(qǐng)輸入字典序最小那個(gè)串；

比如bbbaaaccc

那么最長(zhǎng)子串就是aa

輸入

第一行包含一個(gè)整數(shù)T，表示有T組數(shù)據(jù)

對(duì)于每組數(shù)據(jù)包含一行，該行有一個(gè)字符串，長(zhǎng)度小于10,000

輸出

對(duì)于每組數(shù)據(jù)請(qǐng)輸出他的最長(zhǎng)重復(fù)子串，保證每組數(shù)據(jù)都有；

樣例輸入

abacabac

abacabbac

樣例輸出

abac

bac

代碼測(cè)試通過(guò)（普通版）：

#include<stdio.h>
#include<string.h>
#define N 10000
int main()
{
    char a[N];
    int i,j,n,t,p,max,t1;
    scanf("%d",&t1);
    while(t1--)
    {
    max = 0;
    scanf("%s",a);
    n=strlen(a);
    for(i=0;i<n;i++)
    {
        for(j=i+1;j<n;j++)
        {
            t=0;
            while(a[i+t]==a[j+t]&&(j+t)<n)
                t++;
            if(t>max)
            {
                max=t;
                p=i;
            }
            else if(t == max) //如果有長(zhǎng)度一樣的最長(zhǎng)重復(fù)子串，那么比較它們的字典序
            {
                if(a[i]<a[p])
                {
                    max = t;
                    p = i;
                }
            }
        }
    }
    for(i=p;i<p+max;i++)
        printf("%c",a[i]);
    printf("\n");
    }
    return 0;
}

普通算法效率較低，為O(n²）。

第二種方法是用后綴數(shù)組實(shí)現(xiàn)。轉(zhuǎn)自：http://hi.baidu.com/qwertlooker/item/44f3fe52ad772cdbd58bacfd

如果程序至多可以處理MAXN個(gè)字符，這些字符被存儲(chǔ)在數(shù)組c中：

#define MAXN 5000000
char c[MAXN], *a[MAXN];

在讀取輸入時(shí)，首先初始化a,這樣，每個(gè)元素就都指向輸入字符串中的相應(yīng)字符：

while (ch = getchar()) != EOF
a[n] = &c[n];
c[n++] = ch;
c[n] = 0 //將數(shù)組c中的最后一個(gè)元素設(shè)為空字符，以終止所有字符串

這樣，元素a[0]指向整個(gè)字符串，下一個(gè)元素指向以第二個(gè)字符開始的數(shù)組的后綴，等等。如若輸入字符串為"banana",該數(shù)組將表示這些后綴：
a[0]:banana

a[1]:anana

a[2]:nana

a[3]:ana

a[4]:na

a[5]:a

由于數(shù)組a中的指針分別指向字符串中的每個(gè)后綴，所以將數(shù)組a命名為"后綴數(shù)組"

第二，對(duì)后綴數(shù)組進(jìn)行快速排序，以將后綴相近的（變位詞）子串集中在一起

qsort(a, n, sizeof(char*), pstrcmp)后

a[0]:a

a[1]:ana

a[2]:anana

a[3]:banana

a[4]:na

a[5]:nana

第三，使用以下comlen函數(shù)對(duì)數(shù)組進(jìn)行掃描比較鄰接元素，以找出最長(zhǎng)重復(fù)的字符串：

for i = [0, n)
     if comlen(a[i], a[i+1]) > maxlen
         maxlen = comlen(a[i], a[i+1])
         maxi = i
printf("%.*s\n", maxlen, a[maxi])

由于少了內(nèi)層循環(huán)，只是多了一次排序，因此該算法的運(yùn)行時(shí)間為O(n logn). （nlogn比n大，取nlogn）

實(shí)現(xiàn)代碼如下：

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

#define MAXCHAR 10000 //最長(zhǎng)處理10000個(gè)字符

char c[MAXCHAR], *a[MAXCHAR];

int comlen( char *p, char *q ){  //計(jì)算最長(zhǎng)重復(fù)子串的長(zhǎng)度
    int i = 0;
    while( *p && (*p++ == *q++) )
        ++i;
    return i;
}

int pstrcmp( const void *p1, const void *p2 ){
    return strcmp( *(char* const *)p1, *(char* const*)p2 );
}

int main( ){
    int t;
    char ch;
    int i, temp;
    scanf("%d\n",&t);
    while(t--)
    {
        int n=0;
        int maxlen=0, maxi=0;

      while( (ch=getchar())!='\n' ){
        a[n]=&c[n];
        c[n++]=ch;
    }
    c[n]='\0';
    qsort( a, n, sizeof(char*), pstrcmp ); //快速排序?qū)缶Y數(shù)組進(jìn)行排序，以使后綴相同的子串集中在一起，
                                           //以便接下來(lái)comlen函數(shù)對(duì)這些子串進(jìn)行計(jì)算其最長(zhǎng)重復(fù)子串
    for(i=0; i<n-1; ++i ){
        temp=comlen( a[i], a[i+1] );
        if( temp>maxlen )
        {
            maxlen=temp;
            maxi=i;
        }
    }
    printf("%.*s\n",maxlen, a[maxi]); //輸出最長(zhǎng)重復(fù)子串
    }
    return 0;
}

第三種方法似乎可以用后綴樹實(shí)現(xiàn)，效率可以提高到O(n)，具體的后綴樹講解可以參照這篇文章：
http://blog.csdn.net/v_july_v/article/details/6897097（PS:智商有限，后面部分講解理解不了）

只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。
【推薦】100%開源！大型工業(yè)跨平臺(tái)軟件C++源碼提供，建模，組態(tài)！

相關(guān)文章: 動(dòng)態(tài)規(guī)劃解決最長(zhǎng)公共子串問題最長(zhǎng)重復(fù)子串二叉樹之?dāng)?shù)組存儲(chǔ) 簡(jiǎn)單表達(dá)式求值找出中間數(shù)（C++快排函數(shù)使用）計(jì)數(shù)問題找出回文素?cái)?shù) 括號(hào)匹配數(shù)制轉(zhuǎn)換填充二維數(shù)組

網(wǎng)站導(dǎo)航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

天之道

最長(zhǎng)重復(fù)子串

日歷

常用鏈接

留言簿(2)

隨筆分類

隨筆檔案

搜索

最新評(píng)論

閱讀排行榜

評(píng)論排行榜