隨筆-38 評論-23 文章-0 trackbacks-0

使用后綴數(shù)組解決zoj 3199 Longest Repeated Substring

/*初看這題以為是傳統(tǒng)意義上的最長重復(fù)子串.其實(shí)不然,看例子就明白*/

接觸這題后才開始看Suffix_array的資料.一篇論文,里面談到如何使用O(nlogn)的方法構(gòu)造后綴數(shù)組SA.并且用0(nlongn)的方法構(gòu)造height數(shù)組. 點(diǎn)擊下載后綴數(shù)組論文
以下代碼寫的有點(diǎn)粗糙..排序上其實(shí)可以優(yōu)化很多.我只使用sort()進(jìn)行排序慚愧.....

#include<iostream>

#include<string>

#include<algorithm>

using namespace std;

#define N 200000

int sa[N];

int rank[N];

int lrank[N],h[N],height[N];

int k;

char str[50005];

bool cmpchar(const int& a,const int& b)

{

return str[a]<str[b];

}

bool cmprank(const int&a ,const int&b)

{

return rank[a]<rank[b]||(rank[a]==rank[b]&&rank[a+k]<rank[b+k]);

}

bool equ(const int& a,const int& b)

{

return lrank[a]==lrank[b]&&lrank[a+k]==lrank[b+k];

}

void createSA(int len)

{

int i=0;

for(i=0;i<len;i++)

sa[i]=i;

sort(sa,sa+len,cmpchar);

//SA(1) 每個后綴的首字母有關(guān)。這里其實(shí)可以采用計(jì)數(shù)排序

//rank(1) 根據(jù)SA(1)求得的排名數(shù)組

for(rank[sa[0]]=0,i=1;i<len;i++)

{

rank[sa[i]]=rank[sa[i-1]];

if(str[sa[i]]!=str[sa[i-1]])

rank[sa[i]]++;

}

//在SA(1)基礎(chǔ)上擴(kuò)展到SA(2^k) ->(2^k>=len)

for(k=1;k<len;k*=2)

{

//根據(jù)Rank(k)數(shù)組求SA(2k)

//Suffix(i)<=(2k)Suffix(j) 等價于Rank(i)<(k)Rank(j)||Rank(i)==(k)Rank(j)&&Rank(i)<(i+k)Rank(j+k)

sort(sa,sa+len,cmprank);

for(i=0;i<len;i++)

lrank[i]=rank[i];

//根據(jù)SA(2k) 求Rank(2k)

for(rank[sa[0]]=0,i=1;i<len;i++)

{

rank[sa[i]]=rank[sa[i-1]];

if(!equ(sa[i],sa[i-1]))

rank[sa[i]]++;

}

void gethei(int len)

{

int i=0,d=0,j,s;

memset(h,0,sizeof(h));

//height[i]=LCP(i-1,i)

for(i=0;i<len;i++)

{

if(rank[i]==0)

{

h[rank[i]]=0;

continue;

}

j=rank[i]-1;

d=rank[i];

//Suffix(Rank[i])與Suffix(Rank[i-1]比較相等的字符個數(shù)

// i==0或者h(yuǎn)[i-1]<=1則從頭開始比較兩個后綴

//否則的話表示已經(jīng)有前h[i-1]-1個字符相等繼續(xù)比較后面相等字符的個數(shù)

if(i==0||h[i-1]<=1)

s=0;

else

s=h[i-1]-1;

for(;sa[d]+s<len&&sa[j]+s<len;s++)

if(str[sa[d]+s]!=str[sa[j]+s]) break;

h[i]=s;

//其實(shí)可以根據(jù)height[rank[i]]=h[i]求height[]這樣可以省去h[]數(shù)組空間

}

//heigth[i]=h[sa[i]]

for(i=0;i<len;i++)

height[i]=h[sa[i]];

}

int main()

{

int t;

cin>>t;

getchar();

while(t--)

{

gets(str);

int len=strlen(str);

str[len++]='$';

str[len]=0;

createSA(len);

gethei(len);

int maxid=height[0];

for(int i=1;i<len;i++)

{

int l1=sa[i],l2=sa[i-1];

//因?yàn)閔eight[i]表示LCP(i-1,i)

//而題目要求得連續(xù)重復(fù)的,則只要具有最長公共前綴是連續(xù)的

//Suffix(SA[l1])和Suffix(SA[l2])的最長公共前綴是連續(xù) 即l1+heigt[i]==l2

if(l1>l2)

swap(l1,l2);

if(l1+height[i]==l2&&height[i]>maxid)

maxid=height[i];

}

cout<<maxid<<endl;

}

return 0;

}

因?yàn)閦oj數(shù)據(jù)弱了其實(shí)以上代碼不能過評論的那組數(shù)據(jù)。是我考慮欠缺了..現(xiàn)修改main函數(shù)通過枚舉結(jié)果值來計(jì)算。不過感覺太耗時間了可否有更好的方法？修改main函數(shù)代碼如下：

bool check(int k,int len)

{

int i,j,a,b;

for(i=0;i<len;i++)

{

if(height[i]>=k) //枚舉大于等于k的區(qū)間里只要存在連續(xù)段就是結(jié)果.

{

a=sa[i-1];

for(j=i;j<len&&height[j]>=k;j++)

{

b=sa[j];

if(a+height[j]==b||b+height[j]==a)

return true;

}

return false;

}

int main()

{

int t;

cin>>t;

getchar();

while(t--)

{

gets(str);

int len=strlen(str);

str[len++]='$';

str[len]=0;

createSA(len);

gethei(len);

int maxid;

//這樣枚舉太耗時間了。不知可有更好的方法？

for(maxid=len/2;maxid>=0;maxid--)

{

if(check(maxid,len))

break;

}

cout<<maxid<<endl;

}

return 0;

}

posted on 2009-05-09 11:22 米游閱讀(1725) 評論(5) 編輯收藏引用所屬分類: ACM

評論:

# re: 使用后綴數(shù)組解決zoj 3199 Longest Repeated Substring 2009-05-12 14:19 | [NKU]Angel

void gethei(int len)
{
int i=0,d=0,j,s;
memset(h,0,sizeof(h));
//height[i]=LCP(i-1,i)
for(i=0;i<len;i++)
{
if(rank[i]==0)
{
h[rank[i]]=0;//←這個地方應(yīng)該是h[i]=0吧。。
continue;
}
j=rank[i]-1;
d=rank[i];
//Suffix(Rank[i])與Suffix(Rank[i-1]比較相等的字符個數(shù)
// i==0或者h(yuǎn)[i-1]<=1則從頭開始比較兩個后綴
//否則的話表示已經(jīng)有前h[i-1]-1個字符相等繼續(xù)比較后面相等字符的個數(shù)
if(i==0||h[i-1]<=1)
s=0;
else
s=h[i-1]-1;
for(;sa[d]+s<len&&sa[j]+s<len;s++)
if(str[sa[d]+s]!=str[sa[j]+s]) break;
h[i]=s;
//其實(shí)可以根據(jù)height[rank[i]]=h[i]求height[]這樣可以省去h[]數(shù)組空間
}
//heigth[i]=h[sa[i]]
for(i=0;i<len;i++)
height[i]=h[sa[i]];

}
回復(fù) 更多評論

# re: 使用后綴數(shù)組解決zoj 3199 Longest Repeated Substring 2009-05-13 10:39 | 米游

@[NKU]Angel
謝謝指點(diǎn)..的確是那樣的.. 回復(fù) 更多評論

# re: 使用后綴數(shù)組解決zoj 3199 Longest Repeated Substring 2009-05-13 10:40 | 米游

謝謝指點(diǎn)..的確是那樣的..@[NKU]Angel
回復(fù) 更多評論

# re: 使用后綴數(shù)組解決zoj 3199 Longest Repeated Substring 2009-05-16 01:36 | scut_solar

在網(wǎng)上找了該題的題解，發(fā)現(xiàn)很多人用的都是和你一樣的解法，但是最后我發(fā)現(xiàn)這種結(jié)果有問題
例如：defgdefgzdefge
答案應(yīng)該是4吧，但是用這種方法解的答案是0 回復(fù) 更多評論

# re: 使用后綴數(shù)組解決zoj 3199 Longest Repeated Substring 2009-05-16 14:57 | 米游

@scut_solar
求解那里出了問題..需要枚舉了應(yīng)該回復(fù) 更多評論

刷新評論列表

只有注冊用戶登錄后才能發(fā)表評論。


相關(guān)文章: 有道難題... zoj 3211 Dream City 09.5.23 退役感言 RMQ ST算法 (區(qū)間最大(最小)值問題) 使用后綴數(shù)組解決zoj 3199 Longest Repeated Substring 線段樹求矩形覆蓋的周長 pku 1177 hdu 2816 即老菜鳥杯的1008題目 hdu 2813 即老菜鳥杯 1005題 hdu 2812 即老菜鳥杯 1004 hdu 2811 即老菜鳥杯 1003

網(wǎng)站導(dǎo)航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

<

2025年11月

>

日

一

二

三

四

五

六

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

1

2

3

4

5

6

常用鏈接

留言簿(1)

隨筆分類

隨筆檔案

ACM大牛

計(jì)算機(jī)圖形學(xué)

NEHE OPENGL
OpenGL
OPENGL部分資料
OSG
虛擬現(xiàn)實(shí)中國社區(qū)

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

常用鏈接

留言簿(1)

隨筆分類

隨筆檔案

ACM大牛

計(jì)算機(jī)圖形學(xué)

搜索

最新評論

閱讀排行榜

評論排行榜