欧美午夜精品久久久久久超碰,欧美在线一级va免费观看,尤物yw午夜国产精品视频明星

Mato_No1 — Wed, 18 Apr 2012 12:26:00 GMT

相关链接
今天在回��以前的题目的时候，�U�然发现COCI 2011�?012 #5的后两题�q��犇题（臛_��一般�h可以捉的�Q?#8230;…是我当时惛_��掉了�?#8230;…

blokovi�Q?br />首先很容易发现最优方案必然是从顶到底�Q�先��量往双��放，攑ֈ�某一个�{折点处再��量往左边�?#8230;…
然后��是枚�D�q�个转折点，��q��一下就行了�Q�暴力O(N²)的可以过7个点�Q�本沙茶现场赛时��是用这个的�Q?#8230;…
优化�Q�可以从上到下依�ơ枚举�{折点�Q�设目前的�{折点为i�Q�则在下一�ơ枚举时�Q?i+1)��{折点�Q�，�?i+1)往叛_�^�U?单位�Q�然后根据那个重心计��公式可以得出，�W?i+2)个及以后的必然是整体向右�q�移(2*m2)/(m1+m2)�Q�其中m1为前i个的质量和，m2为第(i+1)个的质量……在此基础上维护�{折点前重心位�|�、�{折点的重心的横坐标（相对于最上面的那个）以及最下面的那个的重心的横坐标�Q�相对于最上面的那个）��p��了（注意转折�Ҏ��W�一个或最后一个的�Ҏ��情况要单独处理）�Q�时间复杂度O(N)�?br />
poplocavanje�Q?br />其实�q�题只要用AC自动机随便�ؕ搞一下就行了……Trie上的每个�l�点�l�护一个KK�Q�表�C��l�点所代表的字�W�串的后�~�的最大匹配长度（当然前提条�g是该�l�点是危险的�Q�，则：�Q?�Q�若该结�Ҏ��来就代表一个待匚w��的子�Ԍ��则KK��gؓ子串长度�Q�（2�Q�若该结�Ҏ��通过��p�|指针上溯��C��个危险结点的�Q�则该结点的KK��是上溯到的那个危险�l�点的KK。然后做一�ơ匹配，��C��所有的匚w��区间�Q�再求出未被区间覆盖的总长度（排序+扫描卛_��Q�不需��M��数据�l�构�Q�就行了�?br />
注意几个易疵的地方：
�Q?�Q�Trie的大��要开�?M才能�q�（不过再大��p��MLE了囧……�Q�；
�Q?�Q�在��动机计算KK的时候，如果一个结�Ҏ��来就是危险的�Q�即上述�W?�U�结点）�Q�此�q�程中又发现它是上述�W?�U�结点，�?strong>�?/span>能重新计��KK�Q?br />�Q?�Q�最后求未被区间覆盖总长度的�Ҏ��Q�先��C��所有的区间�Q�按照先左端炚w��增序后右端炚w��增序排序，当中��L��被别的区间覆盖的区间�Q�然后先看一下排序后的第一个区间和最后一个区��_��得出�W�一个区间之前与最后一个区间之后的未被覆盖的部分，中间的扫描求解时�Q�如果某区间的左端点大于(前一区间的右端点+1)�Q�则计入中间的空�?#8230;…不过�q�有一�U�方法就是不��L��被别的覆盖的区间�Q�而是在扫描过�E�中�l�护右端�Ҏ��大值maxr�Q�然后把上面�Ҏ��中的所有右端点改�ؓmaxr卛_��?br />
代码�Q?br />blokovi poplocavanje

Mato_No1 2012-04-18 20:26 发表评论

Mato_No1 — Sun, 30 Oct 2011 03:22:00 GMT

有一�c�d��态规划（其中也包含递推�Q�问题，要求满��一些限制条件的字符�Ԍ��q�些限制条�g�?#8220;需要含有某个子�?#8221;�?#8220;不能含有某个子串”�Q�那么KMP、AC自动机等��有大用了�?br />
【例1�?a title="HDU3689" >HDU3689
题意�Q�字�W�集中有一些字�W�，�l�出每个字符的出现概率（它们的和保证�?�Q�，再给��Z��个子串B�Q�求�Q��Q�l�一个长度�ؓN的字�W�串A�Q�只能包含字�W�集中的字符�Q�，使得S是A的子串的概率�?br />
求解�q�类问题首先要进行补集�{化。因为子串可能有重叠�Q�比�?ababa"中就出现了两�?aba"�Q�，所以先转化�?#8220;求�Q�l�一个长度�ؓN的字�W�串A�Q�只能包含字�W�集中的字符�Q�，使得B不是A的子�?/strong>的概�?#8221;�Q�然后再�?减去�q�个概率即�ؓ�l�果�?br />设F[i][j]�?#8220;在所有长度�ؓi�?span style="color: red">不出现B的字�W�串中，后缀与B的前�~�匚w��长度为j�Q�即该字�W�串的后�~�与B的前�~��?span style="color: red">最�?/strong>匚w��长度为j�Q�的概率”�Q�很昄��Q�F是由递推得到了，关键是如何进行状态�{�U�？或者说�Q�在递推�q�程中，哪些状态可能成为F[i][j]的前��状态？
假设F[i-1][k]是F[i][j]的前��状态，也就是说�Q?span style="color: red">在字�W�集中至��存在一个字�W�c�Q��得主串的�W�i位（最后一位）取c�Ӟ��能够从F[i-1][k]转移到F[i][j]。这��需要求一个值S[k][c]�Q�表�C�当��M��的后�~�与B的前�~�的（最大）匚w��长度为k�Ӟ��在主串后再加上一个字�W�c�Q�其匚w��长度会变成什么。�D例：讄��前主串A'="abasab"�Q�B="asabs"�Q�其匚w��长度�?�Q�若在A'后加上一个字�W?s'�Q�则匚w��长度变�ؓ5�Q�所以S[4]['s']=5�Q�而若在A'后加上一个字�W?a'�Q�则匚w��长度会变�?�Q�所以S[4]['a']=1。显然S值和A前面的哪些字�W�是没有关系的�?br />那么�q�个S值如何计��？其实可以发现�Q�S和KMP��法中的nx数组��似�Q�因此完全可以按照计��nx数组的办法来计算S。具体来��_��先要对B作KMP自��n匚w��Q�求出其nx数组�Q�然后，在求S[k][c]的时候，��试在B的第k位（�׃��B的下标从0开始所以B[k-1]�Q�后加上字符c�Q�看看会“回退”到哪里即可。代码：
     int j = 0; nx[0] = 0;
     re2(i, 1, m) {
            while (j && A[i] != A[j]) j = nx[j - 1];
            if (A[i] == A[j]) j++;
            nx[i] = j;
     }
     re(i, m) re(k, SZ) {
           j = i;
           while (j && A[j] != k + 97) j = nx[j - 1];
           if (A[j] == k + 97) S[i][k] = ++j; else S[i][k] = 0;
     }
�q�里m是B的长度。注意，当i=m�Ӟ��S[i][j]是无意义的，因�ؓ前面已经说过了不能出现B�?br />在求出S值后��p��求出F��g��。对于状态F[i][j]�Q�若存在一个字�W�c使得x=S[i][c]�Q�满��?<=x最�l�结果�ؓ1-∑F[N][0..m-1]�?br />
代码

【例2�?a title="PKU1625" >PKU1625�Q?a title="URAL1158" >URAL1158�Q?br />题意�Q�给��Z��些子�Ԍ��求长度�ؓN�Q�各个字�W�都属于�l�定的字�W�集的所有字�W�串中，不包含�Q何一个给出的子串的字�W�串个数�Q�需要��用压9位的高精度）�?br />
本题昄��是【例1】的多子串�Ş式，而用来解军_��个字�W�串同时匚w��的只有AC自动机，那么如何在本题中使用AC自动机求解呢�Q?br />观察【例1】中的F[i][j]�Q�可以想象一下，一个图中有m个顶点，分别表示匚w��长度�?..(m-1)�Q�然后不断新加入的字�W�让�q�些状态在�q�些�l�点间不断�{�U�（状态�{�U�d��是图中的边）�Q�这��P��F[i][j]��p��C?#8220;阶段i到达�l�点j�?#8221;。而AC自动机是��Z��Trie�Q�树�Q�的�Q?/span>其中有现�?/span>的结点，�q�就揭示了本题的�?/span>�?/span>�Q?/strong>
F[i][j]�?/span>�C?/span>长度为i的合法的字符�Ԍ��是满��字符集限制且不包含�Q何一个给定子�Ԍ��中，在匹配到最后一位（�W�i位）后，刚好到达�l�点j的字�W�串�?/strong>个数�?br />同样�Q�S[k][c]表示“目前到达�l�点k�Q�接下来的一个字�W�是c的时候，会到辑֓�个结炏V��在�Ҏ��有的子串建立了自动机之后�Q�S值只要类似地搞就能求出来了。然后F的�{�U�M��搞定了�?br />不过�Q�本题要万分注意AC自动机的一个BUG�Q�在建立了自动机以后�Q�需要把所有本�w�不危险�Q�如果一个结点代表的字符串刚好是某一个给出的不能出现的子�Ԍ��则该�l�点是危险结点）�Q�但通过��p�|指针不断上溯能够到达一个危险结点的�l�点�Q�也标记为危险结点，比如两个子串�?abcde"�?bc"�Q�则代表"abcd"的那个结点由于包含了"bc"所以也是危险的�?br />此外�Q�本题的输入要注意，字符集的ASCII码范围是-128~127�Q�所以必��ȝ��char而不是unsigned char�Q�且�׃��可能包含�I�格所以必��ȝ��gets()而不是scanf()输入�Q�又因�ؓC/C++中木有负��C��标，因此在输入之后还要�{化一下（�?28�Q��?br />
代码

【例3�?a title="PKU3691" >PKU3691
题意�Q�给��Z��些子串和一个字�W�串A�Q�其每个字符均属于字�W�集{'A', 'C', 'G', 'T'}�Q�，求至��要改动A的几个字�W�（不能�Ҏ��不属于字�W�集的字�W�）�Q��得它不包含�Q何一个给出的子串�Q�若不管怎么攚w��不行�Q�则�l�果�?1�?br />
�q�就是真正的DP了。设F[i][j]为前i位，到达的结点�ؓj�Q�最��改动的字符个数�Q�则转移方程�?br />F[i][j] = min{F[i-1][x] + (A[i] != c)}�Q�c∈{'A', 'C', 'G', 'T'}�Q�S[x][c]=j。边界：F[0][root]=0�Q�其余的F[0][]=+∞�Q�A的实际下标从1开始�?br />求S数组的方法见【例2�?br />
代码

【例4�?a title="PKU3208" >PKU3208
题意�Q�含有连�l�的三个数字6的正整数�Q�称�?beastly number"�Q�求�W�P个（1<=P<=50000000�Q?beastly number"�Q�其位数不会��过15位）�?br />�Q�这题是本沙茶在PKU上至今�ؓ止，自己惛_��法的AC人数最��的题）
本题其实是用不着KMP的，因�ؓ"666"�q�样��单的子串……

思�\�Q�由于位��C��会超�q?5位（后来发现最多只�?0位）�Q�所以每�?beastly number"都可以看成一个长度�ؓ15�Q�字�W�集为['0'..'9']的字�W�串�Q�注意是可以有前�?的，因�ؓ位数可能不��15位）A�Q�整个过�E�也��是从高位（�W?位）向低位（�W?4位）求出A的各位�?br />
预处理：求出F[i][j]�Q�表�C��A的前i位已�l�确定（其中不含"666"�Q�准��来说是非末��不�?666"�Q�，且前i位的末尾刚好有j�?6'�Q�j的范围是0�?�Q�时�Q�有多少�?beastly number"�Q�注意，前i位既然已�l�确定，��׃��可更改了�Q�能够决定的只有�W�i位的后面�Q��?br />昄��先要求出F0[i][j]表示有多��个不是"beastly number"。其递推方程不好写，见代码（其实也是很好理解的）。然后F[i][j]=10^14-i - F0[i][j]�?br />
然后��是不断调整边界来构造了。准��来��_��讑։�i-1位已�l�确定，现在要确定第i位，则枚丄��i位是0~9中的哪个��|��然后求出满��条�g的最��的"beastly number"和最大的"beastly number"的名�ơ（注意�Q�名�ơ是�?开始的�Q�，看看P在不在其中，�q�样��p��定了。严重注意：如果已确定的位数中已�l�出��C��"666"�Q�接下来的就不用枚�D了，直接在后面接上P-L��p��了，L为左边界�?br />
但是�Q��ؓ什么要把本题放在KMP的专题里面呢囧？因�ؓ如果�q�个子串不是"666"而是一些结构复杂的东东比如"123131"�q�样的，只有借助KMP��法了。这�Ӟ��F[i][j]��p��C?A的前i位已�l�确定（非末��不含这个子�Ԍ��Q�且其后�~�与这个子串的前缀�?/span>配长度�ؓj�Q?/span>有多��个"beastly number" �Q��{�U�L��E�与前几个例子类伹{�?br />
代码

�ȝ��Q?br />KMP��法和AC自动机的状态�{�U�L��质军_��了它们在字符串匹配类DP问题中的巨大作用。在实际应用中，要注意灵�z�M��用它们。此外，AC自动机的那个BUG是一定要注意的�?

Mato_No1 2011-10-30 11:22 发表评论

后缀数组

Mato_No1 — Sun, 23 Oct 2011 08:51:00 GMT
【后�~�数组真难懂啊�?#8230;…��?0+行的代码搞了几天才理�?#8230;…不知是不是我太沙茶了�?br />
�?】一些定义：
字符�Ԍ��q�义的字�W�串是指“元素�c�d��有序�Q�且元素值有一定范围的序列”�Q�其元素不一定非要是字符�Q�可以是数字�{�，因此整数、二�q�制数等也是字符�Ԍ��
字符集：字符串的元素值的范围�U�Cؓ字符集，其大��记为SZ�?br />字符串的长度�Q�字�W�串中元素的个数�Q�一般记为N�Q�长度�ؓN的字�W�串A�W�一�ơ提到时一般用A[0..N-1]来表�C�；
前缀�Q�字�W�串A[0..N-1]的从A[0]开始的若干个连�l�的字符�l�成的字�W�串�U�CؓA的前�~��Q�以�?#8220;前缀i”或�?#8220;�~�号为i的前�~�”指的都是A[0..i]�Q?br />后缀�Q�字�W�串A[0..N-1]的到A[N-1]�l�止的若�q�个�q�箋的字�W�组成的字符串称为A的后�~��Q�以�?#8220;后缀i”或�?#8220;�~�号为i的后�~�”指的都是A[i..N-1];

对于一个长度�ؓN的字�W�串�Q�将其N个后�~�按字典序大小�q�行排序�Q�得��C��个数�l�sa[i]和rank[i]�Q�sa[i]为排在第i位的后缀的编��P��也就是一般说的ord[i]�Q�，rank[i]为排在后�~�i排在的位�|�（�U�Cؓ后缀i的名�ơ）。sa、rank值的范围均�ؓ[0..N-1]。sa和rank互逆，即sa[i]=j�{��h于rank[j]=i�Q�或者说成sa[rank[i]]=rank[sa[i]]=i。这里，sa�U�Cؓ后缀数组�Q�rank�U�Cؓ名次数组�?br />
�?】用倍增��法求后�~�数组�Q?br />在论文里�Q�后�~�数组有两�U�求法：倍增��法和DC3��法�Q�前者的旉��复杂度�ؓO(NlogN)�Q�但常数较小�Q�后者的旉��复杂度�ؓO(N)�Q�但常数较大�Q�在实际应用中，两者的��L��间相差不大，且后者比前者难理解得多�Q�本沙茶理解前者都用了几天旉��……后者就木敢看了�Q�。这里就�ȝ��一下倍增��法吧囧……
首先�Q�脓一下本沙茶的用倍增��法求后�~�数组的模板：
void suffix_array()
{
    int p, v0, v1, v00, v01;
    re(i, SZ) S[i] = 0;
    re(i, n) rank[i] = A[i];
    re(i, n) S[A[i]]++;
    re2(i, 1, SZ) S[i] += S[i - 1];
    rre(i, n) sa[--S[A[i]]] = i;
    for (int j=1; j<n; j<<=1) {
        p = 0; re2(i, n-j, n) tmp[p++] = i;
        re(i, n) if (sa[i] >= j) tmp[p++] = sa[i] - j;
        re(i, SZ) S[i] = 0;
        re(i, n) S[rank[i]]++;
        re2(i, 1, SZ) S[i] += S[i - 1];
        rre(i, n) sa[--S[rank[tmp[i]]]] = tmp[i];
        tmp[sa[0]] = p = 0;
        re2(i, 1, n) {
            v0 = sa[i - 1]; v1 = sa[i];
            if (v0 + j < n) v00 = rank[v0 + j]; else v00 = -1;
            if (v1 + j < n) v01 = rank[v1 + j]; else v01 = -1;
            if (rank[v0] == rank[v1] && v00 == v01) tmp[sa[i]] = p; else tmp[sa[i]] = ++p;
        }
        re(i, n) rank[i] = tmp[i];
        SZ = ++p;
    }
}
�q�里A是待求sa和rank的字�W�串�?br />
<1>倍增��法的思想�Q?br />记R[i][j]为A[i..i+2^j-1]�Q�如果越界，则后面用@填充�Q�在A的所有长度�ؓ2^j的子�Ԍ��界则后面用@填充�Q�中的名�ơ（rank�Q�倹{��倍增��法��是按阶�D�|��出所有R[i][j]的��|��直到2^j>N为止。首先，R[i][0]的就是字�W�A[i]在A[0..N-1]中的名次�Q�是可以直接用计数排序来实现的。然后，若R[0..N-1][j-1]已知�Q�则可以按照以下�Ҏ��求出R[0..N-1][j]的��|��Ҏ��个i�Q?<=ii, Y_i>�Q�其中X_i=R[i][j-1]�Q�Y_i=R[i+2^j][j-1]�Q�若i+2^j>=N�Q�则Y_i=-∞�Q�，然后对这N个二元组按照�W�一关键字�ؓX�Q�第二关键字为Y�Q�若两者都相等则判定�ؓ相等�Q�进行排序（可以用基数排序来实现�Q�，排序后，i, Y_i>的名�ơ就是的R[i][j]的倹{�?br />
<2>一开始，对A中的各个字符�q�行计数排序�Q?
re(i, SZ) S[i] = 0;
re(i, n) rank[i] = A[i];
re(i, n) S[A[i]]++;
re2(i, 1, SZ) S[i] += S[i - 1];
rre(i, n) sa[--S[A[i]]] = i;
�q�个木有��马好说的，在搞懂了基数排序之后可以�U�掉。唯一不同的是�q�里加了一句：rank[i]=A[i]�Q�这里的rank[i]是初始的i的名�ơ，MS不符合rank[i]的定义和sa与rank间的互逆性。这里就要解释一下了囧。因为在求sa的过�E�中�Q�rank值可能不�W�合定义�Q�因为长度�ؓ2^j的子串可能会有相�{�的�Q�此时它们的rank��g��要相�{�，而sa值由于有下标的限制所以不可能有相�{�的。因此，在过�E�中�Q�rank其实是用来代替A的子串的�Q�这样rank值只需要表�C�Z��?#8220;相对��序”��p��了，也就是：rank[i0]>(=, <)rank[i1]�Q�当且仅当A[i0..i0+2^j-1]>(=, <)A[i1..i1+2^j-1]。这��P��可以直接��A[i]��g��为初始的rank[i]倹{�?br />
<3>j�Q�代�?^j�Q�的��g��1开始不断倍增�Q�对二元�l�进行基数排序求出新阶段的sa��|��

for (int j=1; j<n; j<<=1) {
    p = 0; re2(i, n-j, n) tmp[p++] = i;
    re(i, n) if (sa[i] >= j) tmp[p++] = sa[i] - j;
    re(i, SZ) S[i] = 0;
    re(i, n) S[rank[i]]++;
    re2(i, 1, SZ) S[i] += S[i - 1];
    rre(i, n) sa[--S[rank[tmp[i]]]] = tmp[i];
注意�q�个基数排序的过�E�是很特别的。首先，它�ƈ不是对A在进行排序，而是对上一阶段求出的rank在进行排序。因为前面已�l�说�q�，在求sa的过�E�中�Q�rank��是用来代替A的对应长度的子串的，�׃��不能直接对子串进行排序（那样的话旉��开销很恐怖的�Q�，所以只能对rank�q�行排序。另外，�q�里在对二元�l?lt;x, y>的第二关键字�Q�y�Q�进行排序的�q�程中加了优化：�q�些y其实��是把上一阶段的sa整体左移了j�Q�右边空出的部分全部用@�Q�空�Ԍ��填充得到的，�׃��I�Z��的字典序肯定最��，因此��右边的�I�Z��按照下标��序先写入��时sa�Q�代码中用tmp表示的就是��时sa�Q�也��是对第二关键字y排序后的ord�l�果�Q�，然后�Q�上一阶段的sa如果左移后还木有消失的（也就是sa值大于等于j的）�Q�再按顺序写入��时sa�Q�就得到了排序结果。剩下的对x的排序结果就是上一阶段的sa�Q�唯一不同的是对于x相同的，按照临时名次递增的顺序�?br />
<4>求出新阶�D늚�rank��|��
tmp[sa[0]] = p = 0;
re2(i, 1, n) {
    v0 = sa[i - 1]; v1 = sa[i];
    if (v0 + j < n) v00 = rank[v0 + j]; else v00 = -1;
    if (v1 + j < n) v01 = rank[v1 + j]; else v01 = -1;
    if (rank[v0] == rank[v1] && v00 == v01) tmp[sa[i]] = p; else tmp[sa[i]] = ++p;
}
re(i, n) rank[i] = tmp[i];
SZ = ++p;
�׃��下一阶段需要��用本阶段的rank��|��因此在求��Z��本阶�D늚�sa��g��后，需要求rank倹{��（代码中的tmp起了临时rank的作用，目的是节省空��_��
因�ؓsa值已�l�求出，因此只要依次扫描sa��可以得到rank��|��唯一要做的工作就是找到哪些子串是相等的，它们的rank值应该相�{�，除此之外�Q�rank值只要依�ơ加1卛_��。判定相�{�的�Ҏ��Q�只需判定rank[i]和rank[i+j]是否都对应相�{�即可。若rank[i+j]��界�Q�用-∞�Q�当然�Q何一个负数都行，代码中用�?1�Q�来表示�?br />最后还有一个优化：�׃��本阶�D늚�名次的范围只有[0..p]�q�么多，下一阶段�?#8220;字符�?#8221;�Q�其实就是rank集）的大��SZ可以设�ؓp+1�Q�这样可以省一些时间�?br />
�q�样后缀数组sa和名�ơ数�l�rank��全部求完了�?br />
以后�q�有一些更重要的东东就是AC自动机、后�~�数组�{�的应用问题�Q�算了，以后再搞吧囧�?br />

Mato_No1 2011-10-23 16:51 发表评论

AC自动机模杉K��——HDU2222

Mato_No1 — Wed, 19 Oct 2011 11:47:00 GMT
具体题目�?a title="HDU2222" >HDU2222�Q�其实就是一个裸的多串匹配的问题�Q�给��Z��个主串和N个子�Ԍ��求出几个子串在主串中出现�q�）�?br />
我真是太沙茶�?#8230;…�q�么水的题目调了N久，找了N位神犇帮我看代码�Q�最�l�才扑և�来BUG……

易疵点：
�Q?�Q�本题的子串是可以相同的�Q�此时Trie的每个结点要设一个mul��|��表示该结点对应的字符串在所有子串中重复的次敎ͼ�另外�Q?span style="color: red">不要��Z��省空间把mul定义成char型，有可能所有的字符串全相同�Q�因此需要定义成int�Q�事实证明不会爆�I�间�Q�，�q�是本沙茶被折磨了这么久的主要原�?/strong>�Q?br />�Q?�Q�Trie采用静态存储，0��L��点作为空�l�点�Q�NULL�Q�，因此真正的结点编号从1开始，另外root一般都�?��L��点；
�Q?�Q�注意在建立自动��Z��及匹配的时候，所有要沿fail上溯的地方，其边界都�?�Q�NULL�Q�注意不是root�Q�或者找��C��个有对应子结点的�l�点。注意到0�q�没有找到的处理�Ҏ��Q�在建立自动机的时候，��T[j]�|��ؓroot�Q�在匚w��的时候，��x�|��ؓroot�Q?br />
代码�Q�模板）�Q�那些标了Attention的地斚w��是易�늚��Q�：
#include <iostream>
#include <stdio.h>
#include <string>
using namespace std;
using std::string;
#define re(i, n) for (int i=0; i
#define root 1
const int MAXN = 500001, MAXLEN = 1000001, SZ = 26, INF = ~0U >> 2;
struct node {
    int mul, ch[SZ], fail;    //Attention
} T[MAXN];
int N, Q[MAXN], res;
string s0, A;
char tmp[MAXLEN], tmp0[51];
void ins()
{
    int len = s0.length(), x = root, c;
    re(i, len) {
        c = s0[i] - 97;
        if (!T[x].ch[c]) {T[x].ch[c] = ++N; T[N].mul = 0; re(j, SZ) T[N].ch[j] = 0;}
        x = T[x].ch[c];
    }
    T[x].mul++;
}
void mkf()
{
    Q[0] = root; T[root].fail = 0;
    int i, j, x;
    for (int front=0, rear=0; front<=rear; front++) {
        i = Q[front];
        re(k, SZ) if (j = T[i].ch[k]) {
            x = T[i].fail;
            while (x && !T[x].ch[k]) x = T[x].fail;        //Attention
            if (x) T[j].fail = T[x].ch[k]; else T[j].fail = root;    //Attention
            Q[++rear] = j;
        }
    }
}
void solve()
{
    int len = A.length(), x = root, y, c; res = 0;
    re(i, len) {
        c = A[i] - 97;
        while (x && !T[x].ch[c]) x = T[x].fail;    //Attention
        if (!x) x = root; else x = T[x].ch[c];    //Attention
        y = x;
        while (y) {res += T[y].mul; T[y].mul = 0; y = T[y].fail;}      //Attention
    }
}
int main()
{
    int tests, n;
    scanf("%d", &tests);
    re(testno, tests) {
        N = 1; T[root].mul = 0; re(i, SZ) T[root].ch[i] = 0;
        scanf("%d", &n); getchar();
        re(i, n) {
            gets(tmp0);
            s0 = tmp0;
            ins();
        }
        gets(tmp);
        A = tmp;
        mkf();
        solve();
        printf("%d\n", res);
    }
    return 0;
}

�?011�q?0�?9日】今天发��C��匚w��q�程中的一个可优化的地方：对于一个点x以及它的所有返回结点（�q�里把所有沿着x的失败指针不断上溯直到root路径上的�l�点都称��回结点）�Q�由于不可重复计敎ͼ�可以��它们的mul值置为原来mul值的相反敎ͼ�-mul�Q�，而不�?�Q�表�C��l�点已经�l�计�q�。这样在下一�ơy的上溯过�E�中一旦发��C��个mul��gؓ负的点就不用�l�箋上溯了，因�ؓ上面的点一定也已经�l�计�q�了�?br />当然�Q�这仅限于单��M��Q�如果是多主串则需要在每次匚w��之前把Trie树中所有结点的mul��|��如果是负数的的话�Q�全部重新取反。�ؓ了节省时��_��可以在匹配过�E�中把所有统计过的（mul值改��数的�Q�结点全部放�q�一个辅助的队列里，然后取反时只要处理队列中的结点就行了�?br />
加入该优化后的代码（solve部分�Q�：
void solve()
{
    int len = A.length(), x = root, y, c; res = 0;
    re(i, len) {
        c = A[i] - 97;
        while (x && !T[x].ch[c]) x = T[x].fail;
        if (!x) x = root; else x = T[x].ch[c];
        y = x;
        while (y && T[y].mul >= 0) {res += T[y].mul; T[y].mul = -T[y].mul; y = T[y].fail;}
    }
}

下面是优化的实测�l�果�Q�第一个�ؓ优化后的�Q�第二个��Z��化前的）�Q�可以看出，该优化的力度很大�?img height="48" alt="" src="http://www.shnenglu.com/images/cppblog_com/matono1/��评�l�果/ACauto.gif" width="564" border="0" longdesc="" />

Mato_No1 2011-10-19 19:47 发表评论

Mato_No1 — Sat, 23 Apr 2011 08:09:00 GMT
【问题描�q��?br>�l�出一个环形的字符串S�Q�长度�ؓN�Q�现在要扑ֈ�一个断开点，使得从这里断开后的字符串字典序最��。或者说�Q�对于长度�ؓN的字�W�串S[0..N-1]�Q�找��C��个位�|�i�Q��得字�W�串S' = S[i..N-1] + S[0..i-1]的字典序最��。若存在多个�q�样的最优断点，则取最左边(i最��?的那个�?br>【Sample Input�?br>amandamanda
【Sample Output�?br>10
�Q�从�W?0位断开后得到的字符�?aamandamand"的字典序�?1个断开位置中最��的�Q?br>
【分析�?br>首先��这个环形串拆开�Q�只需��S[0..N-1]的后面再接上S[0..N-2]卛_��Q�如对于样例�Q�可构造字�W�串T = "amandamandaamandamand"�Q�，则T的�Q意一个长度�ؓN的子串T[i..i-N+1]��是S从第i位断开得到的字�W�串。此旉��题就变成了：�l�出一个长度�ؓ(2N-1)的字�W�串�Q�求出其所有长度�ؓN的子串中字典序最��的�?br>
设F[x]�?span style="COLOR: red">T中所有�v始位��于N的长度�ؓx的子串中字典序最��的子串的�v始位�Q�若有多个则取最左边的）�Q�如对于T="abaabaaababaabaaa"�Q�有F[0]=F[1]=0�Q�F[2]=2�Q�F[3]=F[4]=5……本题的目的就是求出F[N]的倹{��一开始已知的只有F[0]=0�Q�长度�ؓ0的字�W�串都是�I�Z��Q�字典序都是最��的�Q�取最左边的第0位）�?br>
可以发现�Q�F数组有很多重要的性质�Q?br>性质1 F[0..N]数组是单调递增的�?/strong>
证明�Q�用反证法。设存在一个值x(0<=xF[x+1]则根据定义，有T[F[x+1]..F[x+1]+x]<=T[F[x]..F[x]+x]�Q�这里一定不会越界，即F[x]+x的��g��定不大于(2N-1)�Q�因为xT[F[x]..F[x]+x-1]�Q�否则F[x]的值就应该�{�于F[x+1]的��g��Q�，矛盾�Q�故在F[0..N]中不可能存在��M��F[x]>F[x+1]的情况，也即F[0..N]数组是单调递增的（以下��F[0..N]数组��U�CؓF数组�Q��?br>性质2 对于��L��值x(0<=xF[x]+x�?/strong>
证明�Q�因为前面已�l�证明了F数组是单调递增的，�q�里只需证明对于��L��x(0<=x�q�里同样用反证法。设存在一个值x(0<=xF[x]+x�?br>
�Ҏ��F数组的以上两个性质可以设计出本题的��法�Q?br>讄��前已�l�求��Z��F[0..x-1]的��|��且F[x-1]=i。首先将T[0..i-1]全部删去�Q�因为F数组是单调递增的，F[x]的��g��定不��于i�Q�，然后对T自��n作扩展KMP�Q�就是以T为模板串�Q�T为子串的扩展KMP�Q�相当于光��处理部分�Q�，一开始先��F[x]�|��ؓi�Q�设�W�j位的匚w��长度为next[j]�Q�若next[j]=x-1且T[j+x-1]
旉��复杂度：O(NÖN)�Q�可以根据性质2得到�?

Mato_No1 2011-04-23 16:09 发表评论

KMP和扩展KMP

Mato_No1 — Sun, 17 Apr 2011 11:11:00 GMT
KMP�Q�给��Z��个字�W�串A�Q�称为模板串�Q�和B�Q�称为子�Ԍ��Q�长度分别�ؓlenA和lenB�Q�要求在�U�性时间内�Q�对于每个A[i]�Q?<=i【算法�?br />设next[i]为满��B[i-z+1..i]==B[0..z-1]的最大的z��|��也就是B的自�w�匹配）。设目前next[0..lenB-1]与ex[0..i-1]均已求出�Q�要用它们来求ex[i]的倹{�?br />�Ҏ��ex的定义，有A[i-1-ex[i-1]+1..i-1]==B[0..ex[i-1]-1]�Q�这�Ӟ��若有A[i]==B[ex[i-1]]�Q�则可以直接得到ex[i]=ex[i-1]+1�Q�因为i-1-ex[i-1]+1即i-ex[i-1]�Q�现在由于A[i]==B[ex[i-1]]�Q�可得A[i-ex[i-1]..i]==B[0..ex[i-1]]�Q�即A[i-ex[i-1]+1-1..i]==B[0..ex[i-1]+1-1]�Q�所以ex[i]=ex[i-1]+1�Q�。若A[i]!=B[ex[i-1]]�Q?br />设j=next[ex[i-1]-1]�Q�则�Ҏ��next定义得B[ex[i-1]-j..ex[i-1]-1]==B[0..j-1]�Q�又因�ؓA[i-ex[i-1]..i-1]==B[0..ex[i-1]-1]得A[i-j..i-1]==B[ex[i-1]-j..ex[i-1]-1]�Q�这��h��A[i-j..i-1]==B[0..j-1]�Q�也��是此时只需再比较A[i]与B[j]的值是否相�{�即可，若相�{�，可得ex[i]=j+1�Q�若仍不相等�Q�则更新j为next[j-1]�Q��l�比较A[i]与B[j]是否相等……直到A[i]与B[j]相等或直到j==0�Ӟ��A[i]仍不�{�于B[j]�Q�此时ex[i]=0。边界：求ex[0]�Ӟ��初始j�Q�用来代替ex[i-1]�Q��ؓ0�?br />现在�q�有一个问题，如何求next�Q�显然next��是以B自��n为模板串�Q�B为子串的“自��n匚w��”�Q�用�c�M��的办法即可，唯一不同的是next[0]=lenB可以直接得到�Q�求next[1]�Ӟ��初始j�Q�代替next[i-1]�Q��ؓ0�?br />【核心代码�?br />
    lenA = strlen(A); lenB = strlen(B);
    next[0] = lenB;
    int j = 0;
    re2(i, 1, lenB) {
        while (j && B[i] != B[j]) j = next[j - 1];
        if (B[i] == B[j]) j++;
        next[i] = j;
    }
    j = 0;
    re(i, lenA) {
        while (j && A[i] != B[j]) j = next[j - 1];
        if (A[i] == B[j]) j++;
        ex[i] = j;
    }
扩展KMP�Q�给出模板串A和子串B�Q�长度分别�ؓlenA和lenB�Q�要求在�U�性时间内�Q�对于每个A[i]�Q?<=i【算法�?br />设next[i]为满��B[i..i+z-1]==B[0..z-1]的最大的z��|��也就是B的自�w�匹配）。设目前next[0..lenB-1]与ex[0..i-1]均已求出�Q�要用它们来求ex[i]的倹{�?br />设p为目前A串中匚w��到的最�q�位�|�，k��其匹配到最�q�位�|�的��|��或者说�Q�k是在0<=i0�Ҏ��ex的定义可得，A[k..p]==B[0..p-k]�Q�因为i>k�Q�所以又有A[i..p]==B[i-k..p-k]�Q�设L=next[i-k]�Q�则�Ҏ��next的定义有B[0..L-1]==B[i-k..i-k+L-1]。考虑i-k+L-1与p-k的关�p�：
�Q?�Q�i-k+L-1=L。又�׃��next的定义可得，A[i+L]必然不等于B[L]�Q�否则A[i..i+L]==B[0..L]�Q�因为i+L<=p�Q�所以A[i..i+L]==B[i-k..i-k+L]�Q�这样B[0..L]==B[i-k..i-k+L]�Q�故next[i-k]的值应为L+1或更大）�Q�这��P��可以直接得到ex[i]=L�Q?/strong>
�Q?�Q�i+k-L+1>=p-k�Q�即i+L>p。这�Ӟ��首先可以知道A[i..p]和B[0..p-i]是相�{�的�Q�因为A[i..p]==B[i-k..p-k]�Q�而i+k-L+1>=p-k�Q�由B[0..L-1]==B[i-k..i-k+L-1]可得B[0..p-i]==B[i-k..p-k]�Q�即A[i..p]==B[0..p-i]�Q�，然后�Q�对于A[p+1]和B[p-i+1]是否相等�Q�目前是不知道的�Q�因为前面已�l�说�q�，p是目前A串中匚w��到的最�q�位�|�，在p之后无法知道��M��一位的匚w��信息�Q�，因此�Q�要从A[p+1]与B[p-i+1]开始往后��l�匹配（设j为目前B的匹配位�|�的下标�Q�一开始j=p-i+1�Q�每�ơ比较A[i+j]与B[j]是否相等�Q�直��C��相等或者越界�ؓ止，此时的j值就是ex[i]的��|��。在�q�种情况下，p的值必然会得到延��Q�因此更新k和p的倹{�?br />边界�Q�ex[0]的值需要预先求出，然后��初始的k设�ؓ0�Q�p设�ؓex[0]-1�?br />对于求next数组�Q�也�?#8220;自��n匚w��”�Q�类似KMP的方法处理即可。唯一的不同点也在边界上：可以直接知道next[0]=lenB�Q�next[1]的值预先求出，然后初始k=1�Q�p=ex[1]�?br />
需要严重注意的是，在上�q�的情况�Q?�Q�中�Q�本该从A[p+1]与B[p-i+1]开始匹配，但是�Q�若p+1

【核心代码�?br />
lenA = strlen(A); lenB = strlen(B);
    next[0] = lenB; next[1] = lenB - 1;
    re(i, lenB-1) if (B[i] != B[i + 1]) {next[1] = i; break;}
    int j, k = 1, p, L;
    re2(i, 2, lenB) {
        p = k + next[k] - 1; L = next[i - k];
        if (i + L <= p) next[i] = L; else {
            j = p - i + 1;
            if (j < 0) j = 0;
            while (i + j < lenB && B[i + j] == B[j]) j++;
            next[i] = j; k = i;
        }
    }
    int minlen = lenA <= lenB ? lenA : lenB; ex[0] = minlen;
    re(i, minlen) if (A[i] != B[i]) {ex[0] = i; break;}
    k = 0;
    re2(i, 1, lenA) {
        p = k + ex[k] - 1; L = next[i - k];
        if (i + L <= p) ex[i] = L; else {
            j = p - i + 1;
            if (j < 0) j = 0;
            while (i + j < lenA && j < lenB && A[i + j] == B[j]) j++;
            ex[i] = j; k = i;
        }
    }
【时间复杂度分析�?br />在KMP和扩展KMP中，不管是A串还是B�Ԍ��其匹配位�|�都是单调递增的，故��L��间复杂度是线性的�Q�都为O(lenA + lenB)�Q�只是扩展KMP比KMP的常数更大一些）�?br />【应用�?br />KMP和扩展KMP在解军_��W�串问题中有大用。很多看上去很猥琐的字符串问题，都可以归�l�到�q�两�U�算法之中。另外，�q�里�?#8220;字符�?#8221;可以延��Z��切类型的数组�Q�而不仅仅是字�W�数�l��?img src ="http://www.shnenglu.com/MatoNo1/aggbug/144390.html" width = "1" height = "1" />

Mato_No1 2011-04-17 19:11 发表评论