现在的位置: 首页 > 综合 > 正文

poj 1743 Musical Theme (后缀数组 不可重叠最长重复子串)

2013年08月12日 ⁄ 综合 ⁄ 共 1829字 ⁄ 字号 评论关闭

题意:给你一串数,让你求不可重叠的最长重复子串。注意,这里只要差值序列相同即视作重复序列。当最长序列长度小于5时输出0

思路:后缀数组求不可重叠的最长重复子串。二分答案,把题目变成判定性问题:判断是否存在两个长度为k 的子串是相同的,且不重叠。解决这个问题的关键是利用height 数组。把排序后的后缀分成若干组,其中每组的后缀之间的height 值都不小于k。有希望成为最长公共前缀不小于k 的两个后缀一定在同一组。然后对于每组后缀,只须判断每个后缀的sa 值的最大值和最小值之差是否不小于k。如果有一组满足,则说明存在,否则不存在。整个做法的时间复杂度为O(nlogn)。

注意,这里是先求差值序列。那么对于差值序列,就不能判断不小于k,而是应该为大于k。

例如,对于1 1 1 1 1 1 1 1 1(9个)这个序列,得出的差值序列为1 1 1 1 1 1 1 1(8个)。若判定为>=k,k=4是可以通过的,而这样实际得出的原序列会有重叠。

#include<iostream>
#include<cstdio>
using namespace std;

const int maxn=20010;
const int INF=0x3f3f3f3f;

int w[maxn],wa[maxn],wb[maxn],wv[maxn],r[maxn],sa[maxn],rank[maxn],height[maxn],n;

int cmp(int *r,int a,int b,int l)
{
    return r[a]==r[b] && r[a+l]==r[b+l];
}

void make_sa(int *r,int *sa,int n,int m)
{
     int i,j,p;
     int *x=wa,*y=wb,*t;
     for (i=0;i<m;i++) w[i]=0;
     for (i=0;i<n;i++) w[x[i]=r[i]]++;
     for (i=1;i<m;i++) w[i]+=w[i-1];
     for (i=n-1;i>=0;i--) sa[--w[x[i]]]=i;
     for (p=1,j=1;p<n;j*=2,m=p)
     {
         for (p=0,i=n-j;i<n;i++) y[p++]=i;
         for (i=0;i<n;i++) if (sa[i]>=j) y[p++]=sa[i]-j;
         for (i=0;i<m;i++) w[i]=0;
         for (i=0;i<n;i++) w[wv[i]=x[y[i]]]++;
         for (i=1;i<m;i++) w[i]+=w[i-1];
         for (i=n-1;i>=0;i--) sa[--w[wv[i]]]=y[i];
         for (t=x,x=y,y=t,p=1,i=1,x[sa[0]]=0;i<n;i++)
            x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
    }
}

void make_height(int *r,int *sa,int n)
{
     int i,j,k=0;
     for (i=1;i<=n;i++) rank[sa[i]]=i;
     for (i=0;i<n;height[rank[i++]]=k)
         for (k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);
     return;
}

int check(int k)
{
    int maxx=0,minn=INF;
    for(int i=1;i<=n;i++)
    {
        if(height[i]<k)
            maxx=minn=sa[i];
        else
        {
            if(sa[i]>maxx) maxx=sa[i];
            if(sa[i]<minn) minn=sa[i];
            if(maxx-minn>k) return 1;
        }
    }
    return 0;
}

int work(int l,int r)
{
    int mid,ans;
    while(l<=r)
    {
        mid=(l+r)>>1;
        if(check(mid))
        {
            l=mid+1;
            ans=mid;
        }
        else
            r=mid-1;
    }
    return ans;
}

int main()
{
    scanf("%d",&n);
    while(n!=0)
    {
        for(int i=0;i<n;i++)
            scanf("%d",&r[i]);
        for(int i=0;i<n-1;i++)
            r[i]=r[i+1]-r[i]+100;
        r[--n]=0;
        make_sa(r,sa,n+1,300);
        make_height(r,sa,n);
        int ans=work(0,n)+1;
        if(ans<5) ans=0;
        printf("%d\n",ans);
        scanf("%d",&n);
    }
    return 0;
}

 

 

抱歉!评论已关闭.