給定一個字符串,求不相同的子串的個數(shù)丙猬。
算法分析:
每個子串一定是某個后綴的前綴,那么原問題等價于求所有后綴之間的不相
同 的 前 綴 的 個 數(shù) 费韭。 如 果 所 有 的 后 綴 按 照 suffix(sa[1]), suffix(sa[2]),
suffix(sa[3]), ...... ,suffix(sa[n])的順序計算,不難發(fā)現(xiàn),對于每一次新加
進來的 后綴 suffix(sa[k]), 它將產(chǎn)生 n-sa[k]+1 個新 的前綴。 但是其中有
height[k]個是和前面的字符串的前綴是相同的咐低。所以 suffix(sa[k])將“貢獻”
出 n-sa[k]+1- height[k]個不同的子串。累加后便是原問題的答案见擦。這個做法
的時間復(fù)雜度為 O(n)。
http://www.spoj.com/problems/SUBST1/
#include<cstdio>
#include<cstring>
#include<algorithm>
#define maxn 100005
using namespace std;
char s[maxn];
int sa[maxn],t[maxn],t2[maxn],c[maxn],Rank[maxn],height[maxn],n;
void build_sa(int m){
int i,*x=t,*y=t2,*T,p ;
n++;
for(i=0;i<m;++i)c[i]=0;
for(i=0;i<n;++i)++c[x[i]=s[i]];
for(i=1;i<m;++i)c[i]+=c[i-1];
for(i=n-1;i>=0;--i)sa[--c[x[i]]]=i;
for(int k=1;k<=n;k<<=1)
{
p=0;
for(i=n-1;i>=n-k;--i)y[p++]=i;
for(i=0;i<n;++i)if(sa[i]>=k)y[p++]=sa[i]-k;
for(i=0;i<m;++i)c[i]=0;
for(i=0;i<n;++i)++c[x[y[i]]];
for(i=1;i<m;++i)c[i]+=c[i-1];
for(i=n-1;i>=0;--i)sa[--c[x[y[i]]]]=y[i];
swap(x,y);
x[sa[0]]=0;p=1;
for(i=1;i<n;++i)
x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k]?p-1:p++;
if(p>=n)break;
m=p;
}
n--;
// for(int i=1;i<=n;++i)printf("%d ",sa[i]+1);
//printf("\n");
}
void cal_height(){
int i,j,k=0;
for(i=1;i<=n;i++)Rank[sa[i]]=i;
for(int i=0;i<n;++i)
{
j=sa[Rank[i]-1];//h[i-1]
if(k)k--;
while(s[i+k]==s[j+k])k++;
height[Rank[i]]=k;//h[i]
}
//for(int i=2;i<=n;++i)printf("%d ",height[i]);
}
int solve()
{
int sum=n-sa[1],i;
for(i=2;i<=n;i++)
{
sum+=n-sa[i]-height[i];
}
return sum;
}
int main(){
int t;
scanf("%d",&t);
while(t--)
{
scanf("%s",s);
n=strlen(s);
build_sa(255);
cal_height();
printf("%d\n",solve());
}
}