分类目录归档:字符串

Distinct Substrings SPOJ – DISUBSTR

Distinct Substrings

求不同子串个数.
对排好序的后缀,相邻两个后缀产生的不同子串数为:
(n-sa[i])+(n-sa[i-1])-height[i].

而(n-sa[i])+(n-sa[i-1])的累加就是(n+1)*n/2

#include <cstdio>
#include <cstring>
#include <cmath>
#include <iostream>
#include <algorithm>
#include <string>
#include <vector>
#include <queue>
#include <map>
#include <stack>
#include <utility>
using namespace std;
const int INF = 1e9;
const int MAX_V = 10005;
const int MAX_E= 200005;

int c[20010],_rank[20010],temp[20010],sa[20010],height[20010];
void da(int str[],int n,int m){
  n++;
  int i,j,p;
  for(i=0;i<m;++i) c[i]=0;
  for(i=0;i<n;++i) c[_rank[i]=str[i]]++;
  for(i=1;i<m;++i) c[i]+=c[i-1];
  for(i=n-1;i>=0;--i) sa[--c[_rank[i]]]=i;
  for(j=1;j<=n;j<<=1){
    p=0;
    //若未对str进行离散化,第一轮rank不是真正的rank,是大小关系相对确定的rank.
    //_rank[i]为上一轮第i个位置的rank(也是此轮第i个位置的第一关键字, 第i-j个位置的第二关键字)
    //temp[i]为第i小的第二关键字对应的串首位置(第一关键字的下标)
    for(i=n-j;i<n;++i) temp[p++]=i; //无第二关键字
    for(i=0;i<n;++i){
      if(sa[i]>=j) temp[p++]=sa[i]-j;
    }
    //排序第一关键字_rank[i],当_rank[i]相等时,让第二关键字小的排前面
    for(i=0;i<m;++i) c[i]=0;
    for(i=0;i<n;++i) c[_rank[temp[i]]]++;
    for(i=1;i<m;++i) c[i]+=c[i-1];
    for(i=n-1;i>=0;--i) sa[--c[_rank[temp[i]]]] = temp[i];
    //新的rank数组要由老的rank数组得到,因而将rank转移到temp上
    swap(_rank,temp);
    p=1;
    _rank[sa[0]]=0;
    for(i=1;i<n;++i){
      _rank[sa[i]]=temp[sa[i-1]]==temp[sa[i]]&&temp[sa[i-1]+j]==temp[sa[i]+j]?p-1:p++;
    }
    if(p>=n) break;
    m=p;
  }

  int k=0;
  n--;

  //height[rank[i]]>=height[rank[i-1]]-1
  for(i=0;i<n;++i){
    if(k) k--;
    j=sa[_rank[i]-1];
    while(str[i+k]==str[j+k]) k++;
    height[_rank[i]]=k;
  }

}

char s[1005];
int t[1005];
int main(){
  int T;
  cin>>T;
  while(T--){
    scanf("%s",s);
    int len=strlen(s);
    int m=0;
    for(int i=0;i<len;++i){
       t[i]=s[i]-0;
       m=max(s[i]-0,m);
    }
    t[len]=0;
    da(t,len,m+1);
    int ans=len*(len+1)/2;
    for(int i=0;i<=len;++i){
        ans-=height[i];
       // cout<<height[i]<<endl;
    }
    printf("%d\n",ans);
  }

}

POJ 1743 -Musical Theme

Musical Theme

求最长不重叠重复子串.

依题意进行了作差转化.
二分长度+height分组判断.

#include <algorithm>
#include <cmath>
#include <cstdio>
#include <cstring>
#include <iostream>
#include <vector>
using namespace std;
const int INF = 1e9;

//_rank[i]:位置i开始的子串排名
//sa[i]:排名为i的子串开始位置,
//height[i]:sa[i]和sa[i-1]对应子串的最长公共前缀长度
//c[i]:计数桶
int c[120010],_rank[120010],temp[120010],sa[120010],height[120010];
void da(int str[],int n,int m){
  n++;
  int i,j,p;
  //第一轮基数排序
  for(i=0;i<m;++i) c[i]=0;
  for(i=0;i<n;++i) c[_rank[i]=str[i]]++;
  for(i=1;i<m;++i) c[i]+=c[i-1];
  for(i=n-1;i>=0;--i) sa[--c[_rank[i]]]=i;
  //倍增
  for(j=1;j<=n;j<<=1){
    p=0;
    //若未对str进行离散化,第一轮rank不是真正的rank,是大小关系相对确定的rank.
    //_rank[i]为上一轮第i个位置的rank(也是此轮第i个位置的第一关键字, 第i-j个位置的第二关键字)
    //temp[i]为第i小的第二关键字对应的串首位置(第一关键字的下标)
    for(i=n-j;i<n;++i) temp[p++]=i; //无第二关键字
    for(i=0;i<n;++i){
      if(sa[i]>=j) temp[p++]=sa[i]-j;
    }
    //基数排序第一关键字_rank[i],当_rank[i]相等时,让第二关键字小的排前面
    for(i=0;i<m;++i) c[i]=0;
    for(i=0;i<n;++i) c[_rank[temp[i]]]++;
    for(i=1;i<m;++i) c[i]+=c[i-1];
    for(i=n-1;i>=0;--i) sa[--c[_rank[temp[i]]]] = temp[i];
    //新的rank数组要由老的rank数组得到,因而将rank转移到temp上
    swap(_rank,temp);
    p=1;
    _rank[sa[0]]=0;
    for(i=1;i<n;++i){
      _rank[sa[i]]=temp[sa[i-1]]==temp[sa[i]]&&temp[sa[i-1]+j]==temp[sa[i]+j]?p-1:p++;
    }
    if(p>=n) break;
    m=p;
  }

  int k=0;
  n--;

  //height[rank[i]]>=height[rank[i-1]]-1
  for(i=0;i<n;++i){
    if(k) k--;
    j=sa[_rank[i]-1];
    while(str[i+k]==str[j+k]) k++;
    height[_rank[i]]=k;
  }

}

bool judge(int k,int n){
  int Max=sa[0],Min=sa[0];
  for(int i=1;i<n;++i){
    if(height[i]>=k-1){
      Max=max(Max,sa[i]);
      Min=min(Min,sa[i]);
    }
    else{
      Max=sa[i],Min=sa[i];
    }
    if(Max-Min>=k){
      return true;
    }
  }
  return false; 
}

int a[20010];

int main() {
  // freopen("in.txt","r",stdin);
  // freopen("out.txt","w",stdout);
   int n;
   while(~scanf("%d",&n)&&n){
     for(int i=0;i<n;++i){
       scanf("%d",&a[i]);
     }

     int _size=0;
     for(int i=1;i<n;++i){
       a[i-1]=a[i-1]-a[i]+88;
       _size=max(_size,a[i-1]);
     }
     a[n-1]=0;
     da(a,n-1,_size+1);

     int Min=0;
     int Max=n;
     int ans;
     while(Min<=Max){
       int mid=(Min+Max)/2;
       if(judge(mid,n)) Min=mid+1,ans=mid;
       else Max=mid-1;
     }
     if(ans>=5){
       printf("%d\n",ans);
     }
     else printf("0\n");
   }
}

LightOJ – 1258 Making Huge Palindromes

Making Huge Palindromes

通过对字符串添加最少的字母,使其变为回文串,有点意思.
用manacher求出原串中能覆盖其后缀并且最左端最前的回文子串,这样原串左端没有被回文子串覆盖的部分就是要添加的了.

#include <algorithm>
#include <cmath>
#include <cstdio>
#include <cstring>
#include <iostream>
#include <vector>
using namespace std;
const int INF = 1e9;

char Ma[2000005];
int Mp[2000005];

int manacher(char s[], int len) {
  int l = 0;
  Ma[l++] = '$';
  Ma[l++] = '#';
  for (int i = 0; i < len; ++i) {
    Ma[l++] = s[i];
    Ma[l++] = '#';
  }
  Ma[l] = 0;
  int mx = 0, id = 0;
  int ans = len - 1;
  for (int i = 0; i < l; ++i) {
    Mp[i] = mx > i ? min(Mp[2 * id - i], mx - i) : 1;
    while (Ma[i + Mp[i]] == Ma[i - Mp[i]]) {
      Mp[i]++;
    }
    if ((i - Mp[i]) / 2 < ans && i + Mp[i] == l) {
      ans = (i - Mp[i]) / 2;
    }
    if (i + Mp[i] > mx) {
      mx = i + Mp[i];
      id = i;
    }
  }
  return ans + len;
}

char s[1000005];
int main() {
  // freopen("in.txt","r",stdin);
  // freopen("out.txt","w",stdout);
  int kase = 0, T;
  scanf("%d", &T);
  while (T--) {
    scanf("%s", s);
    printf("Case %d: %d\n", ++kase, manacher(s, strlen(s)));
  }
  return 0;
}

HDU – 4513 吉哥系列故事——完美队形II

HDU 4513

在回文子串的基础上加了限制条件, manacher算法里加个判断即可.

#include <algorithm>
#include <cmath>
#include <cstdio>
#include <cstring>
#include <iostream>
#include <vector>
using namespace std;
const int INF = 1e9;

unsigned char Ma[2000005];
int Mp[2000005];

int manacher(int s[], int len) {
  int l = 0;
  Ma[l++] = '$';
  Ma[l++] = '#';
  for (int i = 0; i < len; ++i) {
    Ma[l++] = s[i];
    Ma[l++] = '#';
  }
  Ma[l] = 2;
  int mx = 0, id = 0;
  int ans = 0;
  for (int i = 0; i < l; ++i) {
    Mp[i] = mx > i ? min(Mp[2 * id - i], mx - i) : 1;
    while (Ma[i + Mp[i]] == Ma[i - Mp[i]] &&
           ((i - Mp[i]) % 2 || Ma[i - Mp[i]] <= Ma[i - Mp[i] + 2])) {
      Mp[i]++;
    }
    ans = max(ans, Mp[i] - 1);
    if (i + Mp[i] > mx) {
      mx = i + Mp[i];
      id = i;
    }
  }
  return ans;
}

int s[1000005];
int main() {
  // freopen("in.txt","r",stdin);
  // freopen("out.txt","w",stdout);
  int kase = 0, T;
  scanf("%d", &T);
  while (T--) {
    int n;
    scanf("%d", &n);
    for (int i = 0; i < n; ++i) {
      scanf("%d", &s[i]);
    }
    printf("%d\n", manacher(s, n));
  }
  return 0;
}

HDU – 3613 Best Reward

Best Reward

扩展kmp与回文串问题

在扩展kmp中,设模式串为P1,目标串为P2
extend[i]表示P2[i]~P2[n]与P1的最长公共前缀长度.

设原串为P,将其倒置为S.
以P为模式串执行一遍e-KMP,得到extend1数组,P的前缀是回文串的条件是extend1[i]+i=length(S)
以S为模式串执行一遍e-KMP,得到extend2数组,P的后缀是回文串的条件是extend2[i]+i=length(P)
画出图更好理解.

#include <algorithm>
#include <cmath>
#include <cstdio>
#include <cstring>
#include <iostream>
#include <vector>
using namespace std;
const int INF = 1e9;

int Next[500001];
int extend1[500010];
int extend2[500010];
char p[500001];
char s[500001];
int value[500001];
void eKMP_pre(char x[],int m,int next[]){
  next[0]=m;
  int j=0;
  while(j+1<m&&x[j]==x[j+1]) j++;
  next[1]=j;
  int k=1;
  for(int i=2;i<m;++i){
    int p=next[k]+k-1;
    int L=next[i-k];
    if(i+L-1<p) next[i]=L;
    else{
      j=max(0,p-i+1);
      while(i+j<m&&x[i+j]==x[j]) j++;
      next[i]=j;
      k=i;
    }
  }
}

void eKMP(char x[],int m,char y[],int n,int next[],int extend[]){
  eKMP_pre(x,m,next);
  int j=0;
  while(j<n&&j<m&&x[j]==y[j]) j++;
  extend[0]=j;
  int k=0;
  for(int i=1;i<n;++i){
    int p=extend[k]+k-1;
    int L=next[i-k];
    if(i+L-1<p) extend[i]=L;
    else{
      j=max(0,p-i+1);
      while(i+j<n&&j<m&&y[i+j]==x[j]) j++;
      extend[i]=j;
      k=i;
    }
  }
}

int v[26];

int main() {
  // freopen("in.txt","r",stdin);
  // freopen("out.txt","w",stdout);
  int kase=0;
  int n,T;
  scanf("%d",&T);
  while(T--){
    for(int i=0;i<26;++i){
      scanf("%d",&v[i]);
    }
    scanf("%s",p);
    int len=strlen(p);
    int k=0;
    for(int i=len-1;i>=0;i--){
        s[k]=p[i];
        value[k]=v[s[k]-'a'];
        if(k)  value[k]=value[k]+value[k-1];
        k++;
    }
    eKMP(p,len,s,len,Next,extend1);
    eKMP(s,len,p,len,Next,extend2);
    int ans=-INF;
    for(int i=1;i<len;++i){
      int temp=0;
      if(i+extend1[i]==len){
          temp+=value[i+extend1[i]-1]-value[i-1];
          if(extend1[i]+extend2[extend1[i]]==len){
            temp+=value[i-1];
          }
      }
      else{
         if(len-i+extend2[len-i]==len){
           temp+=value[i-1];
         }
      }
      ans=max(ans,temp);
    }
    printf("%d\n",ans);
  }

  return 0;
}

HDU – 1358 Period

Period

KMP算法和周期性字符串.

i-next[i] 为最小循环元长度,i/(i-next[i])为最大循环次数.

#include <algorithm>
#include <cmath>
#include <cstdio>
#include <cstring>
#include <iostream>
#include <vector>
using namespace std;
const int INF = 1e9;

int Next[1000010];
char p[1000010];

void kmp_pre(char x[],int m,int next[]){
    int i,j;
    j=next[0]=-1;
    i=0;
    while(i<m){
      while(-1!=j&&x[i]!=x[j]) j=next[j];
      next[++i]=++j;
    }
}

int main() {
  // freopen("in.txt","r",stdin);
  // freopen("out.txt","w",stdout);
  int kase=0;
  int n;
  while(cin>>n&&n){
    scanf("%s",p);
    kmp_pre(p,n,Next);
    int i=n;
    printf("Test case #%d\n",++kase);
    for(int i=2;i<=n;++i){
        if(i/(i-Next[i])>1&&i%(i-Next[i])==0){
            printf("%d %d\n",i,i/(i-Next[i]));
        }
    }
    printf("\n");
  }

  return 0;
}