现在的位置: 首页 > 综合 > 正文

HDOJ–4821–String【字符串hash】

2018年01月12日 ⁄ 综合 ⁄ 共 1576字 ⁄ 字号 评论关闭

链接:http://acm.hdu.edu.cn/showproblem.php?pid=4821

题意:给一个字符串,选m个长度为l的子串组成新的串,要求这m个子串互不相同,问有多少种组合。

字符串hash题目,以前没做过,做这道之前还用bkdrhash做了两道简单的题目,POJ1200和HDU1800。

用base数组记录乘了几个seed,base[i]表示seed^i,这个数组在之后计算子串hash值的时候会用到,先预处理一遍节省时间。

如果字符串从前往后hash,则hash[ i ] - hash[ i - l ] * base[ l ] 就是子串 [ i - l , i ] 的hash值,而从后往前hash的话 hash[ i ] - hash[ i + l ] * base[ l ] 就是子串 [ i , i + l ] 的hash值。

推导过程:以从前往后hash为例。假设字符串abab,子串长度2,则

i = 4时的hash值( ( ( (0+a)*seed+b ) * seed +a ) * seed + b ) ,

i - l = 2的hash值( (0+a)*seed+b ),乘base[2]之后 ( ( ( (0+a)*seed+b ) * seed  ) * seed  )

二者相减为a * seed + b,就是区间 [ i - l, i ] 对应字母 ab 的hash值。

之后按照每一点枚举m个l长度的子串,当他们hash值不同时就是一个结果。

#include<cstring>
#include<string>
#include<fstream>
#include<iostream>
#include<iomanip>
#include<cstdio>
#include<cctype>
#include<algorithm>
#include<queue>
#include<map>
#include<set>
#include<vector>
#include<stack>
#include<ctime>
#include<cstdlib>
#include<functional>
#include<cmath>
using namespace std;
#define PI acos(-1.0)
#define MAXN 100010
#define eps 1e-7
#define INF 0x7FFFFFFF
#define seed 131
typedef long long ll;
typedef unsigned long long ull;


char s[MAXN];
ull base[MAXN],Hash[MAXN];
map<ull,int> mp;
int main(){
    int m,l,i,len,ans;
    base[0] = 1;
    for(i=1;i<MAXN;i++) base[i] = base[i-1] * seed;
    while(scanf("%d%d",&m,&l)!=EOF){
        scanf("%s",s);
        ans = 0;
        len = strlen(s);
        Hash[len] = 0;
        for(i=len-1;i>=0;i--){
            Hash[i] = Hash[i+1] * seed + s[i] - 'a';
        }
        for(i=0;i<l&&i+m*l<len;i++){
            mp.clear();
            for(int j=i;j<i+m*l;j+=l){
                ull temp = Hash[j] - Hash[j+l] * base[l];
                mp[temp]++;
            }
            if(mp.size()==m)    ans++;
            for(int j=i+m*l;j+l<=len;j+=l){
                ull temp = Hash[j-m*l] - Hash[j-(m-1)*l] * base[l];
                mp[temp]--;
                if(!mp[temp])   mp.erase(temp);
                temp = Hash[j] - Hash[j+l] * base[l];
                mp[temp]++;
                if(mp.size()==m)    ans++;
            }
        }
        printf("%d\n",ans);
    }
    return 0;
}

抱歉!评论已关闭.