KMP算法

最新推荐文章于 2025-04-21 18:59:53 发布

淼润淽涵

最新推荐文章于 2025-04-21 18:59:53 发布

阅读量269

点赞数

分类专栏：模板数据结构--KMP 文章标签：数据结构--KMP 模板

原文链接：https://blog.csdn.net/u013480600/article/details/44646517

版权

数据结构--KMP 同时被 2 个专栏收录

9 篇文章

订阅专栏

模板

6 篇文章

订阅专栏

对于KMP算法，都会涉及到两个串

一个是待匹配串 char T[1000]//待匹配串 待匹配串的长度定为n

一个是模板串 char P[100]//模板串模板串的长度定为m

要知道KMP的F[i]数组求得的数值就是串P中的[1,i-1]的后缀与串P中的[0,i-2]前缀的最大匹配长度。

对于KMP算法一般会利用到两个函数

void find(char *T, char *P, int *f) //找到所有匹配点

```
void getFail(char *P, int *f)
```

KMP算法经常用到的两个函数的模板

const int MAXN=1000000+100;
const int MAXM=10000+100;
int T[MAXN],P[MAXM],f[MAXM],f2[MAXM];
int n,m;
void getFail(char *P,int *f)//必须用f和f2两个数组,要不然不好计算优化指针,比如串aaaab的优化指针是000030
{
    f[0]=f[1]=0;//保存优化之后的失配指针
    f2[0]=f2[1]=0;//f2保存未优化的适配指针
    int m =strlen(P);
    for(int i=1;i<m;i++)
    {
        int j=f2[i];
        while(j && P[i]!=P[j]) j=f2[j];
        f2[i+1] = f[i+1] = (P[i]==P[j])?j+1:0;//既然i+1的失配位置指向j+1，但是P[i+1]和P[j+1]的内容是相同的
        //所以就算指针从i+1跳到j+1去，还是不能匹配，所以f[i+1]直接=f[j+1]
        if(f[i+1]==j+1 && P[i+1]==P[j+1]) f[i+1]=f[j+1];
        //cout<<f[i]<<f2[i]<<endl;
    }
}

const int MAXN=1000000+100;
const int MAXM=10000+100;
int T[MAXN],P[MAXM],f[MAXM],f2[MAXM];
int n,m;
//int cnt;
//int ex[MAXN];
void find(char *T,char *P,int *f)
{
    int n=strlen(T);
    int m=strlen(P);
    int j=0;
    for(int i=0;i<n;i++)
    {
        if(j && T[i]!=P[j]) j=f[j];
        if(T[i]==P[j]) j++;
        //ex[i]=j;     在用KMP计算两字符串前缀后缀的时候常用到（注：从此处开始下面的代码一般都以具体题目而定）
        if(j==m)//j为两串相同的长度，i为在T串中出现的位置
        {
             //cnt++;
             //printf("%d\n", i - m + 1);//输出每次P串在T串中每一次出现的位置，注意下标是从0开始的
             //return i-m+1; (前面要变成 int find函数)
        }
    }
}

还有一种求多个字符串的最长公共连续子串，如果存在多个长度相同的就输出字典序最小的那个，其模板为

char s[4100][250];
char P[250];
char ans[250];//最终的结果字符串
int m,next[250];
int n;//表示有多少个主串
void getFail()
{
    m=strlen(P);
    next[0]=next[1]=0;
    for(int i=1;i<m;i++)
    {
        int j =next[i];
        while(j && P[i]!=P[j]) j=next[j];
        next[i+1] = (P[i]==P[j])?j+1:0;
    }
}
bool find(char *T)
{
    int j=0;
    getFail();
    int n=strlen(T);
    for(int i=0;i<n;i++)
    {
        while(j && T[i]!=P[j]) j=next[j];
        if(T[i]==P[j]) j++;
        if(j==m) return true;
    }
    return false;
}
bool solve_1(int len)//判断第0个base串的长为len的字串中是否有可行串
{
    int s0_len=strlen(s[0]);
    for(int i=0;i+len-1<s0_len;i++)
    {
        strncpy(P,s[0]+i,len);
        P[len]=0;//P串末尾加'\0'
        bool ok=true;
        for(int j=1;j<n;j++)
        if(!find(s[j]))
        {
            ok=false;
            break;
        }
        if(ok) return true;
    }
    return false;
}
void solve_3(int len)//找出长度为len的可行字串中字典序最小的,放在ans中
{
    bool first=true;
    int s0_len=strlen(s[0]);
    for(int i=0;i+len-1<s0_len;i++)
    {
        strncpy(P,s[0]+i,len);
        P[len]=0;//P串末尾加'\0'
        bool ok=true;
        for(int j=1;j<n;j++)if(!find(s[j]))
        {
            ok=false;
            break;
        }
        if(ok)
        {
            if(first)
            {
                strncpy(ans,P,len+1);
                first=false;
            }
            else if(strcmp(ans,P)>0)//字典序小才更新
                strncpy(ans,P,len+1);
        }
    }
}
bool solve()
{
    int L=1,R=strlen(s[0]);
    if(!solve_1(1)) return false;
    while(R>L)
    {
        int m=L+(R-L+1)/2;
        if(solve_1(m))
            L=m;
        else
            R=m-1;
    }
    //找到了可行字串的最长长度为L,然后需要找出字典序最小的
    solve_3(L);//找到长L的字典序最小的字串存在ans中
    return true;
}