【21. KMP算法】

简介: **思路:**- 因为BF算法是一位一位的比较,所以时间复杂度比较高,KMP是通过`减少比较次数,来进行优化`.- BF是匹配不成功只移动一位,而KMP算法匹配不成功,`移动多位`,具体移动几位,需要查`前缀表`。

解决问题

KMP能解决字符串匹配
在文本串中是否出现模式串。
1661152924297.png

BF算法(暴力破解)

思路:

  • 俩个指针 i, j 分别指向文本串和模式串,当模式串字符与文本串字符,不一样时,此时需要将模式串向后移动一位

1661152941169.png

代码

int bt(string str, string pattern)
{
    int len1 = str.length();
    
    int len2 = pattern.length();
    for (int i = 0; i < len1 ; i ++)
    {   
        int j = 0;
        for (; j < len2; j ++ )
        {
            if (str[i + j] != pattern[j])
            {
                break;  //如果不相等,直接跳出循环,j从头开始
            }
           
        }
         if (j == len2 ) return i;
    }
    return -1;
} 

KMP算法:

思路:

  • 因为BF算法是一位一位的比较,所以时间复杂度比较高,KMP是通过减少比较次数,来进行优化.
  • BF是匹配不成功只移动一位,而KMP算法匹配不成功,移动多位,具体移动几位,需要查前缀表

1661152962113.png

前缀表与后缀表

  • 当遇到不匹配时,就需要找前面一个数的最长相等前后缀是多少,然后再跳到该地方,继续与文本串进行比较。

前缀:包含首字母,不包含尾字母的所有子串。

后缀:不包含首字母,包含尾字母的所有子串。

模式串 a b a a b

  • 前缀有 a ab aba abaa.
  • 后缀有 b ab aab baab

最长相等前后缀
a:没有相等前后缀只有本身next[0] = 0
aa:前缀a, 后缀a,相等前后缀长度是1. next[1] = 1
aab:没有相等前后缀next[2] = 0
aaba:前缀a, 后缀a,相等前后缀长度是1. next[3] = 1
aabaa:前缀aa, 后缀aa,相等前后缀长度是2. next[4] = 2
aabaaf:没有相等前后缀next[5] = 0

next[]所组成的0, 1 , 0 , 2, 0 , 0 就是前缀表

next数组(也就是前缀表)

next数组为什么 j = next[j - 1],而不是j = next[j];

next数组的性质:

  • P[0] 到 P[i] 这一段子串中,前next[i]个字符与后next[i]个字符一模一样。
  • 我们可以拿长度为 next[r-1] 的那一段前缀,来顶替当前后缀的位置,让匹配继续下去

匹配例子:

  • P[4]失配后,把P[next[3-1]]也就是P[1]对准了主串刚刚失配的那一位;P[6]失配后,把P[next[6-1]]也就是P[3]对准了主串刚刚失配的那一位。

1661152980546.png

题目

给定一个模式串 S,以及一个模板串 P,所有字符串中只包含大小写英文字母以及阿拉伯数字。

模板串 P 在模式串 S 中多次作为子串出现。

求出模板串 P 在模式串 S 中所有出现的位置的起始下标。

输入格式

第一行输入整数 N,表示字符串 P 的长度。

第二行输入字符串 P。

第三行输入整数 M,表示字符串 S 的长度。

第四行输入字符串 S。

输出格式

共一行,输出所有出现位置的起始下标(下标从 0 开始计数),整数之间用空格隔开。

数据范围

1≤ N ≤ 105
1≤ M ≤ 106

输入样例:

3
aba
5
ababa

输出样例:

0 2

代码

#include <iostream>
#include <string>
using namespace std;

int n, m;
const int N = 100010, M = 1000010;

char  s[M], p[N];
int ne[N];

int main()
{
    cin >> n >> p  >> m >> s ;
    for (int i = 1,  j = 0; i < n; i ++)
    {
        while (j && p[i] != p[j ]) j = ne[j-1] ;
        if (p[i] == p[j ]) j ++;
        ne[i ] = j ;
    }
    
    for (int i = 0, j = 0; i < m; i ++)
    {
        while (j && s[i] != p[j ])  j = ne[j-1];
        if (s[i] == p[j ]) j ++;
        if (j == n)
        {
            printf("%d ", i - j + 1);
            j = ne[j-1];
        }
    }
    return 0;
    
}

可以参考https://www.zhihu.com/question/21923021/answer/1032665486

目录
相关文章
|
5月前
|
算法
数据结构中的KMP算法及其改进算法
KMP算法通过引入部分匹配表,有效避免了重复计算,从而将字符串匹配的时间复杂度降低到O(m+n)。通过进一步优化next数组,KMP算法的效率得到了进一步提升。对于大规模字符串匹配问题,KMP算法及其改进算法提供了高效的解决方案,是计算机科学领域的经典算法之一。
81 3
|
29天前
|
算法
第四章 KMP算法理论基础
第四章 KMP算法理论基础
17 0
|
1月前
|
算法
KMP算法
KMP算法
23 0
|
3月前
|
算法 C++
A : DS串应用–KMP算法
这篇文章提供了KMP算法的C++实现,包括计算模式串的next数组和在主串中查找模式串位置的函数,用于演示KMP算法的基本应用。
|
4月前
|
数据采集 算法 JavaScript
揭开JavaScript字符串搜索的秘密:indexOf、includes与KMP算法
JavaScript字符串搜索涵盖`indexOf`、`includes`及KMP算法。`indexOf`返回子字符串位置,`includes`检查是否包含子字符串。KMP是高效的搜索算法,尤其适合长模式匹配。示例展示了如何在数据采集(如网页爬虫)中使用这些方法,结合代理IP进行安全搜索。代码示例中,搜索百度新闻结果并检测是否含有特定字符串。学习这些技术能提升编程效率和性能。
114 1
揭开JavaScript字符串搜索的秘密:indexOf、includes与KMP算法
|
3月前
|
算法
KMP算法
KMP算法
25 0
|
4月前
|
算法 Java
KMP算法详解及其在字符串匹配中的应用
KMP算法详解及其在字符串匹配中的应用
|
5月前
|
人工智能 算法 BI
一篇文章讲明白KMP算法(俗称看毛片算法)
一篇文章讲明白KMP算法(俗称看毛片算法)
55 0
|
5月前
|
算法 Java
Java数据结构与算法:字符串匹配算法之KMP算法
Java数据结构与算法:字符串匹配算法之KMP算法
|
6月前
|
算法