字符串匹配——kmp算法

简介: 字符串匹配——kmp算法

在文本串(text)中找模式串(pattern)时,如果用暴力查找基本是时间复杂度是(n*m),以i,j分别标志文本串、模式串当前匹配位置,如果text[i]和pattern[j]不等,pattern就要从头比较,实际上模式串的j前面的已经匹配好了,这样就比较浪费信息。

如果j的前几位和pattern开头的前几位相同,那这几位可以不用再比较,而kmp算法正是应用了这个特性,找到pattern当前j位置前几位和pattern开始几位相同的最大个数,减少了比较时间。

怎样描述一下这个最大个数,用一个next数组,next[j]表示pattern字符串第j位前前几位和pattern前几位相同的最大个数。

所以kmp算法的关键就是求一下模式串next数组。

next数组求解的思路是利用已知信息进行递归。

已知i前面的next值,现在看第i+1位,前面最大相等数值位next[i],现在后缀添加了一个字母pattern[i+1],如果前面i最大前缀前缀后一位字母pattern[next[i]]同它相等,显然next[i+1]=next[i]+1;但是不等怎么办!我们要寻找最大相等个数为k,则现在k已经小于next[i]了,我们有不妨找next[i]前面的最大相等位,另k=next[i],去找next[k]=next[i]+1,如此递归到找到或者k已经是起始位了为止。

根据这个思路:

代码如下:


#include<iostream>
#include<cstring>
#include<algorithm>
using namespace std;
const int maxn=10001;
int next[maxn];//next 数组标记位置
void getnext(char s[],int len) {
  int j=-1;
  next[0]=-1;
  for(int i=1;i<len;i++)
  {
    while(j!=-1&&s[i]!=s[j+1])
    j=next[j];
    if(s[i]==s[j+1])
    j++;
    next[i]=j;
  }
}
int kmp(char text[],char pattern[]){
  int ans=0,j=-1,n=strlen(text),m=strlen(pattern);
  getnext(pattern,m);
  for(int i=0;i<n;i++)
  {
    while(j!=-1&&text[i]!=pattern[j+1])
    j=next[j];
    if(text[i]==pattern[j+1])
    j++;
    if(j==m-1){
      ans++;
      j=next[j];
    }
  }
    return ans;
}
int main(){
  char a[]="ababab",b[]="ab";
  int k=kmp(a,b);
  cout<<k;
  return 0;
}
相关文章
|
4月前
|
算法
【算法】滑动窗口——找到字符串中所有字母异位词
【算法】滑动窗口——找到字符串中所有字母异位词
|
2月前
|
算法
两个字符串匹配出最长公共子序列算法
本文介绍了最长公共子序列(LCS)问题的算法实现,通过动态规划方法求解两个字符串的最长公共子序列,并提供了具体的编程实现细节和示例。
92 1
两个字符串匹配出最长公共子序列算法
|
2月前
|
算法
第四章 KMP算法理论基础
第四章 KMP算法理论基础
20 0
|
2月前
|
算法
KMP算法
KMP算法
35 0
|
4月前
|
算法 C++
A : DS串应用–KMP算法
这篇文章提供了KMP算法的C++实现,包括计算模式串的next数组和在主串中查找模式串位置的函数,用于演示KMP算法的基本应用。
|
4月前
|
算法 Java
掌握算法学习之字符串经典用法
文章总结了字符串在算法领域的经典用法,特别是通过双指针法来实现字符串的反转操作,并提供了LeetCode上相关题目的Java代码实现,强调了掌握这些技巧对于提升算法思维的重要性。
|
4月前
|
算法
KMP算法
KMP算法
32 0
|
4月前
|
算法 C++
惊爆!KPM算法背后的秘密武器:一行代码揭秘字符串最小周期的终极奥义,让你秒变编程界周期大师!
【8月更文挑战第4天】字符串最小周期问题旨在找出字符串中最短重复子串的长度。KPM(实为KMP,Knuth-Morris-Pratt)算法,虽主要用于字符串匹配,但其生成的前缀函数(next数组)也可用于求解最小周期。核心思想是构建LPS数组,记录模式串中每个位置的最长相等前后缀长度。对于长度为n的字符串S,其最小周期T可通过公式ans = n - LPS[n-1]求得。通过分析周期字符串的特性,可证明该方法的有效性。提供的C++示例代码展示了如何计算给定字符串的最小周期,体现了KPM算法在解决此类问题上的高效性。
87 0
|
7天前
|
算法
基于WOA算法的SVDD参数寻优matlab仿真
该程序利用鲸鱼优化算法(WOA)对支持向量数据描述(SVDD)模型的参数进行优化,以提高数据分类的准确性。通过MATLAB2022A实现,展示了不同信噪比(SNR)下模型的分类误差。WOA通过模拟鲸鱼捕食行为,动态调整SVDD参数,如惩罚因子C和核函数参数γ,以寻找最优参数组合,增强模型的鲁棒性和泛化能力。
|
13天前
|
机器学习/深度学习 算法 Serverless
基于WOA-SVM的乳腺癌数据分类识别算法matlab仿真,对比BP神经网络和SVM
本项目利用鲸鱼优化算法(WOA)优化支持向量机(SVM)参数,针对乳腺癌早期诊断问题,通过MATLAB 2022a实现。核心代码包括参数初始化、目标函数计算、位置更新等步骤,并附有详细中文注释及操作视频。实验结果显示,WOA-SVM在提高分类精度和泛化能力方面表现出色,为乳腺癌的早期诊断提供了有效的技术支持。