【map】【滑动窗口】【字典树】C++算法:最长合法子字符串的长度

简介: 【map】【滑动窗口】【字典树】C++算法:最长合法子字符串的长度

map

map可以分成有序(单调)map和无序(哈希)map。还可分成单键map和多键map(允许重复的键)。本文用:单键无序map。

LeetCode2781:最长合法子字符串的长度

给你一个字符串 word 和一个字符串数组 forbidden 。

如果一个字符串不包含 forbidden 中的任何字符串,我们称这个字符串是 合法 的。

请你返回字符串 word 的一个 最长合法子字符串 的长度。

子字符串 指的是一个字符串中一段连续的字符,它可以为空。

示例 1:

输入:word = “cbaaaabc”, forbidden = [“aaa”,“cb”]

输出:4

解释:总共有 11 个合法子字符串:“c”, “b”, “a”, “ba”, “aa”, “bc”, “baa”, “aab”, “ab”, “abc” 和 “aabc”。最长合法子字符串的长度为 4 。

其他子字符串都要么包含 “aaa” ,要么包含 “cb” 。

示例 2:

输入:word = “leetcode”, forbidden = [“de”,“le”,“e”]

输出:4

解释:总共有 11 个合法子字符串:“l” ,“t” ,“c” ,“o” ,“d” ,“tc” ,“co” ,“od” ,“tco” ,“cod” 和 “tcod” 。最长合法子字符串的长度为 4 。

所有其他子字符串都至少包含 “de” ,“le” 和 “e” 之一。

参数范围

1 <= word.length <= 105

word 只包含小写英文字母。

1 <= forbidden.length <= 105

1 <= forbidden[i].length <= 10

forbidden[i] 只包含小写英文字母。

滑动窗口+离线查询+map

时间复杂度😮(nmm+nlogn+n)。m = max(forbidden[i].length)为10

第一步:如果s[left,right]等于 forbidden中任何一个字符串,记录在vLeftRight中。本问题等效与:不能包括任意[left,right]的最长子串。

第二步:排序vLeftRight。

第三步:从大到小枚举合法子串的左边界i,计算最大右边界j。

如果s[left,right]等于某个禁止串

left<i 无论j为何值,都不会包括对应的禁止串,因为s[left]不在对应的子串中
left>=i j的取值范围为[i,right),不能取值right ,否则s[left,right] 就在word[i,j]中。如果多个无法合法的right,取最小值。如果没有合法的right,取m_c。

离线查询

由于vLeftRight 已经按left排序,每次处理i之前,先用left >= i的right更新iMin。

代码

核心代码

class Solution {
public:
  int longestValidSubstring(string word, vector<string>& forbidden) {
    m_c = word.length();
    std::unordered_set<string> setHas(forbidden.begin(), forbidden.end());
    vector<pair<int, int>> vLeftRight;
    for (int len = 1; len <= 10; len++)
    {
      for (int left = 0; left + len <= m_c; left++)
      {
        if (setHas.count(word.substr(left, len)))
        {
          vLeftRight.emplace_back(left, left + len - 1);
        }
      }
    }
    sort(vLeftRight.begin(), vLeftRight.end());
    int iRet = 0;
    int iMin = m_c;
    for (int i = m_c - 1; i >= 0; i--)
    {
      while (vLeftRight.size() && (vLeftRight.back().first >= i))
      {
        iMin = min(iMin, vLeftRight.back().second);
        vLeftRight.pop_back();
      }
      iRet = max(iRet, iMin - i);
    }
    return iRet;
  }
  int m_c;
};

字典树

可以利用字典树,将第一步的时间复杂度降到O(nm)。

template<class TData, TData defData,int iTypeNum = 26, TData cBegin = 'a'>
class CTrie
{
public:
  CTrie() 
  {
    m_iID = s_ID++;
  }
  int GetLeadCount()
  {
    return m_iLeafCount;
  }
  template<class IT>
  int Add(IT begin, IT end)
  {
    int iLeve = 0;
    CTrie* pNode = this;
    for (; begin != end; ++begin)
    {
      pNode = pNode->AddChar(*begin);     
      pNode->m_iLeve = iLeve++;
    }
    if (-1 == pNode->m_iLeafID)
    {
      pNode->m_iLeafID = ++m_iLeafCount;
    }
    return pNode->m_iLeafID;
  }
  template<class IT>
  CTrie* Search(IT begin, IT end)
  {
    if (begin == end)
    {
      return this;
    }
    if ('.' == *begin)
    {
      for (auto& ptr : m_vPChilds)
      {
        if (!ptr)
        {
          continue;
        }
        auto pSearch = ptr->Search(begin + 1, end);
        if (pSearch)
        {
          return pSearch;
        }
      }
      return nullptr;
    }
    auto ptr = GetChild(*begin);
    if (nullptr == ptr)
    {
      return nullptr;
    }
    return ptr->Search(begin + 1, end);
  }
  CTrie* AddChar(TData ele)
  {
    if ((ele < cBegin) || (ele >= cBegin + iTypeNum))
    {
      return nullptr;
    }
    const int index = ele - cBegin;
    auto ptr = m_vPChilds[index];
    if (!ptr)
    {
      m_vPChilds[index] = new CTrie();
    }
    return m_vPChilds[index];
  }
  CTrie* GetChild(TData ele)const
  {
    if ((ele < cBegin) || (ele >= cBegin + iTypeNum))
    {
      return nullptr;
    }
    return m_vPChilds[ele - cBegin];
  }
protected:
  int m_iID;
public:
  int m_iLeafID=-1;
protected:
  int m_iLeve=-1;
  inline static int s_ID = 0;
   int m_iLeafCount = 0;
  CTrie* m_vPChilds[iTypeNum] = { nullptr };
};
class Solution {
public:
  int longestValidSubstring(string word, vector<string>& forbidden) {
    m_c = word.length();
    CTrie<char,'a'> trie;
    for (const auto& s : forbidden)
    {
      trie.Add(s.begin(), s.end());
    }
    vector<pair<int, int>> vLeftRight;
    for (int left = 0; left < m_c ; left++)
    {
      CTrie<char,'a'>* p = &trie;
      for (int len = 1; left + len <= m_c; len++)
      {
        p = p->GetChild(word[left + len - 1]);
        if (nullptr == p)
        {
          break;
        }
        if (p->m_iLeafID > 0)
        {
          vLeftRight.emplace_back(left, left + len - 1);
        }
      }
    }
    sort(vLeftRight.begin(), vLeftRight.end());
    int iRet = 0;
    int iMin = m_c;
    for (int i = m_c - 1; i >= 0; i--)
    {
      while (vLeftRight.size() && (vLeftRight.back().first >= i))
      {
        iMin = min(iMin, vLeftRight.back().second);
        vLeftRight.pop_back();
      }
      iRet = max(iRet, iMin - i);
    }
    return iRet;
  }
  int m_c;
};

2023年7月版

class Solution {
public:
int longestValidSubstring(string word, vector& forbidden) {
m_pHash = std::make_shared< CHashStr<>>(word,26);
std::unordered_set setCode[11];
for (const string& s : forbidden)
{
const int len = s.length();
CHashStr< > hash(s,26);
auto llCode = hash.GetHashExincludeRight(len);
setCode[len].emplace(llCode);
}
std::map mEndLen;
for (int i = 0; i < word.size(); i++)
{
for (int len = 1; len <= 10 ; len++)
{
const int end = i + len;
if (end > word.size())
{
continue;
}
int llCode = m_pHash->GetHashExincludeRight(i, end);
if (setCode[len].end() != setCode[len].find(llCode))
{
//目标串不能包括[1,i+len)
mEndLen[i+len] = len;
break;
}
}
}
int begin = 0;
int iMaxLen = 0;
for (const auto& it : mEndLen)
{
const int iCurLen = it.first - begin-1;
iMaxLen = max(iMaxLen, iCurLen);
begin = max(begin,it.first - it.second+ 1);
}
iMaxLen = max(iMaxLen, (int)word.size() - begin);
return iMaxLen;
}
std::shared_ptr< CHashStr<> > m_pHash;
};


扩展阅读

视频课程

有效学习:明确的目标 及时的反馈 拉伸区(难度合适),可以先学简单的课程,请移步CSDN学院,听白银讲师(也就是鄙人)的讲解。

https://edu.csdn.net/course/detail/38771

如何你想快

速形成战斗了,为老板分忧,请学习C#入职培训、C++入职培训等课程

https://edu.csdn.net/lecturer/6176

相关下载

想高屋建瓴的学习算法,请下载《喜缺全书算法册》doc版

https://download.csdn.net/download/he_zhidan/88348653

测试环境

操作系统:win7 开发环境: VS2019 C++17

或者 操作系统:win10 开发环境: VS2022 C++17

如无特殊说明,本算法用**C++**实现。

相关文章
|
7月前
|
存储 监控 算法
基于 C++ 哈希表算法实现局域网监控电脑屏幕的数据加速机制研究
企业网络安全与办公管理需求日益复杂的学术语境下,局域网监控电脑屏幕作为保障信息安全、规范员工操作的重要手段,已然成为网络安全领域的关键研究对象。其作用类似网络空间中的 “电子眼”,实时捕获每台电脑屏幕上的操作动态。然而,面对海量监控数据,实现高效数据存储与快速检索,已成为提升监控系统性能的核心挑战。本文聚焦于 C++ 语言中的哈希表算法,深入探究其如何成为局域网监控电脑屏幕数据处理的 “加速引擎”,并通过详尽的代码示例,展现其强大功能与应用价值。
173 2
|
8月前
|
存储 算法 C++
Windows共享文件:探秘C++实现的B树索引算法奇境
在数字化时代,Windows共享文件的高效管理至关重要。B树算法以其自平衡多路搜索特性,在文件索引与存储优化中表现出色。本文探讨B树在Windows共享文件中的应用,通过C++实现具体代码,展示其构建文件索引、优化数据存储的能力,提升文件检索效率。B树通过减少磁盘I/O操作,确保查询高效,为企业和个人提供流畅的文件共享体验。
|
5月前
|
C语言 C++
【实战指南】 C/C++ 枚举转字符串实现
本文介绍了在C/C++中实现枚举转字符串的实用技巧,通过宏定义与统一管理枚举名,提升代码调试效率并减少维护错误。
370 56
|
7月前
|
监控 算法 数据处理
基于 C++ 的 KD 树算法在监控局域网屏幕中的理论剖析与工程实践研究
本文探讨了KD树在局域网屏幕监控中的应用,通过C++实现其构建与查询功能,显著提升多维数据处理效率。KD树作为一种二叉空间划分结构,适用于屏幕图像特征匹配、异常画面检测及数据压缩传输优化等场景。相比传统方法,基于KD树的方案检索效率提升2-3个数量级,但高维数据退化和动态更新等问题仍需进一步研究。未来可通过融合其他数据结构、引入深度学习及开发增量式更新算法等方式优化性能。
197 17
|
5月前
|
存储 监控 算法
基于跳表数据结构的企业局域网监控异常连接实时检测 C++ 算法研究
跳表(Skip List)是一种基于概率的数据结构,适用于企业局域网监控中海量连接记录的高效处理。其通过多层索引机制实现快速查找、插入和删除操作,时间复杂度为 $O(\log n)$,优于链表和平衡树。跳表在异常连接识别、黑名单管理和历史记录溯源等场景中表现出色,具备实现简单、支持范围查询等优势,是企业网络监控中动态数据管理的理想选择。
164 0
|
6月前
|
存储 机器学习/深度学习 算法
基于 C++ 的局域网访问控制列表(ACL)实现及局域网限制上网软件算法研究
本文探讨局域网限制上网软件中访问控制列表(ACL)的应用,分析其通过规则匹配管理网络资源访问的核心机制。基于C++实现ACL算法原型,展示其灵活性与安全性。文中强调ACL在企业与教育场景下的重要作用,并提出性能优化及结合机器学习等未来研究方向。
180 4
|
6月前
|
机器学习/深度学习 存储 算法
基于 C++ 布隆过滤器算法的局域网上网行为控制:URL 访问过滤的高效实现研究
本文探讨了一种基于布隆过滤器的局域网上网行为控制方法,旨在解决传统黑白名单机制在处理海量URL数据时存储与查询效率低的问题。通过C++实现URL访问过滤功能,实验表明该方法可将内存占用降至传统方案的八分之一,查询速度提升约40%,假阳性率可控。研究为优化企业网络管理提供了新思路,并提出结合机器学习、改进哈希函数及分布式协同等未来优化方向。
202 0
|
8月前
|
存储 监控 算法
基于 C++ 哈希表算法的局域网如何监控电脑技术解析
当代数字化办公与生活环境中,局域网的广泛应用极大地提升了信息交互的效率与便捷性。然而,出于网络安全管理、资源合理分配以及合规性要求等多方面的考量,对局域网内计算机进行有效监控成为一项至关重要的任务。实现局域网内计算机监控,涉及多种数据结构与算法的运用。本文聚焦于 C++ 编程语言中的哈希表算法,深入探讨其在局域网计算机监控场景中的应用,并通过详尽的代码示例进行阐释。
176 4
|
9月前
|
存储 算法 安全
企业员工数据泄露防范策略:基于 C++ 语言的布隆过滤器算法剖析[如何防止员工泄密]
企业运营过程中,防范员工泄密是信息安全领域的核心议题。员工泄密可能致使企业核心数据、商业机密等关键资产的流失,进而给企业造成严重损失。为应对这一挑战,借助恰当的数据结构与算法成为强化信息防护的有效路径。本文专注于 C++ 语言中的布隆过滤器算法,深入探究其在防范员工泄密场景中的应用。
210 8
|
2月前
|
机器学习/深度学习 算法 机器人
【水下图像增强融合算法】基于融合的水下图像与视频增强研究(Matlab代码实现)
【水下图像增强融合算法】基于融合的水下图像与视频增强研究(Matlab代码实现)
257 0

热门文章

最新文章