【MySQL】不允许你不会用正则表达式进行搜索(一)

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: 【MySQL】不允许你不会用正则表达式进行搜索(一)

🎬 博客主页:博主链接

🎥 本文由 M malloc 原创,首发于 CSDN🙉

🎄 学习专栏推荐:LeetCode刷题集!

🏅 欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正!

📆 未来很长,值得我们全力奔赴更美好的生活✨

a6c0473e16e249c2b9ca02e5b793f35e.gif

1aabda9202314c9ab0c9028570866fda.png

😇MySQL的前情介绍

😁大家好呀,今天是我第N次写MySQL,也是最近才学习MySQL,也想着记录一下自己的学习过程,并且分享给大家尼!

😇本章详情

🐤本文章将学习如何在MySQL WHERE子句内使用正则表达式来更好地控制数据过滤。

😇正则表达式介绍

前言

🌹在前两篇文章中的过滤例子允许用匹配、比较和通配操作符寻找数据。对于基本的过滤(或者甚至是某些不那么基本的过滤),这样就足够了。但随着过滤条件的复杂性的增加,WHERE子句本身的复杂性也有必要增加。

🌹这也就是正则表达式变得有用的地方。正则表达式是用来匹配文本的特殊的串(字符集合)。如果你想从一个文本文件中提取电话号码,可以使用正则表达式。如果你需要查找名字中间有数字的所有文件,可以使用一个正则表达式。如果你想在一个文本块中找到所有重复的单词,可以使用一个正则表达式。如果你想替换一个页面中的所有URL为这些URL的实际HTML链接也可以使用一个正则表达式(对于最后这个例子或者是两个正则表达式)。

🌹所有种类的程序设计语言、文本编辑器、操作系统等都支持正则表达式。有见识的程序员和网络管理员已经关注作为他们技术工具重要内容的正则表达式很长时间了。

🌹正则表达式用正则表达式语言来建立,正则表达式语言是用来完成刚讨论的所有工作以及更多工作的一种特殊语言。与任意语言一样,正则表达式具有你必须学习的特殊的语法和指令。

😇使用MySQL正则表达式

💐那么,正则表达式与MySQL有何关系?在上述前言已经说过,正则表达式的作用是匹配文本,将一个模式(正则表达式)与一个文本串进行比较。MySQL用WHERE子句对正则表达式提供了初步的支持,允许你指定正则表达式过滤SELECT检索出的数据

仅为正则表达式语言的一个子集

💐如果你熟悉正则表达式,需要注意:MySOL仅支持多数正则表达式实现的一个很小的子集。本章介绍MySOL支持的大多数内容。

举例子分析

💐 我们从一个非常简单的例子开始。下面的语句检索列prod_name包含文本1000的所有行:

输入

SELECT prod_name FROM products
  WHERE prod_name REGEXP '1000'
    ORDER BY prod_name;

分析

🌱除关键字LIKE被REGEXP替代外,这条语看上去非常像使用LIKE的语句。它告诉MySQL: REGEXP后所跟的东西作为正则表达式**(与文字正文1000匹配的一个正则表达式)**处理。

输出

0981f7bcdd12433aadcc444ea3471b3b.png

🌻**为什么要费力地使用正则表达式?**在刚才的例子中,正则表达式确实没有带来太多好处(可能还会降低性能),不过,请考虑下面的例子:

输入

SELECT prod_name FROM products
  WHERE prod_name REGEXP '.000'
    ORDER BY prod_name;

输出


e99c19d51e694723863b2e06e18830da.png

分析

这里使用了正则表达式.000。.是正则表达式语言中一个特殊的字符。它表示匹配任意一个字符,因此,1000和2000都匹配且返回

匹配不区分大小写

MySQL中的正则表达式匹配(自版本3.23.4后)不区分大小写(即,大写和小写都匹配)为区分大小写,可使用BINARY关键字,如WHERE prod_name REGEXP BINARY ‘JetPack .000’

😇进行OR匹配

搜索两个串之一(或者为这个串,或者为另一个串),使用|,如下所示:

输入

SELECT prod_name FROM products
  WHERE prod_name REGEXP '1000|2000'
    ORDER BY prod_name;

输出

4c331a580c6c4fa2aeec963571506bab.png

分析

语句中使用了正则表达式1000|2000。|为正则表达式的OR操作符。它表示匹配其中之一,因此1000和2000都匹配并返回

注意

🌼使用|从功能上类似于在SELECT语句中使用OR语句,多个OR条件可并入单个正则表达式。

两个以上的OR条件

例如两个以上的OR条件1000 | 2000 | 3000将匹配1000或2000或3000

😇匹配几个字符之一

匹配任何单一字符。但是,如果你只想匹配特定的字符,怎么办?可通过指定一组用[和]括起来的字符来完成,如下所示:

输入

SELECT prod_name FROM products
  WHERE prod_name REGEXP '[123] Ton'
    ORDER BY prod_name;

输出

471285f471674029918110fdbac06843.png

分析

这里,使用了正则表达式[123] Ton。[123]定义一组字符它的意思是匹配1或2或3,因此,1 ton和2 ton都匹配且返回(没有3 ton)。

正如所见,[]是另一种形式的OR语句。事实上,正则表达式[123]Ton为[1|2|3]Ton的缩写,也可以使用后者。但是,需要用[]来定义OR语句查找什么。为更好地理解这一点,请看下面的例子:

输入

SELECT prod_name FROM products
  WHERE prod_name REGEXP '1|2|3 Ton'
    ORDER BY prod_name;

输出

a87f8d9f7e87456195294b0ad81a3ff7.png

分析

这并不是期望的输出。两个要求的行被检索出来,但还检索出了另外3行。之所以这样是由于MySQL假定你的意思是1或2或3 ton’。除非把字符1括在一个集合中,否则它将应用于整个串

字符集合也可以被否定,即,它们将匹配除指定字符外的任何东西为否定一个字符集,在集合的开始处放置一个^即可。因此,尽管[123]匹配字符1、2或3,但[ ^123]却匹配除这些字符外的任何东西。

😇匹配范围

提示

集合可用来定义要匹配的一个或多个字符。例如,下面的集合将匹配数字0到9:[0123456789]

  1. 为简化这种类型的集合,可使用-来定义一个范围。下面的式子功能上等同于上述数字列表:[0-9]
  2. 范围不限于完整的集合,[1-3]和[6-9]也是合法的范围。此外,范围不一定只是数值的,[a-z]匹配任意字母字符。
相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
4月前
|
关系型数据库 MySQL
MySQL 保姆级教程(七):用正则表达式进行搜索
MySQL 保姆级教程(七):用正则表达式进行搜索
|
5月前
|
SQL 关系型数据库 MySQL
MySQL通配符和正则表达式
MySQL通配符和正则表达式
48 1
|
5月前
|
关系型数据库 MySQL
9. Mysql 模糊查询和正则表达式
9. Mysql 模糊查询和正则表达式
131 1
|
5月前
|
关系型数据库 MySQL
MySQL中如何处理NULL值以及如何使用正则表达式
MySQL中如何处理NULL值以及如何使用正则表达式
|
5月前
|
Java 程序员
JavaSE——正则表达式(2/2):应用案例、查找信息、用于搜索替换、分割内容
JavaSE——正则表达式(2/2):应用案例、查找信息、用于搜索替换、分割内容
25 0
|
6月前
|
Rust 监控 安全
【专栏】`ripgrep`(rg)是Linux下快速、内存高效的文本搜索工具,用Rust编写,支持PCRE2正则表达式
【4月更文挑战第28天】`ripgrep`(rg)是Linux下快速、内存高效的文本搜索工具,用Rust编写,支持PCRE2正则表达式。相比`grep`,它在处理大文件和复杂模式时更具优势。安装`rg`可通过软件包管理器,如在Debian系系统中使用`sudo apt install ripgrep`。基本用法包括简单搜索、递归搜索、忽略大小写、显示行号等。高级功能包括固定字符串搜索、多文件匹配、并行搜索、排除选项和区域搜索。适用于日志分析、代码审查等场景,是提升工作效率的利器。
508 4
|
6月前
|
运维 Unix Linux
grep正则表达式搜索
grep正则表达式搜索
52 3
|
6月前
|
关系型数据库 MySQL
Mysql基础第二十一天,全文本搜索
Mysql基础第二十一天,全文本搜索
49 0
|
5月前
|
数据库 Python
Python网络数据抓取(8):正则表达式
Python网络数据抓取(8):正则表达式
51 2
|
5月前
|
自然语言处理 JavaScript 前端开发
Python高级语法与正则表达式(二)
正则表达式描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。