正则表达式 RegExp【详解】

简介: 正则表达式 RegExp【详解】

正则表达式的定义和用途

正则表达式用于定义一些字符串的规则。计算机可以根据正则表达式,来检查一个字符串是否符合指定的规则,或者将字符串中符合规则的内容提取出来。

RegExp的意思是 Regular expression。使用typeof检查正则对象,会返回object。

创建正则表达式

方式一:使用构造函数创建

使用构造函数创建时,更加灵活,因为参数中还可以传递变量。

  var 变量 = new RegExp("正则表达式"); // 注意,参数是字符串
 
  var 变量 = new RegExp("正则表达式", "匹配模式"); // 注意,两个参数都是字符串

匹配模式作为第二个参数。这个参数可以是:

  • i 忽略大小写。这里的 i 指的是 ignore。
  • g 全局匹配模式。这里的 g 指的是 global。
var reg = new RegExp("a"); // 定义一个正则表达式:检查一个字符串中是否含有 a
 
var reg = new RegExp('A', 'i');
var str = 'qiangu';
 
console.log(reg.test(str)); // 打印结果:true

方式二:使用字面量创建

  var 变量 = /正则表达式/;  // 注意,这个语法里没有引号
 
  var 变量 = /正则表达式/匹配模式;  // 注意,这个语法里没有引号
  var reg = /A/i; // 定义正则表达式的规则:检查一个字符串中是否含有 a。忽略大小写。
  var str = "qiangu";
 
  console.log(typeof reg);  // 打印结果:object
  console.log(reg.test(str)); // 打印结果:true

正则表达式的语法

匹配字符

字符 描述
. 匹配任意单个字符除了换行符
[ ] [ ] 内为字符集,匹配 [ ] 内任一字符
[^ ] 匹配除了方括号里的任意字符
* 匹配 >= 0 个 * 号前的字符。
+ 匹配 >= 1 个+号前的字符。
? 匹配 0 或 1 个 ?号前的字符。
{n,m} 匹配n到m个大括号之前的字符或字符集
(xyz) 匹配与 xyz 完全相等的字符串
| 或运算符,匹配|符号前或后的字符
\s 匹配空格
\ 转义字符,匹配一些保留的字符 [ ] ( ) { } . * + ? ^ $ \ |
^ 从开始行开始匹配
$ 从末端开始匹配
  • /[ab]/ 等价于 /a|b/:检查一个字符串中是否包含 a或b
  • /[a-z]/:检查一个字符串那种是否包含任意小写字母
  • /[A-Z]/:任意大写字母
  • /[A-z]/:任意字母
  • /[0-9]/:任意数字
  • /a[bde]c/:检查一个字符串中是否包含 abc 或 adc 或 aec
  • [Tt]he 匹配 the 和 The
  • [^c]ar 匹配一个后面跟着ar的除了c的任意字符,如匹配par,不匹配car
  • [a-z]* 匹配一个行中所有以小写字母开头的字符串。
"[a-z]*" => The car parked in the garage
  • c.+t 匹配以首字母c开头以t结尾,中间跟着至少一个字符的字符串
"c.+t" => The fat cat sat on the mat
  • [T]?he 匹配字符串 he 和 The
  • [0-9]{2,3} 匹配最少 2 位最多 3 位 0~9 的数字
  • 可以省略第二个参数。 例如,[0-9]{2,} 匹配至少两位 0~9 的数字。
  • 逗号也省略掉则表示重复固定的次数。 例如,[0-9]{3} 匹配3位数字
  • (c|g|p)ar 匹配 car 或 gar 或 par
  • "(f|c|m)at\.?"t cat sat on the matthe garage.
  • "(T|t)he" => The car is parked in the garage.
  • "^(T|t)he" => The car is parked in the garage.

简写

简写 描述
\w 匹配所有字母数字,等同于 [a-zA-Z0-9_]
\W 匹配所有非字母数字,即符号,等同于: [^\w]
\d 匹配数字: [0-9]
\D 匹配非数字: [^\d]
\s 匹配所有空格字符,等同于: [\t\n\f\r\p{Z}]
\S 匹配所有非空格字符: [^\s]
\f 匹配一个换页符
\n 匹配一个换行符
\r 匹配一个回车符
\t 匹配一个制表符
\v 匹配一个垂直制表符
\p 匹配 CR/LF(等同于 \r\n),用来匹配 DOS 行终止符

模式修正符

标志 描述
i 忽略大小写。
g 全局搜索。
m 多行修饰符:锚点元字符 ^ $ 工作范围在每行的起始。
  • "/The/gi" => The fat cat sat on the mat.
  • "/.(at)/g" => The fat cat sat on the mat.
  • (^,$) 用于检查格式是否是在待检测字符串的开头或结尾。但我们如果想要它在每行的开头和结尾生效,我们需要用到多行修饰符 m。

贪婪匹配

正则表达式默认采用贪婪匹配模式,在该模式下意味着会匹配尽可能长的子串。

"/(.*at)/" => The fat cat sat on the mat.

惰性匹配

使用 ? 将贪婪匹配模式转化为惰性匹配模式。

"/(.*?at)/" => The fat cat sat on the mat.

断言

符号 描述
?= 正先行断言-存在
?! 负先行断言-排除
?<= 正后发断言-存在
?<! 负后发断言-排除

定义一个正先行断言要使用 ()。在括号内部使用一个问号和等号: (?=...)。正先行断言的内容写在括号中的等号后面。 例如,表达式 (T|t)he(?=\sfat) 匹配 The 和 the,在括号中我们又定义了正先行断言 (?=\sfat) ,即 The 和 the 后面紧跟着 (空格)fat。

"(T

"(T|t)he(?=\sfat)" => The fat cat sat on the mat.
  • 负先行断言 ?! 用于筛选出其后不跟随断言中定义的格式。表达式 (T|t)he(?!\sfat) 匹配 The 和 the,且其后不跟着 (空格)fat。
"(T|t)he(?!\sfat)" => The fat cat sat on the mat.
  • 正后发断言 记作(?<=...) 用于筛选所有匹配结果,筛选条件为 其前跟随着断言中定义的格式。 例如,表达式 (?<=(T|t)he\s)(fat|mat) 匹配 fat 和 mat,且其前跟着 The 或 the。
"(?<=(T|t)he\s)(fat|mat)" => The fat cat sat on the mat.
  • 负后发断言 记作 (?<!...) 用于筛选所有匹配结果,筛选条件为 其前不跟随着断言中定义的格式。 例如,表达式 (?<!(T|t)he\s)(cat) 匹配 cat,且其前不跟着 The 或 the。
"(?<!(T|t)he\s)(cat)" => The cat sat on cat.

正则表达式的使用

判断字符串是否符合规则 test()

符合则返回true,否则返回false。

  var reg = /[^ab]/; // 规则:字符串中,除了a、b之外,还有没有其他的字符内容?
  var str = "acb";
 
  console.log(reg.test(str)); // 打印结果:true
  var reg = /[^0-9]/;  // 规则:字符串中,除了数字之外,还有没有其他的内容?
  var str1 = "1991";
  var str2 = "199a1";
 
  console.log(reg.test(str1)); // 打印结果:false (如果字符串是 纯数字,则返回 false)
  console.log(reg.test(str2)); // 打印结果:true

搜索第一个符合条件的字符串 search()

search()【只会查找第一个】——搜索字符串中是否含有指定内容。如果搜索到指定内容,则会返回第一次出现的索引;否则返回-1。

  var str = "hello abc hello aec afc";
  // 搜索字符串中是否含有abc 或 aec 或 afc
  result = str.search(/a[bef]c/);
  console.log(result); // 打印结果:6

搜索所有符合条件的字符串 match()

从一个字符串中将符合条件的内容提取出来,封装到一个数组中返回(即使只查询到一个结果)。

默认情况下,match()方法只会找到第一个符合要求的内容,设置正则表达式为全局匹配模式,这样就会匹配到所有的内容,并以数组的形式返回。

可以为一个正则表达式设置多个匹配模式,且匹配模式的顺序无所谓。

  var str = "1a2a3a4a5e6f7A8B9C";
 
  var result1 = str.match(/[a-z]/);   // 找到符合要求的第一个内容,然后返回
  var result2 = str.match(/[a-z]/g);  // 设置为“全局匹配”模式,匹配字符串中 所有的小写字母
  var result3 = str.match(/[a-z]/gi); // 设置多个匹配模式,匹配字符串中 所有的字母(忽略大小写)
 
  console.log(result1); // 打印结果:["a"]
  console.log(result2); // 打印结果:["a", "a", "a", "a", "e", "f"]
  console.log(result3); // 打印结果:["a", "a", "a", "a", "e", "f", "A", "B", "C"]

字符串拆分成数组 split()

  var str = "1a2b3c4d5e6f7g";
  var result = str.split(/[A-z]/); // 参数是一个正则表达式:表示所有字母
  console.log(result); //  ["1", "2", "3", "4", "5", "6", "7", ""]

字符串替换 replace()

默认只会替换第一个,如果需要替换全部符合条件的内容,可以设置正则表达式为全局匹配模式。

let str1 = '2020/5/20'
console.log(str1.replace(/\//g,"-"));  //得到 2020-5-20
   
var str2 = "Today is fine day,today is fine day !!!"
console.log(str2.replace("today","tomorrow"));  //只能替换第一个today
console.log(str2.replace(/today/gi,"tomorrow")); //这里用到了正则,且为“全局匹配”模式,才能替换所有的today

过滤HTML标签

str.replace(/<.*?>/g, "")

去除空格

  str = str.replace(/^\s*/, ""); //去除开头的空格
 
  str = str.replace(/\s*$/, ""); //去除结尾的空格

常用正则表达式

常用正则表达式大全

最全的常用正则表达式大全——包括校验数字、字符、一些特殊的需求等等 - zxin - 博客园

非零数字(只能输入数字,但值不能为0,可以是00,01等)

/^([0]{2}|0[1-9]|[1-9])\d*$/

验证保留两位小数的正整数或0

/^([1-9]\d*|0)(\.\d{1,2})?$/

验证手机号码,如13908653654

/^(1[3|5|7|8][0-9]{9})$/

验证固定号码,如010-86551122或01086551122

/^((0\d{2,3})[-]?)(\d{7,8})([-]?(\d{3,}))?$/

验证电话号码—手机号码或固定号码,如13908653654或010-86551122或01086551122

/(^(1[3|5|7|8][0-9]{9})$)|(^((0\d{2,3})[-]?)(\d{7,8})([-]?(\d{3,}))?$)/

验证一代身份证号码

/^\d{8}(0\d|10|11|12)([0-2]\d|30|31)\d{3}$/

验证二代身份证号码

/^\d{6}(18|19|20)\d{2}(0\d|10|11|12)([0-2]\d|30|31)\d{3}[\dXx]$/

验证通用身份证号码

/(^\d{8}(0\d|10|11|12)([0-2]\d|30|31)\d{3}$)|(^\d{6}(18|19|20)\d{2}(0\d|10|11|12)([0-2]\d|30|31)\d{3}(\d|X|x)$)/


目录
相关文章
|
JavaScript 前端开发
JS正则表达式:常用正则手册/RegExp/正则积累(一)
JS正则表达式:常用正则手册/RegExp/正则积累
136 1
|
存储 JavaScript 安全
JS正则表达式:常用正则手册/RegExp/正则积累(二)
JS正则表达式:常用正则手册/RegExp/正则积累
116 0
|
8月前
|
XML JavaScript 前端开发
【JavaScript | RegExp】正则表达式
【JavaScript | RegExp】正则表达式
87 4
|
8月前
|
机器学习/深度学习 Python
正则表达式(Regular Expression,常简写为regex或regexp)是一种强大的文本处理工具
【5月更文挑战第12天】正则表达式是文本处理工具,Python的re模块支持其使用。元字符如.、*、+、?等在正则表达式中具有特殊含义,用于指定匹配规则。示例中,通过正则表达式模式匹配字符串中的电子邮件地址,并使用re.findall()找出所有匹配项。
95 4
|
SQL 关系型数据库 MySQL
解密MySQL中强大的武器——REGEXP正则表达式
家人们,今天我来为大家介绍一项在 MySQL 中非常强大的武器——`REGEXP`正则表达式。MySQL 作为一款广泛使用的关系型数据库管理系统,其内置的 REGEXP 关键字为我们提供了强大的正则表达式功能,使得我们可以更加灵活和高效地进行数据匹配和处理
134 0
解密MySQL中强大的武器——REGEXP正则表达式
|
8月前
|
安全
正则表达式(Regular Expression,简称regex或regexp)
正则表达式(Regular Expression,简称regex或regexp)
234 2
|
8月前
|
数据采集 监控 Go
掌握Go语言正则表达式:regexp包全面解析
掌握Go语言正则表达式:regexp包全面解析
260 0
|
8月前
|
人工智能 JavaScript
js正则表达式new RegExp(表达式, “gi“)不区分大小写、忽略大小写匹配替换字符
js正则表达式new RegExp(表达式, “gi“)不区分大小写、忽略大小写匹配替换字符
|
存储 前端开发 Go
golang正则表达式regexp
golang正则表达式regexp
310 0
4.4、RegExp正则表达式对象
4.4、RegExp正则表达式对象
112 0
4.4、RegExp正则表达式对象