正则表达式_2

简介: 学习自编程胶囊课程。

分组

() 是有分组提取功能的。如提取电话号码可以/(\d{4})\-(\d{7})/,就会把1111-1111111的电话号码提取为11111111111

如果想使用分组的功能,但是又不想提取,就可以使用(?:)。如提取电话号码/(?:\d{4})\-(\d{7})/,就只会提取出后七位1111111

分组使用示例:提取日期

日期格式各种各样,如:

2022-05-09

2022-5-9

20220509

2022 5 9

2022.05.09

统一提取这些不同格式日期的方法:用[]处理年月日分隔处可能出现的字符。

(\d{4})[\-\. ]?(\d{1,2})[\-\. ]?(\d{1,2})[]里的内容表示分隔符可能是-,.,空格,还可能没有(用?处理)。

(\d{1,2})表示月日可能1位或2位。

分组的回溯引用

对于刚才分组得到的数据,可以通过反向引用来获取。

如查询 abcabc 式的数据:/(abc)(\1)/.

查询abcdefdefabc:/(abc)(def)(\2)(\1)/.

先行断言

或者叫环视、预搜索。

正向先行断言

(?=表达式),指在某个位置向右看,表示所在位置右侧必须能匹配表达式

如:/我爱(?=你)表示我爱右边必须要有你。

检验密码中必须要有大写和小写字母:

(?=.*?[a-z])(?=.*?[A-Z]).+

检验密码中必须要有大写小写字母、数字,长度还要>=8:

(?=.*?[a-z])(?=.*?[A-Z])(?=.*?[0-9]).{8,}

反向先行断言

(?!表达式),指在某个位置向右看,表示所在位置右侧必须不匹配表达式

如:/我爱(?!你)表示我爱右边必须没有你。

正向后行断言

(?>=表达式),从右往左看。

如:(?<=我)爱你表示爱你左边必须有我。

反向后行断言

(?>!表达式)

如:(?<!我)爱你表示爱你左边必须没有我。

例题

匹配质数个x。如xx,xxx,xxxxx。

首先,质数只能被1和它自身整除。所以只需要排除掉可以被2整除,被3整除,被4整除……的数即可。也就是2以上的数字要重复出现两次以上。
出现2以上的数字次数的x是(..+),但是不能用(..+)+,因为+号并不保证每次括号内的字符数相同(可能是2+3+4+……)。所以要用\1反向引用(..+),再让\1重复出现1次以上,因此(..+)\1+就是任意一个>2的数* 任意一个>=2的数,涵盖了所有合数。
最后取反,再限制一下行首行尾就能得出所有质数。有一个小问题好像这样会把x也看做质数。

因此答案是:^(?!(..+)\1+$).

目录
相关文章
|
9月前
|
数据采集
正则表达式
正则表达式(Regular Expression)是一种强大的文本处理工具,用于匹配、查找、匹配或替换文本中的模式或特定字符组合。它由一系列特殊字符和普通字符组成,遵循预定义的规则来描述字符串中的模式。在处理网页数据时,正则表达式可以帮助从杂乱的数据中提取出需要的信息。
76 2
|
9月前
最全面的常用正则表达式大全
最全面的常用正则表达式大全
|
数据安全/隐私保护
关于正则表达式我所知道的
关于正则表达式我所知道的
111 0
|
数据采集 机器学习/深度学习 移动开发
我学会了,正则表达式
爬虫是**非常的**的强大,相信不少朋友都有所耳闻,它帮助我们更快地“获得”我们所要关键数据。那么,它怎么知道我们要需要什么内容?它又是如何工作的?在这篇文章里,我们一起来看看。
116 0
我学会了,正则表达式
最全的常用正则表达式大全
很多不太懂正则的朋友,在遇到需要用正则校验数据时,往往是在网上去找很久,结果找来的还是不很符合要求。所以我最近把开发中常用的一些正则表达式整理了一下,在这里分享一下。
1380 0
|
C#
正则表达式应用二
求一C#正则,获取HTML文本中id 或者name 为“formhash”的value值例子:正则为
933 0
|
机器学习/深度学习 C# Windows