软件测试|带你了解Python正则表达式模块(二)

简介: 软件测试|带你了解Python正则表达式模块(二)

前言

上篇文章我们讲解了Python re模块的简单使用,本篇文章我们将讲解re模块更高级的用法。

正则表达式量词符号与组

在这里插入图片描述
在这里插入图片描述

组的概念

符号 描述
() 在匹配规则中获取指定数据

贪婪与非贪婪

匹配分为贪婪匹配与非贪婪匹配

  • 0次或多次属于贪婪模式
  • 通过?组合变成非贪婪模式

正则表达式-re模块的函数

  1. findall()

查找字符串中所有(非重复)出现的正则表达式模式,并返回一个匹配列表
语法示例:

findall(pattern, string [,flags])

示例如下:

import re

sentence = 'hello muller, where are you from'
print(re.findall('from\Z', sentence))

print(re.findall('ffrom\Z', sentence))

--------------------------------
输出结果如下:
['from']
[]
  1. search()

使用可选标记搜索字符串中第一次岀现的正则表达式模式。如果匹配成功,则返回匹配对象;如果失败,则返回None
语法示例:

search(pattern, string, flags=0)

示例如下:

import re

sectence = 'i like play football'
result = re.search('(.*) (.*?) (.*)',sectence)
if result:
    print('result.group() :',result.group())
    print('result.group() :',result.group(1))
    print('result.group() :',result.group(2))
    print('result.group() :',result.group(3))
else:
  print('no match!')

------------------------------------------
输出结果如下;
result.group() : i like play football
result.group() : i like
result.group() : play
result.group() : football
  1. group()与groups()
  • group(num)返回整个匹配对象,或者编号为num的特定子组
  • groups():返回一个包含所有匹配子组的元组(如果没有成功匹配,则返回一个空元组)

代码示例如下:

import re

sectence = 'hello messi, i am muller'
result = re.search('hello (.*), i am (.*)', sectence)
print(result.groups())
print(result.group(1))
print(result.group(2))
-----------------------
输出结果如下:
('messi', 'muller')
messi
muller
  1. split()正则替换

根据正则表达式的模式分隔符,split函数将字符串分割为列表,然后返回成功匹配的列表,分隔最多操作max次(默认分割所有匹配成功的位置)
语法如下:

split(pattern, string, max=0)

示例如下:

import re

s = "Long live the PRC"
result1 = re.split("\s", s)
print(result1)

result2 = re.split("\s", s, 3)  # 通过指定 maxsplit 参数来控制出现次数
print(result2)

result3 = re.split("USA", s)
print(result3)
---------------------------------
输出结果如下:
['Long', 'live', 'the', 'PRC']
['Long', 'live', 'the', 'PRC']
['Long live the PRC']
  1. match()

使用带有可选的标记的正则表达式的模式来匹配字符串。如果匹配成功,就返回匹配对象;如果失败,就返回None
语法如下:

match(pattern, string, flags=0)

示例如下:

import re

data = 'hello world'
result = re.match('hello', data)
print(result.group())
------------------
输出结果如下:
hello

总结

本文介绍了re模块的几个常用函数,对Python内置的re模块的介绍就到这里了,后续我们将介绍其他模块的内容,敬请期待哈!

相关文章
|
2月前
|
SQL 关系型数据库 数据库
Python SQLAlchemy模块:从入门到实战的数据库操作指南
免费提供Python+PyCharm编程环境,结合SQLAlchemy ORM框架详解数据库开发。涵盖连接配置、模型定义、CRUD操作、事务控制及Alembic迁移工具,以电商订单系统为例,深入讲解高并发场景下的性能优化与最佳实践,助你高效构建数据驱动应用。
372 7
|
2月前
|
监控 安全 程序员
Python日志模块配置:从print到logging的优雅升级指南
从 `print` 到 `logging` 是 Python 开发的必经之路。`print` 调试简单却难维护,日志混乱、无法分级、缺乏上下文;而 `logging` 支持级别控制、多输出、结构化记录,助力项目可维护性升级。本文详解痛点、优势、迁移方案与最佳实践,助你构建专业日志系统,让程序“有记忆”。
268 0
|
2月前
|
JSON 算法 API
Python中的json模块:从基础到进阶的实用指南
本文深入解析Python内置json模块的使用,涵盖序列化与反序列化核心函数、参数配置、中文处理、自定义对象转换及异常处理,并介绍性能优化与第三方库扩展,助你高效实现JSON数据交互。(238字)
397 4
|
2月前
|
Java 调度 数据库
Python threading模块:多线程编程的实战指南
本文深入讲解Python多线程编程,涵盖threading模块的核心用法:线程创建、生命周期、同步机制(锁、信号量、条件变量)、线程通信(队列)、守护线程与线程池应用。结合实战案例,如多线程下载器,帮助开发者提升程序并发性能,适用于I/O密集型任务处理。
297 0
|
2月前
|
XML JSON 数据处理
超越JSON:Python结构化数据处理模块全解析
本文深入解析Python中12个核心数据处理模块,涵盖csv、pandas、pickle、shelve、struct、configparser、xml、numpy、array、sqlite3和msgpack,覆盖表格处理、序列化、配置管理、科学计算等六大场景,结合真实案例与决策树,助你高效应对各类数据挑战。(238字)
210 0
Python 内置正则表达式库re的使用
正则表达式是记录文本规则的代码,用于查找和处理符合特定规则的字符串。在Python中,常通过原生字符串`r'string'`表示。使用`re.compile()`创建正则对象,便于多次使用。匹配字符串有`match()`(从开头匹配)、`search()`(搜索首个匹配)和`findall()`(找所有匹配)。替换字符串用`sub()`,分割字符串则用`split()`。
|
数据库 Python
Python网络数据抓取(8):正则表达式
Python网络数据抓取(8):正则表达式
|
自然语言处理 JavaScript 前端开发
Python高级语法与正则表达式(二)
正则表达式描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。
|
安全 算法 Python
Python高级语法与正则表达式(一)
Python提供了 with 语句的写法,既简单又安全。 文件操作的时候使用with语句可以自动调用关闭文件操作,即使出现异常也会自动关闭文件操作。
Python使用正则表达式分割字符串
在Python中,你可以使用re模块的split()函数来根据正则表达式分割字符串。这个函数的工作原理类似于Python内置的str.split()方法,但它允许你使用正则表达式作为分隔符。

推荐镜像

更多