Python编程:re正则库基本使用

简介: Python编程:re正则库基本使用

正则字符集

# 字符集

\w 匹配字母数字及下划线
\W 匹配非字母数字及下划线
\s 匹配任意空白字符,等价于[\n\t\r\f]
\S 匹配任意非空字符
\d 匹配任意数字,等价于[0-9]
\D 匹配任意非数字
\A 匹配字符串开始
\Z 匹配字符串结束,如果是换行,只匹配到换行前的结束字符串
\z 匹配字符串结束
\G 匹配最后匹配完成的位置
\n 匹配一个换行符
\t 匹配一个制表符
[...] 匹配一组字符,单独列出,[abc]匹配a,b或c
[^...] 匹配不在其中的字符
# 数量控制
a|b  匹配a或b
^  匹配字符串的开头
$  匹配字符串的末尾
.  匹配任意字符,除了换行符, 指定re.DOTALL 匹配包括换行符的任意字符
*  零个或多个表达式
+  一个或多个表达式
?  零个或一个表达式,非贪婪匹配
{n} 匹配n个表达式
{n, m}匹配n~m次表达式,贪婪匹配
()  匹配括号内的表达式,表示组

代码实例

import re
# match从头开始匹配
# 常规匹配
content = "fsadf5666asd"
ret = re.match("\w+", content)
print(len(content))
print(ret)
print(ret.group())
print(ret.span())
"""
12
<_sre.SRE_Match object; span=(0, 12), match='fsadf5666asd'>
fsadf5666asd
(0, 12)
"""
# 泛匹配
ret = re.match(".*", content)
print(ret)
# <_sre.SRE_Match object; span=(0, 8), match='fsadfasd'>
# 目标匹配
ret = re.match("[a-z]+(\d+)", content)
print(ret)
print(ret.group())
print(ret.group(0))
print(ret.group(1))
"""
<_sre.SRE_Match object; span=(0, 9), match='fsadf5666'>
fsadf5666
fsadf5666
5666
"""
# 贪婪匹配
ret =  re.match(".*(\d+)", content)
print(ret)
print(ret.group(0))
print(ret.group(1))
"""
<_sre.SRE_Match object; span=(0, 9), match='fsadf5666'>
fsadf5666
6
"""
# 非贪婪匹配
ret =  re.match(".*?(\d+)", content)
print(ret)
print(ret.group(0))
print(ret.group(1))
"""
<_sre.SRE_Match object; span=(0, 9), match='fsadf5666'>
fsadf5666
5666
"""
# 匹配模式
content = """sadfasd34345sdfa
sdfasdf"""
# 匹配换行符
ret =  re.match(".*?(\d+).*", content, re.S)
print(ret)
print(ret.group(1))
"""
<_sre.SRE_Match object; span=(0, 24), match='sadfasd34345sdfa\nsdfasdf'>
34345
"""
# 转义
content = "sdfasdf$55.334"
# 匹配换行符
ret =  re.match(".*?(\$\d+\.\d+)", content, re.S)
print(ret)
print(ret.group(1))
"""
<_sre.SRE_Match object; span=(0, 14), match='sdfasdf$55.334'>
$55.334
"""
# 总结:
# 尽量使用泛匹配,使用括号得到匹配目标,
# 尽量使用非贪婪模式,有换行符就用re.S
# search扫描整个字符串
# 能用search就不用match
content = "fsadf5666asd"
ret = re.match("\d+", content)
print(ret)
ret = re.search("\d+", content)
print(ret)
"""
None
<_sre.SRE_Match object; span=(5, 9), match='5666'>
"""
# findall 找到所有
content = "fsadf5666asd234"
ret = re.findall("\d+", content)
print(ret)
# ['5666', '234']
# sub 替换字符串
content = "fsadf5666asd234"
ret = re.sub("\d+", "", content)
print(ret)
# fsadfasd
# compile 编译成正则对象,便于复用
content = "fsadf5666asd234"
pattern = re.compile("\d+")
ret = pattern.findall(content)
print(ret)
# ['5666', '234']



相关文章
|
3月前
|
监控 数据可视化 数据挖掘
Python Rich库使用指南:打造更美观的命令行应用
Rich库是Python的终端美化利器,支持彩色文本、智能表格、动态进度条和语法高亮,大幅提升命令行应用的可视化效果与用户体验。
271 0
|
3月前
|
数据采集 机器学习/深度学习 人工智能
Python:现代编程的首选语言
Python:现代编程的首选语言
319 102
|
2月前
|
数据可视化 关系型数据库 MySQL
【可视化大屏】全流程讲解用python的pyecharts库实现拖拽可视化大屏的背后原理,简单粗暴!
本文详解基于Python的电影TOP250数据可视化大屏开发全流程,涵盖爬虫、数据存储、分析及可视化。使用requests+BeautifulSoup爬取数据,pandas存入MySQL,pyecharts实现柱状图、饼图、词云图、散点图等多种图表,并通过Page组件拖拽布局组合成大屏,支持多种主题切换,附完整源码与视频讲解。
273 4
【可视化大屏】全流程讲解用python的pyecharts库实现拖拽可视化大屏的背后原理,简单粗暴!
|
2月前
|
传感器 运维 前端开发
Python离群值检测实战:使用distfit库实现基于分布拟合的异常检测
本文解析异常(anomaly)与新颖性(novelty)检测的本质差异,结合distfit库演示基于概率密度拟合的单变量无监督异常检测方法,涵盖全局、上下文与集体离群值识别,助力构建高可解释性模型。
345 10
Python离群值检测实战:使用distfit库实现基于分布拟合的异常检测
|
2月前
|
Python
Python编程:运算符详解
本文全面详解Python各类运算符,涵盖算术、比较、逻辑、赋值、位、身份、成员运算符及优先级规则,结合实例代码与运行结果,助你深入掌握Python运算符的使用方法与应用场景。
219 3
|
2月前
|
数据处理 Python
Python编程:类型转换与输入输出
本教程介绍Python中输入输出与类型转换的基础知识,涵盖input()和print()的使用,int()、float()等类型转换方法,并通过综合示例演示数据处理、错误处理及格式化输出,助你掌握核心编程技能。
483 3
|
2月前
|
并行计算 安全 计算机视觉
Python多进程编程:用multiprocessing突破GIL限制
Python中GIL限制多线程性能,尤其在CPU密集型任务中。`multiprocessing`模块通过创建独立进程,绕过GIL,实现真正的并行计算。它支持进程池、队列、管道、共享内存和同步机制,适用于科学计算、图像处理等场景。相比多线程,多进程更适合利用多核优势,虽有较高内存开销,但能显著提升性能。合理使用进程池与通信机制,可最大化效率。
301 3
|
2月前
|
Java 调度 数据库
Python threading模块:多线程编程的实战指南
本文深入讲解Python多线程编程,涵盖threading模块的核心用法:线程创建、生命周期、同步机制(锁、信号量、条件变量)、线程通信(队列)、守护线程与线程池应用。结合实战案例,如多线程下载器,帮助开发者提升程序并发性能,适用于I/O密集型任务处理。
312 0
|
安全 测试技术 数据库
Python编程--sys模块及OS模块简单用例
Python编程--sys模块及OS模块简单用例
189 1
|
JSON 数据格式 Python
Python编程:利用JSON模块编程验证用户
Python编程:利用JSON模块编程验证用户
117 1

推荐镜像

更多