文档备案控制台

开发者社区问答正文

python re搜索语法以识别分布在多行上的文本模式

我最近开始使用python和正则表达式。作为第一个项目，我想读取pdf文件，过滤特定的文本数据并在Excel工作表中重新组合。因此，我遇到了一个正则表达式问题：

pdf文件输出格式：

...

此行的文本并不总是在这里\ n

这里的社区可以帮助您解决特定的编码，算法或语言问题。\ n

总结\ n

问 \ n

此行的文本并不总是在这里\ n

...

我想搜索“询问”并通过“特定编码”和“ \ nSummarize \ n”找到它。“询问”下面的文本不能始终可靠地使用，因为它总是不同的。

我试图为此使用（？= ...）和（？<= ...），但我找不到合适的解决方案。

也许我做错了。有人知道吗？

展开

收起

几许相思几点泪 2019-12-29 19:47:09 1101 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

几许相思几点泪
如果要查找ask，可以使用捕获组代替环顾四周。您可以匹配specific coding该行的其余部分.*

如果其后有空行和换行符，则可以使用它们\s*进行匹配。

然后匹配换行符，然后再匹配Summarize。

再次匹配空行和换行符，然后ask在捕获组中捕获
```
\bspecific coding\b.*\s*\r?\nSummarize\s*\r?\n(ask)\b
```
2019-12-29 19:47:24

赞同展开评论

问答分类：

算法 Python

问答标签：

Python文本 Python模式 Python分布 Python搜索 Python语法

问答地址：

开发者社区 > 人工智能 > 问答

相关问答

通义灵码IDE究竟如何手工设置基于python代码构建的mcp服务器？传输模式是STDIO。

185

2

0

阿里函数计算中，需要自己构建一个docker的包括支持支持Steam模式的python服务吗？

155

2

0

阿里函数计算中下python如何支持Stream模式？

175

2

0

使用MaxCompute Python SDK（PyODPS）时to_pandas 就不是集群模式?

235

1

0

函数计算FC下的python类型的事件函数，如果启用异步模式？有示例吗？

168

1

0

你们现在有python + pyomo + mindopt这种模式吗？

143

2

0

DataWorks提示识别不到python自带的库，怎么安装需要的库？

84

1

0

使用阿里云语音AI官方文档中python SDK 一句话识别遇到了点问题，怎么解决？

155

1

0

函数计算serverless docker模式python程序，运行后台服务任务不运行，怎么解决？

134

0

0

文字识别OCR里python的demo，怎么上传一张图片拿到识别结果啊?

286

3

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

如何在阿里云服务器上部署网站？2026年阿里云服务器怎么选？

部署OpenClaw多少钱？2026年阿里云 OpenClaw（Clawdbot）怎么部署及收费标准

阿里云百炼Coding Plan是什么意思？

有传言通义灵码不再增加新功能了，是这样吗？

OpenClaw（原Clawdbot）阿里云一键部署后，2026年有哪些应用场景可用到？

相关文章

手把手教你用 Python 调用 GPT-4o 接口，实现 UI 自动化脚本的自动修复

OpAgent：登顶WebArena的多模态Web GUI Agent

抖音弹幕游戏开发之第5集：接收第一条弹幕消息·优雅草云桧·卓伊凡

抖音弹幕游戏开发之第6集：解析JSON数据·优雅草云桧·卓伊凡

2026年阿里云OpenClaw(Clawdbot)部署简单步骤教程

还有其他疑问?