如何在 Python 中找到正则表达式的所有匹配项?

2024-12-09 08:30:00
admin
原创
91
摘要:问题描述:当我使用该re.search()函数在文本块中查找匹配项时,一旦找到文本块中的第一个匹配项,程序就会退出。我该如何重复执行此操作,直到找到所有匹配项后程序才会停止?是否有单独的函数可以执行此操作?解决方案 1:使用re.findall或re.finditer代替。re.findall(pattern...

问题描述:

当我使用该re.search()函数在文本块中查找匹配项时,一旦找到文本块中的第一个匹配项,程序就会退出。

我该如何重复执行此操作,直到找到所有匹配项后程序才会停止?是否有单独的函数可以执行此操作?


解决方案 1:

使用re.findallre.finditer代替。

re.findall(pattern, string)返回匹配字符串的列表。

re.finditer(pattern, string)返回对象的迭代器MatchObject

例子:

re.findall( r'all (.*?) are', 'all cats are smarter than dogs, all dogs are dumber than cats')
# Output: ['cats', 'dogs']

[x.group() for x in re.finditer( r'all (.*?) are', 'all cats are smarter than dogs, all dogs are dumber than cats')]
# Output: ['all cats are', 'all dogs are']

解决方案 2:

另一种方法(虽然已经过去了 13 年,但仍然与 OP 的初衷保持一致)是编译模式并调用search()已编译的模式并沿着模式移动。这有点冗长,但如果您不想进行前瞻等操作,或者想要更明确地搜索字符串,则可以使用以下函数。

import re

def find_all_matches(pattern, string, group=0):
    pat = re.compile(pattern)
    pos = 0
    out = []
    while m := pat.search(string, pos):
        pos = m.start() + 1
        out.append(m[group])
    return out

pat = r'all (.*?) are'
s = 'all cats are smarter than dogs, all dogs are dumber than cats'
find_all_matches(pat, s)           # ['all cats are', 'all dogs are']
find_all_matches(pat, s, group=1)  # ['cats', 'dogs']

这也适用于重叠匹配:

find_all_matches(r'(ww)', "hello")  # ['he', 'el', 'll', 'lo']

解决方案 3:

如果您有兴趣获取所有匹配项(包括重叠匹配项,与@Amber 的答案不同),有一个名为REmatch 的新库,它专门用于生成文本上正则表达式的所有匹配项,包括所有重叠匹配项。该工具支持一种更通用的带有捕获的正则表达式语言,称为 REQL。

例如,正则表达式!x{...}将给出三个连续字符的所有三元组(包括重叠三元组)。

该方法应该比@cottontail 的答案(在输入字符串中是一般二次函数)更有效。

您可以在此处在线尝试 REmatch ,并在此处获取 Python 代码。

免责声明:我认识该工具的作者。:)

相关推荐
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   990  
  在项目管理领域,CDCP(Certified Data Center Professional)认证评审是一个至关重要的环节,它不仅验证了项目团队的专业能力,还直接关系到项目的成功与否。在这一评审过程中,沟通技巧的运用至关重要。有效的沟通不仅能够确保信息的准确传递,还能增强团队协作,提升评审效率。本文将深入探讨CDCP...
华为IPD流程   26  
  IPD(Integrated Product Development,集成产品开发)是一种以客户需求为核心、跨部门协同的产品开发模式,旨在通过高效的资源整合和流程优化,提升产品开发的成功率和市场竞争力。在IPD培训课程中,掌握关键成功因素是确保团队能够有效实施这一模式的核心。以下将从五个关键成功因素展开讨论,帮助企业和...
IPD项目流程图   27  
  华为IPD(Integrated Product Development,集成产品开发)流程是华为公司在其全球化进程中逐步构建和完善的一套高效产品开发管理体系。这一流程不仅帮助华为在技术创新和产品交付上实现了质的飞跃,还为其在全球市场中赢得了显著的竞争优势。IPD的核心在于通过跨部门协作、阶段性评审和市场需求驱动,确保...
华为IPD   26  
  华为作为全球领先的通信技术解决方案提供商,其成功的背后离不开一套成熟的管理体系——集成产品开发(IPD)。IPD不仅是一种产品开发流程,更是一种系统化的管理思想,它通过跨职能团队的协作、阶段评审机制和市场需求驱动的开发模式,帮助华为在全球市场中脱颖而出。从最初的国内市场到如今的全球化布局,华为的IPD体系在多个领域展现...
IPD管理流程   53  
热门文章
项目管理软件有哪些?
云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用