在 Python 正则表达式中捕获重复子模式

2024-12-20 08:37:00
admin
原创
80
摘要:问题描述:在匹配电子邮件地址时,在我匹配了类似 的内容后yasar@webmail,我想捕获一个或多个(.w+)(我正在做的事情有点复杂,这只是一个例子),我尝试添加 (.\w+)+ ,但它只捕获最后一个匹配项。例如,yasar@webmail.something.edu.tr匹配但只包含.tr后yasar@...

问题描述:

在匹配电子邮件地址时,在我匹配了类似 的内容后yasar@webmail,我想捕获一个或多个(.w+)(我正在做的事情有点复杂,这只是一个例子),我尝试添加 (.\w+)+ ,但它只捕获最后一个匹配项。例如,yasar@webmail.something.edu.tr匹配但只包含.tryasar@webmail部分,所以我丢失了.something.edu组。我可以在 Python 正则表达式中执行此操作吗?或者你建议先匹配所有内容,然后再拆分子模式?


解决方案 1:

re模块不支持重复捕获(regex支持):

>>> m = regex.match(r'([.w]+)@((w+)(.w+)+)', 'yasar@webmail.something.edu.tr')
>>> m.groups()
('yasar', 'webmail.something.edu.tr', 'webmail', '.tr')
>>> m.captures(4)
['.something', '.edu', '.tr']

对于你的情况,我会选择稍后拆分重复的子模式。这样可以得到简单易读的代码,例如,参见@Li-aung Yip 的回答中的代码。

解决方案 2:

(.w+)+您可以通过执行以下操作来解决仅捕获最后一场比赛的问题:((?:.w+)+)

解决方案 3:

这将起作用:

>>> regexp = r"[w.]+@(w+)(.w+)?(.w+)?(.w+)?(.w+)?(.w+)?"
>>> email_address = "william.adama@galactica.caprica.fleet.mil"
>>> m = re.match(regexp, email_address)
>>> m.groups()
('galactica', '.caprica', '.fleet', '.mil', None, None)

但最多只能有六个子组。更好的方法是:

>>> m = re.match(r"[w.]+@(.+)", email_address)
>>> m.groups()
('galactica.caprica.fleet.mil',)
>>> m.group(1).split('.')
['galactica', 'caprica', 'fleet', 'mil']

请注意,只要电子邮件地址简单,正则表达式就可以了 - 但有各种各样的事情会导致这种情况发生。有关电子邮件地址正则表达式的详细说明,请参阅此问题。

相关推荐
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   1019  
  IPD(Integrated Product Development,集成产品开发)是一种以客户需求为核心、跨职能团队协作为基础的产品开发方法。它通过整合市场、研发、制造、供应链等各个环节的资源与信息,实现高效的产品开发流程。IPD不仅是一种方法论,更是一种系统化的管理思维,旨在缩短产品开发周期、降低开发成本、提高产品...
IPD培训课程   0  
  华为的IPD(集成产品开发)流程是全球范围内备受认可的产品开发管理体系,其核心在于通过跨部门协作和系统化的流程管理,提升产品开发效率和质量。在IPD流程中,团队建设与领导力培养是两个至关重要的环节。高效的团队能够确保项目顺利推进,而优秀的领导力则是团队凝聚力和执行力的保障。本文将从团队建设的重要性、领导力在IPD中的核...
IPD集成产品开发流程   0  
  华为的集成产品开发(IPD)流程是其成功的关键因素之一,它不仅提升了产品开发的效率,还通过系统化的风险管理机制确保了项目的顺利推进。在IPD流程中,风险管理被视为贯穿始终的核心环节,其目的是在项目初期识别潜在问题,并在整个开发周期中持续监控和应对风险。通过有效的风险管理,华为能够最大限度地减少项目延误、成本超支和质量问...
IPD结构化流程   0  
  在项目管理领域,CDCP(Critical Decision Control Point)评审是确保项目成功的关键环节之一。CDCP评审的核心在于通过系统化的决策流程,确保项目在每个关键节点都能做出正确的选择,从而降低风险、提高效率并最终实现项目目标。然而,许多项目团队在CDCP评审过程中常常面临决策效率低下、信息不对...
华为IPD流程   0  
热门文章
项目管理软件有哪些?
云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用