命名正则表达式组“(?P<group_name>regexp)”:“P”代表什么?
- 2025-03-26 09:08:00
- admin 原创
- 20
问题描述:
在 Python 中,(?P<group_name>…)
语法允许通过名称引用匹配的字符串:
>>> import re
>>> match = re.search('(?P<name>.*) (?P<phone>.*)', 'John 123456')
>>> match.group('name')
'John'
“P”代表什么?我在官方文档中找不到任何提示。
我很想知道如何帮助我的学生记住这个语法。知道“P”代表什么(或可能代表什么)会很有用。
解决方案 1:
既然我们都在猜测,我不妨给出我的答案:我一直认为它代表 Python。这可能听起来很愚蠢——什么,P 代表 Python?!——但为了辩护,我依稀记得这个帖子[重点是我的]:
主题:声明(?P…)正则表达式语法扩展
发件人:Guido van Rossum(gui...@CNRI.Reston.Va.US )
日期:1997 年 12 月 10 日下午 3:36:19
我对 Perl 开发人员(开发 Perl 语言的人)有一个不寻常的要求。我希望这个(perl5-porters)是正确的列表。我抄送 Python string-sig,因为它是我在这里讨论的大部分工作的来源。
您可能知道 Python。我是 Python 的创建者;我计划在今年年底前发布下一个“主要”版本 Python 1.5。我希望 Python 和 Perl 在未来几年能够共存;交叉融合对这两种语言都有好处。(我相信 Larry 在为 Perl 5 添加对象时对 Python 进行了深入研究;O'Reilly 出版了有关这两种语言的书籍。)
您可能知道,Python 1.5 添加了一个新的正则表达式模块,该模块与 Perl 的语法更接近。我们试图在 Python 的语法中尽可能接近 Perl 的语法。但是,正则表达式语法有一些 Python 特定的扩展,它们都以 (?P 开头。目前有两个:
(?P<foo>...)
与常规分组括号类似,但匹配完成后,可以通过符号组名“foo”访问组匹配的文本。
(?P=foo)
与名为“foo”的组匹配相同的字符串。等同于 \1、\2 等,只是组是通过名称而不是数字引用的。
我希望这个 Python 特定的扩展不会与任何未来的 Perl 正则表达式语法扩展发生冲突。如果您计划使用 (?P,请尽快告知我们,以便我们解决冲突。 否则,如果 (?P 语法可以永久保留给 Python 特定的语法扩展,那就太好了。 (是否存在某种扩展注册表?)
Larry Wall 对此的回复是:
[...] 目前还没有注册——您的请求是来自 perl5-porters 之外的第一个请求,因此这是一项带宽占用非常低的活动。(抱歉,上周带宽占用更低——我当时在纽约参加 Internet World。)
无论如何,就我而言,在我的祝福下,您当然可以拥有“P”。(显然,Perl 此时不需要“P”。:-) [...]
所以我不知道最初选择 P 的动机是什么——模式?占位符?企鹅?——但你可以理解为什么我总是把它和 Python 联系在一起。考虑到 (1) 我不喜欢正则表达式,尽可能避免使用它们,以及 (2) 这个话题发生在十五年前,这有点奇怪。
解决方案 2:
Python 扩展。来自 Python 文档:
Perl 开发人员选择的解决方案是使用 (?...) 作为扩展语法。括号后面紧跟 ? 是语法错误,因为 ? 没有可重复的内容,因此这不会引入任何兼容性问题。紧跟 ? 后面的字符表示正在使用的扩展名,因此 (?=foo) 是一回事(肯定的前瞻断言),而 (?:foo) 是另一回事(包含子表达式 foo 的非捕获组)。
Python 支持 Perl 的几个扩展,并在 Perl 的扩展语法中添加了扩展语法。如果问号后面的第一个字符是 P,则表明这是 Python 特有的扩展
https://docs.python.org/3/howto/regex.html
解决方案 3:
模式!该组为正则表达式中的(子)模式命名。有关如何使用此类组的详细信息,请参阅此处的文档。