如何在正则表达式中使用变量

2024-12-12 08:40:00
admin
原创
119
摘要:问题描述:我想在正则表达式中使用变量,如何在 Python 中做到这一点?TEXTO = sys.argv[1] if re.search(r"(?=w)TEXTO(?!w)", subject, re.IGNORECASE): # Successful match else...

问题描述:

我想在正则表达式中使用变量,如何在 Python 中做到这一点?

TEXTO = sys.argv[1]

if re.search(r"(?=w)TEXTO(?!w)", subject, re.IGNORECASE):
    # Successful match
else:
    # Match attempt failed

解决方案 1:

您必须将正则表达式构建为字符串:

TEXTO = sys.argv[1]
my_regex = r"(?=w)" + re.escape(TEXTO) + r"(?!w)"

if re.search(my_regex, subject, re.IGNORECASE):
    etc.

请注意使用re.escape,如果您的文本包含特殊字符,它们就不会被解释为特殊字符。

解决方案 2:

从 Python 3.6 开始,您还可以使用文字字符串插值,即“f-strings”。在您的特定情况下,解决方案将是:

if re.search(rf"(?=w){TEXTO}(?!w)", subject, re.IGNORECASE):
    ...do something

编辑:

由于评论中存在一些关于如何处理特殊字符的问题,所以我想扩展我的答案:

原始字符串('r'):

处理正则表达式中的特殊字符时,必须了解的主要概念之一是区分字符串文字和正则表达式本身。这里解释得很清楚:

简而言之:

假设TEXTO您想要匹配字符串,而不是查找单词边界oundary。那么您必须这样写:

TEXTO = "Var"
subject = r"Varoundary"

if re.search(rf"(?=w){TEXTO}\\boundary(?!w)", subject, re.IGNORECASE):
    print("match")

这只有在我们使用原始字符串(正则表达式前面有“r”)时才有效,否则我们必须在正则表达式中写入“\\\\boundary”(四个反斜杠)。此外,如果没有“\r”,\b' 将不再转换为单词边界,而是转换为退格符!

重新.逃脱

基本上在任何特殊字符前面都加一个反斜杠。因此,如果您希望在 TEXTO 中出现特殊字符,则需要这样写:

if re.search(rf"(?=w){re.escape(TEXTO)}(?!w)", subject, re.IGNORECASE):
    print("match")

注意:对于任何版本 >= Python 3.7:,,,,,,,,,,,,,和均不!进行转义。只有在正则表达式中有意义的特殊字符才会被转义。自 Python 3.3起",不再进行转义。(此处为)%`',/:;<=>@`_`

花括号:

如果要在使用 f 字符串的正则表达式中使用量词,则必须使用双花括号。假设您要匹配 TEXTO 后跟 2 位数字:

if re.search(rf"(?=w){re.escape(TEXTO)}d{{2}}(?!w)", subject, re.IGNORECASE):
    print("match")

解决方案 3:

if re.search(r"(?<=w)%s(?!w)" % TEXTO, subject, re.IGNORECASE):

这会将 TEXTO 中的内容作为字符串插入到正则表达式中。

解决方案 4:

rx = r'(?<=w){0}(?!w)'.format(TEXTO)

解决方案 5:

我发现通过将多个较小的模式串在一起来构建正则表达式模式非常方便。

import re

string = "begin:id1:tag:middl:id2:tag:id3:end"
re_str1 = r'(?<=(S{5})):'
re_str2 = r'(idd+):(?=tag:)'
re_pattern = re.compile(re_str1 + re_str2)
match = re_pattern.findall(string)
print(match)

输出:

[('begin', 'id1'), ('middl', 'id2')]

解决方案 6:

我同意以上所有内容,除非:

sys.argv[1]就像Chickend{2}-d{2}Ans*importants*anchor

sys.argv[1] = "Chickend{2}-d{2}Ans*importants*anchor"

你不会想使用re.escape,因为在这种情况下你希望它表现得像一个正则表达式

TEXTO = sys.argv[1]

if re.search(r"(?<=w)" + TEXTO + "(?!w)", subject, re.IGNORECASE):
    # Successful match
else:
    # Match attempt failed

解决方案 7:

您可以尝试使用format语法糖的另一种用法:

re_genre = r'{}'.format(your_variable)
regex_pattern = re.compile(re_genre)  

解决方案 8:

我需要搜索彼此相似的用户名,Ned Batchelder 所说的非常有帮助。但是,我发现当我使用 re.compile 创建搜索词时,输出结果更清晰:

pattern = re.compile(r"("+username+".*):(.*?):(.*?):(.*?):(.*)"
matches = re.findall(pattern, lines)

可以使用以下命令打印输出:

print(matches[1]) # prints one whole matching line (in this case, the first line)
print(matches[1][3]) # prints the fourth character group (established with the parentheses in the regex statement) of the first line.

解决方案 9:

这是您可以使用的另一种格式(在 Python 3.7 上测试)

regex_str = r'(?<=w)%s(?!w)'%TEXTO

我发现当你不能使用{}变量时它很有用(这里替换为%s

解决方案 10:

您也可以为此使用格式关键字。格式方法将用您作为参数传递给格式方法的变量替换 {} 占位符。

if re.search(r"(?=w)**{}**(?!w)".**format(TEXTO)**, subject, re.IGNORECASE):
    # Successful match**strong text**
else:
    # Match attempt failed

解决方案 11:

更多示例

我有带有流文件的 configus.yml

"pattern":
  - _(d{14})_
"datetime_string":
  - "%m%d%Y%H%M%f"

在python代码中我使用

data_time_real_file=re.findall(r""+flows[flow]["pattern"][0]+"", latest_file)
相关推荐
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   1043  
  IPD(Integrated Product Development,集成产品开发)是一种系统化的产品开发方法论,旨在通过跨职能团队的协作,优化产品开发的效率和质量。IPD流程强调从市场需求出发,通过并行工程、跨部门协作和阶段性评审,确保产品从概念到上市的每个环节都高效且可控。随着敏捷开发方法的普及,越来越多的企业开始...
华为IPD流程   41  
  随着企业产品开发复杂度的提升以及市场需求的快速变化,传统的产品开发模式逐渐显现出局限性。集成产品开发(IPD)流程与敏捷开发(Agile Development)作为两种主流的开发方法论,分别从系统化管理和快速响应需求的角度为企业提供了解决方案。然而,单独使用其中一种方法往往无法完全满足企业在效率、质量和创新上的多重需...
华为IPD流程   35  
  华为IPD(Integrated Product Development,集成产品开发)流程是华为公司成功的关键因素之一。它不仅帮助华为在技术上实现了快速创新,还通过市场导向确保了产品的商业成功。IPD流程通过整合技术与市场双驱动,实现了从需求定义到产品交付的全生命周期管理。这种模式不仅提高了产品的开发效率,还降低了市...
IPD流程中PDCP是什么意思   32  
  在研发领域,集成产品开发(IPD)流程已经成为企业提升创新效率和市场竞争力的重要手段。然而,资源分配的不合理往往是制约IPD流程效率的关键因素之一。无论是人力资源、财务资源还是技术资源,如何高效分配直接关系到项目的成功与否。优化资源分配不仅能够缩短产品开发周期,还能降低研发成本,提升产品的市场竞争力。因此,掌握资源分配...
IPD流程中CDCP   34  
热门文章
项目管理软件有哪些?
云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用