使用 Python 的 string.replace 与 re.sub
- 2025-03-12 08:52:00
- admin 原创
- 40
问题描述:
对于 Python 2.5、2.6,我应该使用string.replace
还是re.sub
进行基本的文本替换?
在 PHP 中,有明确说明这一点,但我找不到针对 Python 的类似说明。
解决方案 1:
只要你能应付str.replace()
,就应该使用它。它避免了正则表达式的所有缺陷(如转义),而且通常速度更快。
解决方案 2:
str.replace()
应该尽可能使用。它更明确、更简单、更快捷。
In [1]: import re
In [2]: text = """For python 2.5, 2.6, should I be using string.replace or re.sub for basic text replacements.
In PHP, this was explicitly stated but I can't find a similar note for python.
"""
In [3]: timeit text.replace('e', 'X')
1000000 loops, best of 3: 735 ns per loop
In [4]: timeit re.sub('e', 'X', text)
100000 loops, best of 3: 5.52 us per loop
解决方案 3:
当您知道如何使用字符串操作时,它通常比正则表达式更受欢迎。正则表达式非常强大,但它通常速度较慢,并且通常更难编写、调试和维护。
话虽如此,请注意上一段中“通常”的数量!有可能(而且我见过有人这样做)编写无数行字符串操作来完成本来可以用 20 个字符的正则表达式完成的事情。还可能浪费宝贵的时间使用“高效”字符串函数来完成一个好的正则表达式引擎几乎可以同样快速完成的任务。然后是可维护性:正则表达式可能非常复杂,但有时正则表达式会比一大段程序代码更简单、更容易阅读。
正则表达式非常适合其预期用途:在高度变化的大海中寻找高度变化的针。可以把它想象成一把精密扭矩扳手:它是完成特定工作的完美工具,但却是一把糟糕的锤子。
当您不确定使用什么时,应该遵循一些指导原则:
您正在寻找的模式是否高度静态?例如,您是否希望按每个逗号、竖线或制表符拆分字符串?
资源效率比开发人员的时间更重要吗?您的优先事项是什么?请记住:硬件便宜,程序员昂贵。
您正在使用HTML、XML 或其他上下文无关语法吗?别忘了正则表达式有局限性。
我的经验法则是:如果你花 5 分钟来解决这个问题,你能粗略地想出一个非正则表达式方法的想法吗?
如果对以上任何一个问题的回答是“是”,那么你可能需要字符串操作。否则,请考虑正则表达式。
解决方案 4:
另一件需要考虑的事情是,如果您正在进行相当复杂的替换,那么str.translate()可能就是您要找的。