Python 和 Unicode 正则表达式

2025-02-13 08:35:00

admin

原创

57

摘要：问题描述：我需要从字符串 'ِsِْ ِِِ َِْٰ ِِِِِ' 中删除一些 Unicode 符号我知道它们肯定存在。我试过：re.sub('([/u064B-/u0652/u06D4/u0670/u0674/u06D5-/u06ED]+)', '', 'بِسْمِ اللَّهِ الرَّحْمَٰ...

问题描述：

我需要从字符串 'ِsِْ ِِِ َِْٰ ِِِِِ' 中删除一些 Unicode 符号

我知道它们肯定存在。我试过：

re.sub('([/u064B-/u0652/u06D4/u0670/u0674/u06D5-/u06ED]+)', '', 'بِسْمِ اللَّهِ الرَّحْمَٰنِ الرَّحِيمِ')

但它不起作用。字符串保持不变。我做错了什么？

解决方案 1：

您使用的是 python 2.x 还是 3.0？

如果您使用的是 2.x，请尝试将正则表达式字符串设为 unicode 转义字符串，并使用“u”。由于它是正则表达式，因此最好将正则表达式字符串设为原始字符串，并使用“r”。此外，将整个模式放在括号中是多余的。

re.sub(ur'[/u064B-/u0652/u06D4/u0670/u0674/u06D5-/u06ED]+', '', ...)

http://docs.python.org/tutorial/introduction.html#unicode-strings

编辑：

对于 unicode 正则表达式，使用 re.UNICODE/re.U/(?u) 标志也是一种很好的做法，但它只会影响字符类别名，如 \w 或 \b，而此模式不使用任何字符类别名，因此不会受到影响。

解决方案 2：

使用unicode字符串。使用re.UNICODE标志。

>>> myre = re.compile(ur'[/u064B-/u0652/u06D4/u0670/u0674/u06D5-/u06ED]+', 
                      re.UNICODE)
>>> myre
<_sre.SRE_Pattern object at 0xb20b378>
>>> mystr = u'بِسْمِ اللَّهِ الرَّحْمَٰنِ الرَّحِيمِ'
>>> result = myre.sub('', mystr)
>>> len(mystr), len(result)
(38, 22)
>>> print result
بسم الله الرحمن الرحيم

阅读Joel Spolsky的文章《每个软件开发人员绝对、肯定必须了解的关于 Unicode 和字符集的最低限度（没有借口！）》

相关推荐

置顶 政府信创国产化的10大政策解读

政府信创国产化的10大政策解读

政府信创国产化的10大政策解读一、信创国产化的背景与意义信创国产化，即信息技术应用创新国产化，是当前中国信息技术领域的一个重要发展方向。其核心在于通过自主研发和创新，实现信息技术应用的自主可控，减少对外部技术的依赖，并规避潜在的技术制裁和风险。随着全球信息技术竞争的加剧，以及某些国家对中国在科技领域的打压，信创国产化显...

工程项目管理 2079

置顶 2025年20款好用的项目管理软件推荐，项目管理提效的20个工具和技巧

2025年20款好用的项目管理软件推荐，项目管理提效的20个工具和技巧

为什么项目管理通常仍然耗时且低效？您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议？这确实是耗费时间和精力。借助软件工具的帮助，您可以一目了然地全面了解您的项目。如今，国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件？项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...

项目管理软件 1459

建筑PLM系统实施指南：2025年基于BIM的9种项目进度优化工具

建筑PLM系统实施指南：2025年基于BIM的9种项目进度优化工具

建筑行业正处于数字化转型的关键时期，建筑产品生命周期管理（PLM）系统的实施对于提升项目效率、质量和协同性至关重要。特别是在 2025 年，基于建筑信息模型（BIM）的项目进度优化工具成为众多建筑企业关注的焦点。这些工具不仅能够整合项目全生命周期的数据，还能通过精准的分析和模拟，为项目进度管理提供强大支持。BIM 与建...

plm是什么软件 0

2025年PLM系统开发趋势：基于8种接口测试工具的缺陷预防机制

2025年PLM系统开发趋势：基于8种接口测试工具的缺陷预防机制

PLM系统开发的重要性与现状PLM（产品生命周期管理）系统在现代企业的产品研发、生产与管理过程中扮演着至关重要的角色。它贯穿产品从概念设计到退役的整个生命周期，整合了产品数据、流程以及人员等多方面的资源，极大地提高了企业的协同效率和创新能力。通过PLM系统，企业能够实现产品信息的集中管理与共享，不同部门之间可以实时获取...

国产plm软件 0

PLM系统迭代周期优化：2025年敏捷认证要求的6种燃尽图应用

PLM系统迭代周期优化：2025年敏捷认证要求的6种燃尽图应用

PLM（产品生命周期管理）系统在企业产品研发与管理过程中扮演着至关重要的角色。随着市场竞争的加剧和技术的飞速发展，企业对PLM系统的迭代周期优化需求日益迫切。2025年敏捷认证对项目管理提出了新的要求，其中燃尽图作为一种强大的可视化工具，在PLM系统迭代周期优化中有着广泛且重要的应用。深入探讨这些应用，对于提升企业的项...

plm系统主要干什么的 0

热门文章

政府信创国产化的10大政策解读

2025年20款好用的项目管理软件推荐，项目管理提效的20个工具和技巧

使用 Python 'Requests' 模块的代理

10个项目管理常见问题解答：包括难点和解决方法

项目延期的原因有哪些？如何有效预防和管理？

项目里程碑计划模板怎么写?设定项目里程碑的5个方法

项目管理指南：制定项目实施计划的6大步骤有哪些？

项目管理软件有哪些？

云禅道AD

禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护，随时随地协同办公

内置subversion和git源码管理

每天备份，随时转为私有部署