如何替换 Pandas 数据框的字符串列中的文本？-IT科技

如何替换 Pandas 数据框的字符串列中的文本？

2025-01-13 08:52:00

admin

原创

101

摘要：问题描述：我的数据框中有一列如下：range "(2,30)" "(50,290)" "(400,1000)" ... 我想用,破折号代替-逗号。我目前正在使用此方法，但没有任何变化。org_info_exc['range'].replace(',...

问题描述：

我的数据框中有一列如下：

range
"(2,30)"
"(50,290)"
"(400,1000)"
...

我想用,破折号代替-逗号。我目前正在使用此方法，但没有任何变化。

org_info_exc['range'].replace(',', '-', inplace=True)

有人可以帮忙吗？

解决方案 1：

使用矢量化str方法replace：

df['range'] = df['range'].str.replace(',','-')

df
      range
0    (2-30)
1  (50-290)

编辑：所以如果我们看看你尝试了什么以及为什么它不起作用：

df['range'].replace(',','-',inplace=True)

从文档中我们看到这样的描述：

str 或 regex： str：与 to_replace 完全匹配的字符串将被替换为值

因此由于 str 值不匹配，所以不会发生替换，请与以下内容进行比较：

df = pd.DataFrame({'range':['(2,30)',',']})
df['range'].replace(',','-', inplace=True)

df['range']

0    (2,30)
1         -
Name: range, dtype: object

这里我们得到了第二行的完全匹配并且发生了替换。

解决方案 2：

对于任何通过 Google 搜索到达此处并了解如何对所有replace列进行字符串替换的人（例如，如果有多个列，如 OP 的“范围”列）：Pandas在数据框对象上有一个内置方法。

df.replace(',', '-', regex=True)

来源：文档

解决方案 3：

如果您只需要替换某一特定列中的字符，则 regex=True 和 in place=True 都会失败，我认为这里这种方法可行：

data["column_name"] = data["column_name"].apply(lambda x: x.replace("characters_need_to_replace", "new_characters"))

在这种情况下，lambda 更像是一个像 for 循环一样工作的函数。这里的 x 代表当前列中的每个条目。

您唯一需要做的就是更改“column_name”、“characters_need_to_replace”和“new_characters”。

解决方案 4：

将列名称中的所有逗号替换为下划线

data.columns= data.columns.str.replace(' ','_',regex=True)

解决方案 5：

此外，对于那些希望替换列中多个字符的人来说，可以使用正则表达式来实现：

import re
chars_to_remove = ['.', '-', '(', ')', '']
regular_expression = '[' + re.escape (''. join (chars_to_remove)) + ']'

df['string_col'].str.replace(regular_expression, '', regex=True)

解决方案 6：

与 Nancy K 的回答几乎相似，这对我有用：

data["column_name"] = data["column_name"].apply(lambda x: x.str.replace("characters_need_to_replace", "new_characters"))

解决方案 7：

如果要从字符串中删除两个或更多元素，例如字符 '$' 和 ','：

Column_Name
===========
$100,000
$1,100,000

...然后使用：

data.Column_Name.str.replace("[$,]", "", regex=True)

=>[ 100000, 1100000 ]