将 pandas DataFrame 中带逗号的数字字符串转换为浮点数
- 2024-12-26 08:43:00
- admin 原创
- 122
问题描述:
我有一个 DataFrame,其中包含数字作为字符串,并以逗号作为千位标记。我需要将它们转换为浮点数。
a = [['1,200', '4,200'], ['7,000', '-0.03'], [ '5', '0']]
df=pandas.DataFrame(a)
我猜我需要使用 locale.atof。确实如此
df[0].apply(locale.atof)
工作正常。我得到了一系列浮点数。
但是当我将它应用到 DataFrame 时,出现错误。
df.apply(locale.atof)
TypeError:(“无法将该系列转换为”,u'occurred at index 0')
和
df[0:1].apply(locale.atof)
给出了另一个错误:
ValueError:('float()的无效文字:1,200',u'出现在索引 0')
那么,如何将这个DataFrame
字符串转换为浮点数的 DataFrame?
解决方案 1:
如果您正在从 csv 读取,那么您可以使用千位参数:
df.read_csv('foo.tsv', sep=' ', thousands=',')
此方法可能比将操作作为单独的步骤执行更有效。
您需要先设置语言环境:
In [ 9]: import locale
In [10]: from locale import atof
In [11]: locale.setlocale(locale.LC_NUMERIC, '')
Out[11]: 'en_GB.UTF-8'
In [12]: df.applymap(atof)
Out[12]:
0 1
0 1200 4200.00
1 7000 -0.03
2 5 0.00
解决方案 2:
您可以像这样一次转换一列:
df['colname'] = df['colname'].str.replace(',', '').astype(float)
解决方案 3:
您可以使用pandas.Series.str.replace方法:
df.iloc[:,:].str.replace(',', '').astype(float)
该方法可以删除或者替换字符串中的逗号。
解决方案 4:
这将适用于诸如“-55,00”或“5.500,00”之类的字符串,并将它们分别转换为浮点数 -55.00 和 5500.00。
df['colname'] = df['colname'].str.replace('.','', regex=True).str.replace(',', '.', regex=True).astype(float)
相关推荐
热门文章
项目管理软件有哪些?
热门标签
云禅道AD