Pandas:链式作业[重复]
- 2025-01-21 09:01:00
- admin 原创
- 90
问题描述:
我一直在阅读“返回视图与副本”的链接。我不太明白Pandas 中的链式赋值.ix()
概念是如何工作的,以及、.iloc()
或 的使用如何.loc()
影响它。
我收到SettingWithCopyWarning
以下代码行的警告,其中data
是 Panda 数据框,amount
是该数据框中的列(系列)名称:
data['amount'] = data['amount'].astype(float)
data["amount"].fillna(data.groupby("num")["amount"].transform("mean"), inplace=True)
data["amount"].fillna(mean_avg, inplace=True)
看看这段代码,是不是很明显我做的不是最理想的?如果是这样,你能告诉我替换的代码行吗?
我知道以下警告,并且认为我的情况中的警告是误报:
链式分配警告/异常旨在通知用户可能存在无效分配。可能会出现误报;链式分配被无意报告的情况。
编辑:导致第一个复制警告错误的代码。
data['amount'] = data.apply(lambda row: function1(row,date,qty), axis=1)
data['amount'] = data['amount'].astype(float)
def function1(row,date,qty):
try:
if(row['currency'] == 'A'):
result = row[qty]
else:
rate = lookup[lookup['Date']==row[date]][row['currency'] ]
result = float(rate) * float(row[qty])
return result
except ValueError: # generic exception clause
print "The current row causes an exception:"
解决方案 1:
这样做的目的SettingWithCopy
是警告用户,你正在做的事情可能不会像预期的那样更新原始数据框。
这里data
是一个数据框,可能只有一种数据类型(也可能没有)。然后,您将引用这个数据data['amount']
框(即 Series)并更新它。这可能适用于您的情况,因为您返回的数据的数据类型与现有数据相同。
但是它可以创建一个副本,而这个副本会更新您看不到的副本data['amount']
;那么您会想知道为什么它没有更新。
Pandas 在几乎所有方法调用中都会返回对象的副本。这些inplace
操作是一种方便的操作,但通常不清楚数据是否被修改,并且可能在副本上起作用。
这样做更加清楚:
data['amount'] = data["amount"].fillna(data.groupby("num")["amount"].transform("mean"))
data["amount"] = data['amount'].fillna(mean_avg)
复制操作还有另一个好处。你可以将操作串联起来,而使用 one 操作则无法做到这一点inplace
。
例如
data['amount'] = data['amount'].fillna(mean_avg)*2
仅供参考。inplace
操作既不更快,也不更节省内存。my2c 它们应该被禁止。但该 API 太晚了。
你当然可以关闭这个功能:
pd.set_option('chained_assignment',None)
仅供参考, Pandas 将此项设置为开启状态,并与整个测试套件一起运行raise
(这样我们就知道是否正在发生链接)。
相关推荐
热门文章
项目管理软件有哪些?
热门标签
云禅道AD