即使使用 .loc[row_indexer,col_indexer] = value,SettingWithCopyWarning

2025-01-14 08:51:00
admin
原创
109
摘要:问题描述:这是我的代码中的其中一行SettingWithCopyWarning:value1['Total Population']=value1['Total Population'].replace(to_replace='*', value=4) 然后我将其改为:row_index= value1['T...

问题描述:

这是我的代码中的其中一行SettingWithCopyWarning

value1['Total Population']=value1['Total Population'].replace(to_replace='*', value=4)

然后我将其改为:

row_index= value1['Total Population']=='*'
value1.loc[row_index,'Total Population'] = 4

仍然会出现相同的警告。我该如何消除它?

另外,我使用过convert_objects(convert_numeric=True)函数时也收到同样的警告,有什么方法可以避免这种情况吗?

 value1['Total Population'] = value1['Total Population'].astype(str).convert_objects(convert_numeric=True)

这是我收到的警告信息:

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy 

解决方案 1:

如果使用.loc[row, column]仍然出现相同错误,则可能是因为复制了另一个数据框。您必须使用.copy()

这是一步一步的错误重现:

import pandas as pd

d = {'col1': [1, 2, 3, 4], 'col2': [3, 4, 5, 6]}
df = pd.DataFrame(data=d)
df
#   col1    col2
#0  1   3
#1  2   4
#2  3   5
#3  4   6

创建新列并更新其值:

df['new_column'] = None
df.loc[0, 'new_column'] = 100
df
#   col1    col2    new_column
#0  1   3   100
#1  2   4   None
#2  3   5   None
#3  4   6   None

我没有收到任何错误。但是,让我们根据前一个数据框创建另一个数据框:

new_df = df.loc[df.col1>2]
new_df
#col1   col2    new_column
#2  3   5   None
#3  4   6   None

现在,使用.loc,我将尝试以相同的方式替换一些值:

new_df.loc[2, 'new_column'] = 100

然而,我再次收到了这个令人憎恶的警告:

尝试在 DataFrame 切片的副本上设置值。请尝试使用 .loc[row_indexer,col_indexer] = value

请参阅文档中的注意事项:
https ://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy

解决方案

在创建新数据框时使用.copy()将解决警告:

new_df_copy = df.loc[df.col1>2].copy()
new_df_copy.loc[2, 'new_column'] = 100

现在,您将不会收到任何警告!

如果您的数据框是使用另一个数据框之上的过滤器创建的,请始终使用.copy()

解决方案 2:

您是否尝试过直接设置?:

value1.loc[value1['Total Population'] == '*', 'Total Population'] = 4

解决方案 3:

我不知道这对数据存储/内存的影响有多严重,但它每次都会为你的平均数据帧修复这个问题:

def addCrazyColFunc(df):
    dfNew = df.copy()
    dfNew['newCol'] = 'crazy'
    return dfNew

就像消息中说的那样... 复制一份就可以了。如果有人可以在没有复制的情况下修复上述问题,请发表评论。上述所有 loc 内容在这种情况下都不起作用。

解决方案 4:

我来这里是因为我想根据另一列中的值有条件地设置新列的值。

对我有用的是numpy.where:

import numpy as np
import pandas as pd
...

df['Size'] = np.where((df.value > 10), "Greater than 10", df.value)

从numpy docs来看,这相当于:

[xv if c else yv
 for c, xv, yv in zip(condition, x, y)]

这是 zip 的一个非常好的用法...

解决方案 5:

这是关于源 df 是否在使用切片索引的副本更新中更新的警告。如果是副本更新,请尝试pd.set_option('mode.chained_assignment', None) 在出现警告的行之前添加

df_value = pd.DataFrame({ 'Total Population':['a','b','c','*'] })
value1 = df_value[ df_value['Total Population']=='*']

pd.set_option('mode.chained_assignment',  None) # <=== SettingWithCopyWarning Off

row_index = value1['Total Population']=='*'
value1.loc[row_index,'Total Population'] = 44

pd.set_option('mode.chained_assignment',  'warn') # <=== SettingWithCopyWarning Default

解决方案 6:

我能够使用如下语法来避免相同的警告信息:

value1.loc[:, 'Total Population'].replace('*', 4)

请注意,数据框不需要重新分配给自身,即value1['Total Population']=value1['Total Population']...

解决方案 7:

得到解决方案:

我创建了一个新的 DataFrame 并仅存储了我需要处理的列的值,现在它没有给我任何错误!

很奇怪,但是有效。

解决方案 8:

指定它是副本对我来说是有效的。我刚刚.copy()在声明的末尾添加了

value1['Total Population'] = value1['Total Population'].replace(to_replace='*', value=4).copy()

解决方案 9:

这应该可以解决你的问题:

value1[:, 'Total Population'] = value1[:, 'Total Population'].replace(to_replace='*', value=4)
相关推荐
  政府信创国产化的10大政策解读一、信创国产化的背景与意义信创国产化,即信息技术应用创新国产化,是当前中国信息技术领域的一个重要发展方向。其核心在于通过自主研发和创新,实现信息技术应用的自主可控,减少对外部技术的依赖,并规避潜在的技术制裁和风险。随着全球信息技术竞争的加剧,以及某些国家对中国在科技领域的打压,信创国产化显...
工程项目管理   1565  
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   1354  
  信创国产芯片作为信息技术创新的核心领域,对于推动国家自主可控生态建设具有至关重要的意义。在全球科技竞争日益激烈的背景下,实现信息技术的自主可控,摆脱对国外技术的依赖,已成为保障国家信息安全和产业可持续发展的关键。国产芯片作为信创产业的基石,其发展水平直接影响着整个信创生态的构建与完善。通过不断提升国产芯片的技术实力、产...
国产信创系统   21  
  信创生态建设旨在实现信息技术领域的自主创新和安全可控,涵盖了从硬件到软件的全产业链。随着数字化转型的加速,信创生态建设的重要性日益凸显,它不仅关乎国家的信息安全,更是推动产业升级和经济高质量发展的关键力量。然而,在推进信创生态建设的过程中,面临着诸多复杂且严峻的挑战,需要深入剖析并寻找切实可行的解决方案。技术创新难题技...
信创操作系统   27  
  信创产业作为国家信息技术创新发展的重要领域,对于保障国家信息安全、推动产业升级具有关键意义。而国产芯片作为信创产业的核心基石,其研发进展备受关注。在信创国产芯片的研发征程中,面临着诸多复杂且艰巨的难点,这些难点犹如一道道关卡,阻碍着国产芯片的快速发展。然而,科研人员和相关企业并未退缩,积极探索并提出了一系列切实可行的解...
国产化替代产品目录   28  
热门文章
项目管理软件有哪些?
云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用