使用 fromkeys 和可变对象创建字典。令人惊讶的是 [重复]

2025-01-16 08:37:00
admin
原创
14
摘要:问题描述:我在 Python 2.6 和 3.2 中遇到了这种令我惊讶的行为:>>> xs = dict.fromkeys(range(2), []) >>> xs {0: [], 1: []} >>> xs[0].append(1) >>&g...

问题描述:

我在 Python 2.6 和 3.2 中遇到了这种令我惊讶的行为:

>>> xs = dict.fromkeys(range(2), [])
>>> xs
{0: [], 1: []}
>>> xs[0].append(1)
>>> xs
{0: [1], 1: [1]}

然而,dict3.2 中的推导式表现出了更加礼貌的态度:

>>> xs = {i:[] for i in range(2)}
>>> xs
{0: [], 1: []}
>>> xs[0].append(1)
>>> xs
{0: [1], 1: []}
>>> 

为什么会fromkeys这样?


解决方案 1:

您的 Python 2.6 示例相当于以下内容,这可能有助于澄清:

>>> a = []
>>> xs = dict.fromkeys(range(2), a)

生成的字典中的每个条目都将引用同一个对象。正如您所见,改变该对象的效果将通过每个字典条目可见,因为它是一个对象。

>>> xs[0] is a and xs[1] is a
True

使用字典推导,或者如果你停留在 Python 2.6 或更早版本并且没有字典推导,你可以通过使用dict()生成器表达式来获得字典推导行为:

xs = dict((i, []) for i in range(2))

解决方案 2:

在第一个版本中,您使用相同的空列表对象作为两个键的值,因此如果您更改一个,则也会更改另一个。

看看这个:

>>> empty = []
>>> d = dict.fromkeys(range(2), empty)
>>> d
{0: [], 1: []}
>>> empty.append(1) # same as d[0].append(1) because d[0] references empty!
>>> d
{0: [1], 1: [1]}

在第二个版本中,在字典推导的每次迭代中都会创建一个新的空列表对象,因此两者彼此独立。

至于“为什么”fromkeys()会这样工作 - 嗯,如果它不这样工作,那将是令人惊讶的。使用来自iterablefromkeys(iterable, value)的键构造一个新的 dict ,所有键都具有值。如果该值是一个可变对象,并且您更改了该对象,您还能合理地期望发生什么?value

解决方案 3:

回答实际的问题:fromkeys这样做是因为没有其他合理的选择。决定fromkeys你的参数是否可变并每次都制作新的副本是不合理的(甚至不可能)。在某些情况下,这是没有意义的,而在其他情况下,这是不可能的。

因此,您传入的第二个参数只是一个引用,并按原样复制。Python[]中的赋值表示“对新列表的单一引用”,而不是“每次访问此变量时都创建一个新列表”。另一种方法是传入一个生成新实例的函数,这是字典推导为您提供的功能。

以下是创建可变容器的多个实际副本的一些选项:

  1. 正如您在问题中提到的,字典理解允许您为每个元素执行任意语句:

d = {k: [] for k in range(2)}

这里最重要的是,这相当于将赋值放在k = []一个for循环中。每次迭代都会创建一个新的列表并将其赋值给一个值。

  1. 使用@Andrew Clarkdict建议的构造函数形式:

d = dict((k, []) for k in range(2))

这将创建一个生成器,当执行时,它会再次为每个键值对分配一个新列表。

  1. 使用collections.defaultdict而不是常规的dict

d = collections.defaultdict(list)

此选项与其他选项略有不同。它不会预先创建新的列表引用,而是在每次访问尚不存在的键时defaultdict调用list。因此,您可以根据需要随意添加键,这有时非常方便:

for k in range(2):
    d[k].append(42)

由于您已经为新元素设置了工厂,因此这实际上将完全按照您fromkeys在原始问题中预期的方式运行。

  1. 当您访问可能的新密钥时使用dict.setdefault。这和上面的类似defaultdict,但它的优点是更受控制,因为只有您想要创建新密钥的访问才会真正创建它们:

d = {}
for k in range(2):
    d.setdefault(k, []).append(42)

缺点是每次调用该函数时都会创建一个新的空列表对象,即使它从未被赋值。这不是一个大问题,但如果你频繁调用它和/或你的容器不像那么简单,它可能会累积起来list

相关推荐
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   1043  
  IPD(Integrated Product Development,集成产品开发)是一种系统化的产品开发方法论,旨在通过跨职能团队的协作,优化产品开发的效率和质量。IPD流程强调从市场需求出发,通过并行工程、跨部门协作和阶段性评审,确保产品从概念到上市的每个环节都高效且可控。随着敏捷开发方法的普及,越来越多的企业开始...
华为IPD流程   41  
  随着企业产品开发复杂度的提升以及市场需求的快速变化,传统的产品开发模式逐渐显现出局限性。集成产品开发(IPD)流程与敏捷开发(Agile Development)作为两种主流的开发方法论,分别从系统化管理和快速响应需求的角度为企业提供了解决方案。然而,单独使用其中一种方法往往无法完全满足企业在效率、质量和创新上的多重需...
华为IPD流程   35  
  华为IPD(Integrated Product Development,集成产品开发)流程是华为公司成功的关键因素之一。它不仅帮助华为在技术上实现了快速创新,还通过市场导向确保了产品的商业成功。IPD流程通过整合技术与市场双驱动,实现了从需求定义到产品交付的全生命周期管理。这种模式不仅提高了产品的开发效率,还降低了市...
IPD流程中PDCP是什么意思   32  
  在研发领域,集成产品开发(IPD)流程已经成为企业提升创新效率和市场竞争力的重要手段。然而,资源分配的不合理往往是制约IPD流程效率的关键因素之一。无论是人力资源、财务资源还是技术资源,如何高效分配直接关系到项目的成功与否。优化资源分配不仅能够缩短产品开发周期,还能降低研发成本,提升产品的市场竞争力。因此,掌握资源分配...
IPD流程中CDCP   34  
热门文章
项目管理软件有哪些?
云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用