为什么字典排序是不确定的?

2025-02-05 13:23:00
admin
原创
54
摘要:问题描述:我最近从 Python 2.7 切换到了 Python 3.3,似乎在 Python 2 中字典键的顺序是任意但一致的,而在 Python 3 中,使用例如获得的字典的键的顺序vars()似乎是不确定的。如果我运行:class Test(object): pass parameters = vars...

问题描述:

我最近从 Python 2.7 切换到了 Python 3.3,似乎在 Python 2 中字典键的顺序是任意但一致的,而在 Python 3 中,使用例如获得的字典的键的顺序vars()似乎是不确定的。

如果我运行:

class Test(object): pass
parameters = vars(Test)
print(list(parameters.keys()))

在 Python 2.7 和 Python 3.3 中,则:

  • Python 2.7 总是给我

['__dict__', '__module__', '__weakref__', '__doc__']
  • 使用 Python 3.3,我可以获得任何随机顺序 — — 例如:

['__weakref__', '__module__', '__qualname__', '__doc__', '__dict__']
['__doc__', '__dict__', '__qualname__', '__module__', '__weakref__']
['__dict__', '__module__', '__qualname__', '__weakref__', '__doc__']
['__weakref__', '__doc__', '__qualname__', '__dict__', '__module__']

这种不确定性从何而来?为什么

list({str(i): i for i in range(10)}.keys())

… 每次跑步都保持一致,始终给予

['3', '2', '1', '0', '7', '6', '5', '4', '9', '8']

…?


解决方案 1:


更新:在 Python 3.6 中,dict有一个新的实现可以保留插入顺序。从 Python 3.7 开始,这种保留顺序的行为得到保证:

dict对象的插入顺序保存特性已被宣布为 Python 语言规范的正式组成部分。


这是2012 年安全修复的结果,在 Python 3.3 中默认启用(向下滚动到“安全改进”)。

公告内容如下:

哈希随机化会导致字典和集合的迭代顺序不可预测,并且在 Python 运行过程中会有所不同。Python 从未保证过字典或集合中键的迭代顺序,建议应用程序永远不要依赖它。从历史上看,字典迭代顺序在各个版本之间变化不大,并且在 Python 的连续执行中始终保持一致。因此,一些现有应用程序可能依赖于字典或集合排序。由于这一点以及许多不接受不受信任输入的 Python 应用程序不易受到此攻击的事实,在此处提到的所有稳定 Python 版本中,哈希随机化默认处于禁用状态。

如上所述,最后一个大写位在 Python 3.3 中不再成立。

另请参阅: object.__hash__()文档(“注释”侧栏)。

PYTHONHASHSEED如果绝对必要的话,您可以通过将环境变量设置为 来禁用受此行为影响的 Python 版本中的哈希随机化0


你的反例:

list({str(i): i for i in range(10)}.keys())

…实际上在 Python 3.3 中并不总是给出相同的结果,尽管由于处理哈希冲突的方式,不同排序的数量是有限的:

$ for x in {0..999}
> do
>   python3.3 -c "print(list({str(i): i for i in range(10)}.keys()))"
> done | sort | uniq -c
     61 ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9']
     73 ['1', '0', '3', '2', '5', '4', '7', '6', '9', '8']
     62 ['2', '3', '0', '1', '6', '7', '4', '5', '8', '9']
     59 ['3', '2', '1', '0', '7', '6', '5', '4', '9', '8']
     58 ['4', '5', '6', '7', '0', '1', '2', '3', '8', '9']
     55 ['5', '4', '7', '6', '1', '0', '3', '2', '9', '8']
     62 ['6', '7', '4', '5', '2', '3', '0', '1', '8', '9']
     63 ['7', '6', '5', '4', '3', '2', '1', '0', '9', '8']
     60 ['8', '9', '0', '1', '2', '3', '4', '5', '6', '7']
     66 ['8', '9', '2', '3', '0', '1', '6', '7', '4', '5']
     65 ['8', '9', '4', '5', '6', '7', '0', '1', '2', '3']
     53 ['8', '9', '6', '7', '4', '5', '2', '3', '0', '1']
     62 ['9', '8', '1', '0', '3', '2', '5', '4', '7', '6']
     52 ['9', '8', '3', '2', '1', '0', '7', '6', '5', '4']
     73 ['9', '8', '5', '4', '7', '6', '1', '0', '3', '2']
     76 ['9', '8', '7', '6', '5', '4', '3', '2', '1', '0']

正如在这个答案开头所指出的,在 Python 3.6 中不再存在这种情况:

$ for x in {0..999}
> do
>   python3.6 -c "print(list({str(i): i for i in range(10)}.keys()))"
> done | sort | uniq -c
   1000 ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9']

解决方案 2:

但请注意,Python 3.7 仍然具有非确定性集合。字典保留插入顺序,但集合不保留。集合可以表现出相同的随机行为。

python3 -c "print({str(i) for i in range(9)})"

每次运行仍然会产生不同的结果。

相关推荐
  政府信创国产化的10大政策解读一、信创国产化的背景与意义信创国产化,即信息技术应用创新国产化,是当前中国信息技术领域的一个重要发展方向。其核心在于通过自主研发和创新,实现信息技术应用的自主可控,减少对外部技术的依赖,并规避潜在的技术制裁和风险。随着全球信息技术竞争的加剧,以及某些国家对中国在科技领域的打压,信创国产化显...
工程项目管理   1565  
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   1354  
  信创国产芯片作为信息技术创新的核心领域,对于推动国家自主可控生态建设具有至关重要的意义。在全球科技竞争日益激烈的背景下,实现信息技术的自主可控,摆脱对国外技术的依赖,已成为保障国家信息安全和产业可持续发展的关键。国产芯片作为信创产业的基石,其发展水平直接影响着整个信创生态的构建与完善。通过不断提升国产芯片的技术实力、产...
国产信创系统   21  
  信创生态建设旨在实现信息技术领域的自主创新和安全可控,涵盖了从硬件到软件的全产业链。随着数字化转型的加速,信创生态建设的重要性日益凸显,它不仅关乎国家的信息安全,更是推动产业升级和经济高质量发展的关键力量。然而,在推进信创生态建设的过程中,面临着诸多复杂且严峻的挑战,需要深入剖析并寻找切实可行的解决方案。技术创新难题技...
信创操作系统   27  
  信创产业作为国家信息技术创新发展的重要领域,对于保障国家信息安全、推动产业升级具有关键意义。而国产芯片作为信创产业的核心基石,其研发进展备受关注。在信创国产芯片的研发征程中,面临着诸多复杂且艰巨的难点,这些难点犹如一道道关卡,阻碍着国产芯片的快速发展。然而,科研人员和相关企业并未退缩,积极探索并提出了一系列切实可行的解...
国产化替代产品目录   28  
热门文章
项目管理软件有哪些?
云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用