用列表值反转字典

2025-01-10 08:47:00
admin
原创
97
摘要:问题描述:我有这个索引作为一个字典。index = { 'Testfil2.txt': ['nisse', 'hue', 'abe', 'pind'], 'Testfil1.txt': ['hue', 'abe', 'tosse', 'svend']} 我需要反转索引,这样它将是一个字典,其中...

问题描述:

我有这个索引作为一个字典。

index = {
    'Testfil2.txt': ['nisse', 'hue', 'abe', 'pind'],
    'Testfil1.txt': ['hue', 'abe', 'tosse', 'svend']}

我需要反转索引,这样它将是一个字典,其中重复的值合并为一个键,并以 2 个原始键作为值,如下所示:

inverse = {
    'nisse': ['Testfil2.txt'],
    'hue': ['Testfil2.txt', 'Testfil1.txt'],
    'abe': ['Testfil2.txt', 'Testfil1.txt'],
    'pind': ['Testfil2.txt'], 
    'tosse': ['Testfil1.txt'],
    'svend': ['Testfil1.txt']}

我的教科书有这个反转字典的功能:

def invert_dict(d): 
    inverse = dict() 
    for key in d: 
        val = d[key] 
        if val not in inverse: 
            inverse[val] = [key] 
        else: 
            inverse[val].append(key) 
    return inverse

它对于简单的键:值对工作得很好,但是,当我尝试使用具有列表作为值的字典(例如我的)时index,我收到此错误消息:

Traceback (most recent call last):
  File "<pyshell#153>", line 1, in <module>
    invert_dict(index)
  File "<pyshell#150>", line 5, in invert_dict
    if val not in inverse:
TypeError: unhashable type: 'list'

这本书没有帮助,我怀疑我可以以某种方式使用元组,但我不确定如何。


解决方案 1:

我对反转字典的解决方案。

inverse = {}
for k,v in index.items():
    for x in v:
        inverse.setdefault(x, []).append(k)

输出:

{'nisse': ['Testfil2.txt'],
 'hue': ['Testfil2.txt', 'Testfil1.txt'],
 'abe': ['Testfil2.txt', 'Testfil1.txt'],
 'pind': ['Testfil2.txt'],
 'tosse': ['Testfil1.txt'],
 'svend': ['Testfil1.txt']}

解决方案 2:

我已经尝试过了,你想使用val not in inverse,但无法检查“列表是否在字典中”。 (val是一个列表)

对于您的代码,一个简单的更改就可以实现您想要的效果:

def invert_dict(d): 
    inverse = dict() 
    for key in d: 
        # Go through the list that is saved in the dict:
        for item in d[key]:
            # Check if in the inverted dict the key exists
            if item not in inverse: 
                # If not create a new list
                inverse[item] = [key] 
            else: 
                inverse[item].append(key) 
    return inverse

解决方案 3:

作为嵌套理解:

inverse = { v: k for k, l in index.items() for v in l }

或者更清楚地说:

inverse = { 
            new_key: index_key                              #body
            for index_key, index_value in index.items()     #outer loop
                for new_key in index_value                  #inner loop
            }

大致相当于:

new_keys    =   []
new_values  =   []

for index_key, index_value in index.items():
    for new_key in index_value:
        new_keys.append(new_key)
        new_values.append(index_key)
        
inverse     =   dict(zip(new_keys,new_values))

解决方案 4:

您不能使用list对象作为字典键,因为它们应该是可哈希的对象。您可以循环遍历您的项目并使用dict.setdefault方法来创建预期结果:

new = {}
for k,value in index.items():
    for v in value:
        new.setdefault(v, []).append(k)

结果:

{'nisse': ['Testfil2.txt'],
 'hue': ['Testfil2.txt', 'Testfil1.txt'],
 'abe': ['Testfil2.txt', 'Testfil1.txt'],
 'pind': ['Testfil2.txt'],
 'tosse': ['Testfil1.txt'],
 'svend': ['Testfil1.txt']}

如果您正在处理更大的数据集,则拒绝在每次调用setdefault()方法时创建一个空列表,您可以使用该方法collections.defaultdict(),当遇到新键时它将调用缺少的函数。

from collections import defaultdict

new = defaultdict(list)
for k,value in index.items():
    for v in value:
        new[v].append(k)

结果:

defaultdict(<type 'list'>,
    {'nisse': ['Testfil2.txt'],
     'hue': ['Testfil2.txt', 'Testfil1.txt'],
     'abe': ['Testfil2.txt', 'Testfil1.txt'],
     'pind': ['Testfil2.txt'],
     'tosse': ['Testfil1.txt'],
     'svend': ['Testfil1.txt']})

解决方案 5:

这是一个使用理解加法set来删除重复项的变体。

def invert_setdict(setdict):
    inverse = {}
    vk = [(v, k) for k, vs in index.items() for v in vs]
    for k, v in vk:
       inverse.setdefault(k, set()).add(v)

    return inverse

例子

>>> index = {
... 'Testfil2.txt': ['nisse', 'hue', 'abe', 'pind'],
... 'Testfil1.txt': ['hue', 'abe', 'tosse', 'svend']}

>>> inverse = invert_setdict(index)
>>> inverse
{'nisse': {'Testfil2.txt'},
 'hue': {'Testfil1.txt', 'Testfil2.txt'},
 'abe': {'Testfil1.txt', 'Testfil2.txt'},
 'pind': {'Testfil2.txt'},
 'tosse': {'Testfil1.txt'},
 'svend': {'Testfil1.txt'}}

如果要将设置值转换为列表:

>>> inverse = {k:list(v) for k, v in inverse.items()}

解决方案 6:

*使用解包运算符和嵌套压缩的两行解决方案。

for k,v in old_dict.items():
    new_dict = {**new_dict,**{vi:k for vi in v}}
相关推荐
  政府信创国产化的10大政策解读一、信创国产化的背景与意义信创国产化,即信息技术应用创新国产化,是当前中国信息技术领域的一个重要发展方向。其核心在于通过自主研发和创新,实现信息技术应用的自主可控,减少对外部技术的依赖,并规避潜在的技术制裁和风险。随着全球信息技术竞争的加剧,以及某些国家对中国在科技领域的打压,信创国产化显...
工程项目管理   1565  
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   1354  
  信创国产芯片作为信息技术创新的核心领域,对于推动国家自主可控生态建设具有至关重要的意义。在全球科技竞争日益激烈的背景下,实现信息技术的自主可控,摆脱对国外技术的依赖,已成为保障国家信息安全和产业可持续发展的关键。国产芯片作为信创产业的基石,其发展水平直接影响着整个信创生态的构建与完善。通过不断提升国产芯片的技术实力、产...
国产信创系统   21  
  信创生态建设旨在实现信息技术领域的自主创新和安全可控,涵盖了从硬件到软件的全产业链。随着数字化转型的加速,信创生态建设的重要性日益凸显,它不仅关乎国家的信息安全,更是推动产业升级和经济高质量发展的关键力量。然而,在推进信创生态建设的过程中,面临着诸多复杂且严峻的挑战,需要深入剖析并寻找切实可行的解决方案。技术创新难题技...
信创操作系统   27  
  信创产业作为国家信息技术创新发展的重要领域,对于保障国家信息安全、推动产业升级具有关键意义。而国产芯片作为信创产业的核心基石,其研发进展备受关注。在信创国产芯片的研发征程中,面临着诸多复杂且艰巨的难点,这些难点犹如一道道关卡,阻碍着国产芯片的快速发展。然而,科研人员和相关企业并未退缩,积极探索并提出了一系列切实可行的解...
国产化替代产品目录   28  
热门文章
项目管理软件有哪些?
云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用