从单独的键和值列表创建字典(dict)

2024-11-19 08:38:00
admin
原创
9
摘要:问题描述:我想将这些结合起来:keys = ['name', 'age', 'food'] values = ['Monty', 42, 'spam'] 放入一本字典中:{'name': 'Monty', 'age': 42, 'food': 'spam'} 我怎样才能做到这一点?解决方案 1:像这样:key...

问题描述:

我想将这些结合起来:

keys = ['name', 'age', 'food']
values = ['Monty', 42, 'spam']

放入一本字典中:

{'name': 'Monty', 'age': 42, 'food': 'spam'}

我怎样才能做到这一点?


解决方案 1:

像这样:

keys = ['a', 'b', 'c']
values = [1, 2, 3]
dictionary = dict(zip(keys, values))
print(dictionary) # {'a': 1, 'b': 2, 'c': 3}

瞧 :-) 成对的dict构造函数和zip函数非常有用。

解决方案 2:

想象一下你有:

keys = ('name', 'age', 'food')
values = ('Monty', 42, 'spam')

制作以下字典的最简单方法是什么?

dict = {'name' : 'Monty', 'age' : 42, 'food' : 'spam'}

性能最强的dict构造函数zip

new_dict = dict(zip(keys, values))

在 Python 3 中,zip 现在返回一个惰性迭代器,这是目前性能最高的方法。

dict(zip(keys, values))`dict确实需要对和进行一次全局查找zip`,但它不会形成任何不必要的中间数据结构,也不必处理函数应用中的本地查找。

词典理解类亚军:

与使用 dict 构造函数相比,紧随其后的是使用字典推导的本机语法(而不是列表推导,因为其他人错误地将其称为):

new_dict = {k: v for k, v in zip(keys, values)}

当您需要根据键或值进行映射或过滤时,请选择此项。

在 Python 2 中,zip返回一个列表,为避免创建不必要的列表,请改用izip(别名为 zip 可以减少迁移到 Python 3 时的代码更改)。

from itertools import izip as zip

因此这仍然是 (2.7):

new_dict = {k: v for k, v in zip(keys, values)}

Python 2,适合<= 2.6

izip在 Python 3 中,fromitertools变成了。对于 Python 2 来说,它比 zip 更好(因为它避免了不必要的列表创建),并且是 2.6 或更低版本的理想选择:zip`izip`

from itertools import izip
new_dict = dict(izip(keys, values))

所有情况的结果:

在所有情况下:

>>> new_dict
{'age': 42, 'name': 'Monty', 'food': 'spam'}

解释:

如果我们查看帮助,dict我们会发现它采用多种形式的参数:


>>> help(dict)

class dict(object)
 |  dict() -> new empty dictionary
 |  dict(mapping) -> new dictionary initialized from a mapping object's
 |      (key, value) pairs
 |  dict(iterable) -> new dictionary initialized as if via:
 |      d = {}
 |      for k, v in iterable:
 |          d[k] = v
 |  dict(**kwargs) -> new dictionary initialized with the name=value pairs
 |      in the keyword argument list.  For example:  dict(one=1, two=2)

最佳方法是使用可迭代对象,同时避免创建不必要的数据结构。在 Python 2 中,zip 会创建一个不必要的列表:

>>> zip(keys, values)
[('name', 'Monty'), ('age', 42), ('food', 'spam')]

在 Python 3 中,等效的代码如下:

>>> list(zip(keys, values))
[('name', 'Monty'), ('age', 42), ('food', 'spam')]

而 Python 3zip仅仅创建一个可迭代对象:

>>> zip(keys, values)
<zip object at 0x7f0e2ad029c8>

由于我们要避免创建不必要的数据结构,我们通常要避免使用 Python 2 zip(因为它会创建不必要的列表)。

性能较差的替代方案:

这是传递给 dict 构造函数的生成器表达式:

generator_expression = ((k, v) for k, v in zip(keys, values))
dict(generator_expression)

或者等价地:

dict((k, v) for k, v in zip(keys, values))

这是传递给 dict 构造函数的列表推导:

dict([(k, v) for k, v in zip(keys, values)])

在前两种情况下,zip 可迭代对象上会多出一层非操作性(因此是不必要的)计算,而在列表推导式的情况下,会不必要地创建一个额外的列表。我预计所有这些方法的性能都会降低,当然不会更高。

绩效考核:

在 Ubuntu 16.04 上由 Nix 提供的 64 位 Python 3.8.2 中,从最快到最慢排序:

>>> min(timeit.repeat(lambda: dict(zip(keys, values))))
0.6695233230129816
>>> min(timeit.repeat(lambda: {k: v for k, v in zip(keys, values)}))
0.6941362579818815
>>> min(timeit.repeat(lambda: {keys[i]: values[i] for i in range(len(keys))}))
0.8782548159942962
>>> 
>>> min(timeit.repeat(lambda: dict([(k, v) for k, v in zip(keys, values)])))
1.077607496001292
>>> min(timeit.repeat(lambda: dict((k, v) for k, v in zip(keys, values))))
1.1840861019445583

dict(zip(keys, values))即使使用较小的键和值集也能获胜,但对于较大的集合,性能差异会变得更大。

一位评论者说道:

min似乎不是比较性能的好方法。对于实际使用来说,mean和/或肯定max是更有用的指标。

我们使用min这些算法是因为这些算法是确定性的。我们想知道算法在最佳条件下的性能。

如果操作系统由于任何原因挂起,这与我们试图比较的内容无关,因此我们需要从分析中排除这些结果。

如果我们使用mean,这些类型的事件将极大地扭曲我们的结果,如果我们使用,max我们只会得到最极端的结果 - 最有可能受到此类事件影响的结果。

一位评论者还说:

在 Python 3.6.8 中,使用平均值,字典理解确实仍然更快,对于这些小列表,速度提高了约 30%。对于较大的列表(10k 个随机数),调用速度dict提高了约 10%。

我猜我们的意思是dict(zip(...使用 10k 个随机数。这听起来确实是一个相当不寻常的用例。最直接的调用在大型数据集中占主导地位是有道理的,考虑到运行该测试需要多长时间,我不会惊讶于操作系统挂起占主导地位,这会进一步扭曲您的数字。如果您使用mean或,max我会认为您的结果毫无意义。

让我们在最佳示例中使用更现实的尺寸:

import numpy
import timeit
l1 = list(numpy.random.random(100))
l2 = list(numpy.random.random(100))

我们在这里看到,dict(zip(...对于较大的数据集,它的运行速度确实提高了约 20%。

>>> min(timeit.repeat(lambda: {k: v for k, v in zip(l1, l2)}))
9.698965263989521
>>> min(timeit.repeat(lambda: dict(zip(l1, l2))))
7.9965161079890095

解决方案 3:

尝试一下:

>>> import itertools
>>> keys = ('name', 'age', 'food')
>>> values = ('Monty', 42, 'spam')
>>> adict = dict(itertools.izip(keys,values))
>>> adict
{'food': 'spam', 'age': 42, 'name': 'Monty'}

在 Python 2 中,与 相比,它在内存消耗方面也更经济zip

解决方案 4:

keys = ('name', 'age', 'food')
values = ('Monty', 42, 'spam')
out = dict(zip(keys, values))

输出:

{'food': 'spam', 'age': 42, 'name': 'Monty'}

解决方案 5:

您还可以在 Python ≥ 2.7 中使用字典推导:

>>> keys = ('name', 'age', 'food')
>>> values = ('Monty', 42, 'spam')
>>> {k: v for k, v in zip(keys, values)}
{'food': 'spam', 'age': 42, 'name': 'Monty'}

解决方案 6:

更自然的方法是使用字典理解

keys = ('name', 'age', 'food')
values = ('Monty', 42, 'spam')    
dict = {keys[i]: values[i] for i in range(len(keys))}

解决方案 7:

如果您需要在创建字典之前转换键或值,则可以使用生成器表达式。例如:

>>> adict = dict((str(k), v) for k, v in zip(['a', 1, 'b'], [2, 'c', 3])) 

看看像 Pythonista 一样编写代码:惯用的 Python。

解决方案 8:

使用 Python 3.x,用于字典推导

keys = ('name', 'age', 'food')
values = ('Monty', 42, 'spam')

dic = {k:v for k,v in zip(keys, values)}

print(dic)

这里有更多关于字典理解的内容,其中有一个例子:

>>> print {i : chr(65+i) for i in range(4)}
    {0 : 'A', 1 : 'B', 2 : 'C', 3 : 'D'}

解决方案 9:

对于那些需要简单代码并且不熟悉的人zip

List1 = ['This', 'is', 'a', 'list']
List2 = ['Put', 'this', 'into', 'dictionary']

这可以通过一行代码完成:

d = {List1[n]: List2[n] for n in range(len(List1))}

解决方案 10:

这也是在字典中添加列表值的一个例子:

listKey = ["Name", "Surname", "Age"]
listValue = [["Cyd", "Nikki", "Cindy"], ["Surname1", "Surname2", "Surname3"], [21, 32, 47]]
dic = dict(zip(listKey , listValue ))
print(dic)

始终确保您的“Key”(listKey)始终位于dict 的第一个参数中。

对于字典中的单一值

singleKey = ["Name", "Surname", "Age"]
singleValue = ["Cyd"], ["Surname1"], [21]
dic = dict(zip(singleKey , singleValue ))
print(dic)

始终确保您的“Key”(singleKey)始终位于dict的第一个参数中。

列表下面的输出

{
'Name': ['Cyd', 'Nikki', 'Cindy'], 
'Surname': ['Surname1', 'Surname2', 'Surname3'], 
'Age': [21, 32, 47]
}

单值输出

{
'Name': ['Cyd'], 
'Surname': ['Surname1'], 
'Age': [21]
}

解决方案 11:

我在尝试解决与图相关的问题时产生了这个疑问。我遇到的问题是我需要定义一个空的邻接列表,并希望用一个空列表初始化所有节点,那时我想如何检查它是否足够快,我的意思是是否值得执行 zip 操作而不是简单的赋值键值对。毕竟大多数时候,时间因素是一个重要的破冰者。所以我对这两种方法都执行了 timeit 操作。

import timeit
def dictionary_creation(n_nodes):
    dummy_dict = dict()
    for node in range(n_nodes):
        dummy_dict[node] = []
    return dummy_dict


def dictionary_creation_1(n_nodes):
    keys = list(range(n_nodes))
    values = [[] for i in range(n_nodes)]
    graph = dict(zip(keys, values))
    return graph


def wrapper(func, *args, **kwargs):
    def wrapped():
        return func(*args, **kwargs)
    return wrapped

iteration = wrapper(dictionary_creation, n_nodes)
shorthand = wrapper(dictionary_creation_1, n_nodes)

for trail in range(1, 8):
    print(f'Itertion: {timeit.timeit(iteration, number=trails)}
Shorthand: {timeit.timeit(shorthand, number=trails)}')

对于 n_nodes = 10,000,000,我得到,

迭代:2.825081646999024 简写:3.535717916001886

迭代:5.051560923002398 简写:6.255070794999483

迭代:6.52859034499852 简写:8.221581164998497

迭代:8.683652416999394 简写:12.599181543999293

迭代:11.587241565001023 简写:15.27298851100204

迭代:14.816342867001367 简写:17.162912737003353

迭代:16.645022411001264 简写:19.976680120998935

您可以清楚地看到,在某个点之后,第 n 步的迭代方法所花费的时间超过了第 n-1 步的简写方法所花费的时间。

解决方案 12:

您可以使用以下代码:

dict(zip(['name', 'age', 'food'], ['Monty', 42, 'spam']))

但要确保列表的长度相同。如果长度不相同,则 zip 函数将较长的列表转换为其他列表。

解决方案 13:

  • 2018-04-18

最好的解决办法依然是:

In [92]: keys = ('name', 'age', 'food')
...: values = ('Monty', 42, 'spam')
...: 

In [93]: dt = dict(zip(keys, values))
In [94]: dt
Out[94]: {'age': 42, 'food': 'spam', 'name': 'Monty'}

转置它:

    lst = [('name', 'Monty'), ('age', 42), ('food', 'spam')]
    keys, values = zip(*lst)
    In [101]: keys
    Out[101]: ('name', 'age', 'food')
    In [102]: values
    Out[102]: ('Monty', 42, 'spam')

解决方案 14:

这里的大多数答案都提到要创建包含来自和列表zip()的每个项目的元组。只要列表的长度相同,这种方法就很好。如果列表的长度不同,它会在较短的列表中停止;从而忽略较长列表中的其余元素。以下示例说明了这一点:keys`values`

keys = ['name', 'age', 'food']
values = ['Monty', 42]
dict(zip(keys, values))                    # {'name': 'Monty', 'age': 42}

如果不希望出现此行为,itertools.zip_longest标准库中存在类似的方法,该方法会创建一个迭代器,迭代直至较长的列表耗尽。默认情况下,缺失值将用 None 填充。

from itertools import zip_longest
dict(zip_longest(keys, values))            # {'name': 'Monty', 'age': 42, 'food': None}

它还接受fillvalue=kwarg,可用于指定用什么来填充缺失值。

dict(zip_longest(keys, values, fillvalue='spam')) # {'name': 'Monty', 'age': 42, 'food': 'spam'}

请注意,如果两个列表具有相同的长度,zip()itertools.zip_longest()产生相同的输出:

keys = values = range(5)
dict(zip(keys, values)) == dict(zip_longest(keys, values))                       # True
{k:v for k,v in zip(keys, values)} == {k:v for k,v in zip_longest(keys, values)} # True

解决方案 15:

如果您正在使用多组值并希望获得一个字典列表,您可以使用以下命令:

def as_dict_list(data: list, columns: list):
    return [dict((zip(columns, row))) for row in data]

实际示例是数据库查询中的元组列表与同一查询中的列元组配对。其他答案仅提供 1 对 1。

解决方案 16:

可以通过下列方式来实现。

keys = ['name', 'age', 'food']
values = ['Monty', 42, 'spam'] 

dict = {}

for i in range(len(keys)):
    dict[keys[i]] = values[i]
    
print(dict)

{'name': 'Monty', 'age': 42, 'food': 'spam'}

解决方案 17:

所有答案总结如下:

l = [1, 5, 8, 9]
ll = [3, 7, 10, 11]

邮政编码

dict(zip(l,ll)) # {1: 3, 5: 7, 8: 10, 9: 11}

#if you want to play with key or value @recommended

{k:v*10 for k, v in zip(l, ll)} #{1: 30, 5: 70, 8: 100, 9: 110}

柜台

d = {}
c=0
for k in l:
    d[k] = ll[c] #setting up keys from the second list values
    c += 1
print(d)
{1: 3, 5: 7, 8: 10, 9: 11}

枚举

d = {}
for i,k in enumerate(l):
    d[k] = ll[i]
print(d)
{1: 3, 5: 7, 8: 10, 9: 11}

解决方案 18:

没有 zip 函数的方法

l1 = [1,2,3,4,5]
l2 = ['a','b','c','d','e']
d1 = {}
for l1_ in l1:
    for l2_ in l2:
        d1[l1_] = l2_
        l2.remove(l2_)
        break  

print (d1)


{1: 'd', 2: 'b', 3: 'e', 4: 'a', 5: 'c'}

解决方案 19:

解决方案为使用枚举的字典理解:

dict = {item : values[index] for index, item in enumerate(keys)}

解决方案与枚举循环相同:

dict = {}
for index, item in enumerate(keys):
    dict[item] = values[index]

解决方案 20:

虽然有多种方法可以做到这一点,但我认为最基本的方法是创建一个循环和字典,并将值存储到该字典中。在递归方法中,其思想仍然相同,但不是使用循环,而是函数调用自身直到到达末尾。当然还有其他方法,例如使用dict(zip(key, value))和等。这些不是最有效的解决方案。

y = [1,2,3,4]
x = ["a","b","c","d"]

# This below is a brute force method
obj = {}
for i in range(len(y)):
    obj[y[i]] = x[i]
print(obj)

# Recursive approach 
obj = {}
def map_two_lists(a,b,j=0):
    if j < len(a):
        obj[b[j]] = a[j]
        j +=1
        map_two_lists(a, b, j)
        return obj
      


res = map_two_lists(x,y)
print(res)

两个结果都应该打印

{1: 'a', 2: 'b', 3: 'c', 4: 'd'}  

解决方案 21:

keys = ['name', 'age', 'food']
values = ['Monty', 42, 'spam']
dic = {}
c = 0
for i in keys:
    dic[i] = values[c]
    c += 1

print(dic)
{'name': 'Monty', 'age': 42, 'food': 'spam'}
相关推荐
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   601  
  华为IPD与传统研发模式的8大差异在快速变化的商业环境中,产品研发模式的选择直接决定了企业的市场响应速度和竞争力。华为作为全球领先的通信技术解决方案供应商,其成功在很大程度上得益于对产品研发模式的持续创新。华为引入并深度定制的集成产品开发(IPD)体系,相较于传统的研发模式,展现出了显著的差异和优势。本文将详细探讨华为...
IPD流程是谁发明的   7  
  如何通过IPD流程缩短产品上市时间?在快速变化的市场环境中,产品上市时间成为企业竞争力的关键因素之一。集成产品开发(IPD, Integrated Product Development)作为一种先进的产品研发管理方法,通过其结构化的流程设计和跨部门协作机制,显著缩短了产品上市时间,提高了市场响应速度。本文将深入探讨如...
华为IPD流程   9  
  在项目管理领域,IPD(Integrated Product Development,集成产品开发)流程图是连接创意、设计与市场成功的桥梁。它不仅是一个视觉工具,更是一种战略思维方式的体现,帮助团队高效协同,确保产品按时、按质、按量推向市场。尽管IPD流程图可能初看之下显得错综复杂,但只需掌握几个关键点,你便能轻松驾驭...
IPD开发流程管理   8  
  在项目管理领域,集成产品开发(IPD)流程被视为提升产品上市速度、增强团队协作与创新能力的重要工具。然而,尽管IPD流程拥有诸多优势,其实施过程中仍可能遭遇多种挑战,导致项目失败。本文旨在深入探讨八个常见的IPD流程失败原因,并提出相应的解决方法,以帮助项目管理者规避风险,确保项目成功。缺乏明确的项目目标与战略对齐IP...
IPD流程图   8  
热门文章
项目管理软件有哪些?
云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用