列表理解中的双重迭代[重复]
- 2025-01-15 08:46:00
- admin 原创
- 76
问题描述:
在 Python 中,你可以在列表推导中拥有多个迭代器,例如
[(x,y) for x in a for y in b]
对于一些合适的序列 a 和 b。我知道 Python 列表推导的嵌套循环语义。
我的问题是:理解中的一个迭代器可以引用另一个迭代器吗?换句话说:我是否可以有这样的事情:
[x for x in a for a in b]
其中外循环的当前值是内循环的迭代器?
例如,如果我有一个嵌套列表:
a=[[1,2],[3,4]]
要实现这个结果,列表理解表达式应该是什么:
[1,2,3,4]
??(请仅列出理解答案,因为这是我想要找出的)。
解决方案 1:
假设您有一段充满句子的文本,并且您想要一个单词数组。
# Without list comprehension
list_of_words = []
for sentence in text:
for word in sentence:
list_of_words.append(word)
return list_of_words
我喜欢将列表理解视为水平拉伸代码。
尝试将其分解为:
# List Comprehension
[word for sentence in text for word in sentence]
例子:
>>> text = (("Hi", "Steve!"), ("What's", "up?"))
>>> [word for sentence in text for word in sentence]
['Hi', 'Steve!', "What's", 'up?']
这也适用于发电机
>>> text = (("Hi", "Steve!"), ("What's", "up?"))
>>> gen = (word for sentence in text for word in sentence)
>>> for word in gen: print(word)
Hi
Steve!
What's
up?
解决方案 2:
用你自己的建议来回答你的问题:
>>> [x for b in a for x in b] # Works fine
当您要求列表理解答案时,让我也指出优秀的 itertools.chain():
>>> from itertools import chain
>>> list(chain.from_iterable(a))
>>> list(chain(*a)) # If you're using python < 2.6
解决方案 3:
哎呀,我想我找到答案了:我没有足够注意哪个循环是内部循环,哪个是外部循环。列表推导应该是这样的:
[x for b in a for x in b]
以获得所需的结果,是的,一个当前值可以作为下一个循环的迭代器。
解决方案 4:
迭代器的顺序可能看起来违反直觉。
举个例子:[str(x) for i in range(3) for x in foo(i)]
让我们分解一下:
def foo(i):
return i, i + 0.5
[str(x)
for i in range(3)
for x in foo(i)
]
# is same as
for i in range(3):
for x in foo(i):
yield str(x)
解决方案 5:
这种记忆技术对我帮助很大:
[ <RETURNED_VALUE> <OUTER_LOOP1> <INNER_LOOP2> <INNER_LOOP3> ... <OPTIONAL_IF> ]
现在你可以认为R eturn +外循环是唯一正确的顺序
了解上述内容后,即使对于 3 个循环,列表中的顺序也看起来很简单:
c=[111, 222, 333]
b=[11, 22, 33]
a=[1, 2, 3]
print(
[
(i, j, k) # <RETURNED_VALUE>
for i in a for j in b for k in c # in order: loop1, loop2, loop3
if i < 2 and j < 20 and k < 200 # <OPTIONAL_IF>
]
)
[(1, 11, 111)]
因为上面只是一个:
for i in a: # outer loop1 GOES SECOND
for j in b: # inner loop2 GOES THIRD
for k in c: # inner loop3 GOES FOURTH
if i < 2 and j < 20 and k < 200:
print((i, j, k)) # returned value GOES FIRST
对于迭代一个嵌套列表/结构,技术是相同的:对于a
问题:
a = [[1,2],[3,4]]
[i2 for i1 in a for i2 in i1]
which return [1, 2, 3, 4]
嵌套级别
a = [[[1, 2], [3, 4]], [[5, 6], [7, 8, 9]], [[10]]]
[i3 for i1 in a for i2 in i1 for i3 in i2]
which return [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
等等
解决方案 6:
ThomasH 已经给出了一个很好的答案,但我想展示一下发生了什么:
>>> a = [[1, 2], [3, 4]]
>>> [x for x in b for b in a]
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
NameError: name 'b' is not defined
>>> [x for b in a for x in b]
[1, 2, 3, 4]
>>> [x for x in b for b in a]
[3, 3, 4, 4]
我猜 Python 是从左到右解析列表推导的。这意味着,第一个for
发生的循环将首先执行。
第二个“问题”是 会b
从列表推导中“泄露”出来。在第一次列表推导成功之后b == [3, 4]
。
解决方案 7:
我第一次尝试写出双重列表推导式时,总是写不出来。读了PEP202后,我发现原因是它的实现方式与英语中读到的方式相反。好消息是,这是一个合乎逻辑的实现,所以一旦你理解了结构,就很容易写对。
假设 a、b、c、d 是连续嵌套的对象。对我来说,扩展列表理解的直观方法是模仿英语:
# works
[f(b) for b in a]
# does not work
[f(c) for c in b for b in a]
[f(c) for c in g(b) for b in a]
[f(d) for d in c for c in b for b in a]
换句话说,你应该从下往上阅读,即
# wrong logic
(((d for d in c) for c in b) for b in a)
然而,这并不是Python 实现嵌套列表的方式。相反,实现将第一个块视为完全独立的,然后从上到下(而不是从下到上)将for
s 和s 链接在一个块中,即in
# right logic
d: (for b in a, for c in b, for d in c)
请注意,最深的嵌套级别(for d in c
)距离列表中的最后一个对象最远(d
)。原因来自 Guido 本人:
该形式
[... for x... for y...]
嵌套,最后一个索引变化最快,就像嵌套的 for 循环一样。
使用Skam的文本示例,这一点变得更加清晰:
# word: for sentence in text, for word in sentence
[word for sentence in text for word in sentence]
# letter: for sentence in text, for word in sentence, for letter in word
[letter for sentence in text for word in sentence for letter in word]
# letter:
# for sentence in text if len(sentence) > 2,
# for word in sentence[0],
# for letter in word if letter.isvowel()
[letter for sentence in text if len(sentence) > 2 for word in sentence[0] for letter in word if letter.isvowel()]
解决方案 8:
如果要保留多维数组,则应嵌套数组括号。请参见下面的示例,其中每个元素都添加了一个。
>>> a = [[1, 2], [3, 4]]
>>> [[col +1 for col in row] for row in a]
[[2, 3], [4, 5]]
>>> [col +1 for row in a for col in row]
[2, 3, 4, 5]
解决方案 9:
我觉得这更容易理解
[row[i] for row in a for i in range(len(a))]
result: [1, 2, 3, 4]
解决方案 10:
此外,您可以对当前访问的输入列表成员和此成员内的元素使用相同的变量。然而,这甚至可能使它(列表)更难以理解。
input = [[1, 2], [3, 4]]
[x for x in input for x in x]
首先for x in input
进行评估,得到输入的一个成员列表,然后,Python 遍历第二部分,for x in x
在此期间 x 值被它正在访问的当前元素覆盖,然后第一个x
定义我们想要返回的内容。
解决方案 11:
此 flatten_nlevel 函数递归调用嵌套的 list1 以转换为一个级别。试试这个
def flatten_nlevel(list1, flat_list):
for sublist in list1:
if isinstance(sublist, type(list)):
flatten_nlevel(sublist, flat_list)
else:
flat_list.append(sublist)
list1 = [1,[1,[2,3,[4,6]],4],5]
items = []
flatten_nlevel(list1,items)
print(items)
输出:
[1, 1, 2, 3, 4, 6, 4, 5]