列表推导式即使在推导范围之后也会重新绑定名称。这是对的吗?
- 2024-12-17 08:31:00
- admin 原创
- 143
问题描述:
理解与作用域的交互不寻常。这是预期的行为吗?
x = "original value"
squares = [x**2 for x in range(5)]
print(x) # Prints 4 in Python 2!
冒着抱怨的风险,这是一个残酷的错误来源。当我编写新代码时,我偶尔会发现由于重新绑定而导致的非常奇怪的错误——即使现在我知道这是一个问题。我需要制定一条规则,例如“在列表推导中始终用下划线作为临时变量的前缀”,但即使这样也并非万无一失。事实上,这种随机定时炸弹的等待抵消了列表推导的所有美好的“易用性”。
解决方案 1:
列表推导在 Python 2 中会泄露循环控制变量,但在 Python 3 中不会。下面是 Guido van Rossum(Python 的创建者)解释这背后的历史:
我们还在 Python 3 中做了另一项更改,以改进列表推导和生成器表达式之间的等价性。在 Python 2 中,列表推导将循环控制变量“泄漏”到周围范围中:
x = 'before' a = [x for x in 1, 2, 3] print x # this prints '3', not 'before'
这是列表推导式最初实现的产物;多年来,它一直是 Python 的“肮脏的小秘密”之一。它最初是为了让列表推导式变得非常快而故意做出的妥协,虽然这对初学者来说不是一个常见的陷阱,但偶尔确实会让人感到刺痛。对于生成器表达式,我们不能这样做。生成器表达式是使用生成器实现的,生成器的执行需要单独的执行框架。因此,生成器表达式(尤其是当它们迭代短序列时)的效率低于列表推导式。
然而,在 Python 3 中,我们决定使用与生成器表达式相同的实现策略来修复列表推导的“肮脏的小秘密”。因此,在 Python 3 中,上述示例(修改为使用 print(x) :-) 将打印“before”,证明列表推导中的“x”暂时遮蔽但不会覆盖周围范围中的“x”。
解决方案 2:
是的,列表推导在 Python 2.x 中“泄漏”了它们的变量,就像 for 循环一样。
回想起来,这被认为是一个错误,并且通过生成器表达式避免了这个问题。编辑:正如 Matt B. 指出的那样,当集合和字典理解语法从 Python 3 反向移植时,这个问题也得到了避免。
列表推导的行为必须保留在 Python 2 中,但它在 Python 3 中已完全修复。
这意味着:
list(x for x in a if x>32)
set(x//4 for x in a if x>32) # just another generator exp.
dict((x, x//16) for x in a if x>32) # yet another generator exp.
{x//4 for x in a if x>32} # 2.7+ syntax
{x: x//16 for x in a if x>32} # 2.7+ syntax
x
对于表达式来说,它总是局部的,而这些:
[x for x in a if x>32]
set([x//4 for x in a if x>32]) # just another list comp.
dict([(x, x//16) for x in a if x>32]) # yet another list comp.
在 Python 2.x 中,所有x
变量都会泄漏到周围范围。
Python 3.8 更新:PEP 572引入了:=
赋值运算符,它故意泄漏理解和生成器表达式!这种泄漏主要由 2 个用例引起:从提前终止的函数(如any()
和all()
)中捕获“见证”:
if any((comment := line).startswith('#') for line in lines):
print("First comment:", comment)
else:
print("There are no comments")
并更新可变状态:
total = 0
partial_sums = [total := total + v for v in values]
有关确切的作用域,请参阅附录 B。变量在最接近的周围def
或中分配lambda
,除非该函数声明它nonlocal
或global
。
解决方案 3:
是的,那里确实发生了赋值,就像在循环中一样for
。没有创建新的作用域。
这绝对是预期的行为:在每个循环中,值都会绑定到您指定的名称。例如,
>>> x=0
>>> a=[1,54,4,2,32,234,5234,]
>>> [x for x in a if x>32]
[54, 234, 5234]
>>> x
5234
一旦认识到这一点,似乎很容易避免:不要在理解中使用现有的变量名称。
解决方案 4:
有趣的是,这不会影响字典或集合理解。
>>> [x for x in range(1, 10)]
[1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> x
9
>>> {x for x in range(1, 5)}
set([1, 2, 3, 4])
>>> x
9
>>> {x:x for x in range(1, 100)}
{1: 1, 2: 2, 3: 3, 4: 4, 5: 5, 6: 6, 7: 7, 8: 8, 9: 9, 10: 10, 11: 11, 12: 12, 13: 13, 14: 14, 15: 15, 16: 16, 17: 17, 18: 18, 19: 19, 20: 20, 21: 21, 22: 22, 23: 23, 24: 24, 25: 25, 26: 26, 27: 27, 28: 28, 29: 29, 30: 30, 31: 31, 32: 32, 33: 33, 34: 34, 35: 35, 36: 36, 37: 37, 38: 38, 39: 39, 40: 40, 41: 41, 42: 42, 43: 43, 44: 44, 45: 45, 46: 46, 47: 47, 48: 48, 49: 49, 50: 50, 51: 51, 52: 52, 53: 53, 54: 54, 55: 55, 56: 56, 57: 57, 58: 58, 59: 59, 60: 60, 61: 61, 62: 62, 63: 63, 64: 64, 65: 65, 66: 66, 67: 67, 68: 68, 69: 69, 70: 70, 71: 71, 72: 72, 73: 73, 74: 74, 75: 75, 76: 76, 77: 77, 78: 78, 79: 79, 80: 80, 81: 81, 82: 82, 83: 83, 84: 84, 85: 85, 86: 86, 87: 87, 88: 88, 89: 89, 90: 90, 91: 91, 92: 92, 93: 93, 94: 94, 95: 95, 96: 96, 97: 97, 98: 98, 99: 99}
>>> x
9
然而,正如上面提到的,这个问题已经在 3 中被修复了。
解决方案 5:
对于 Python 2.6,当这种行为不受欢迎时,有一些解决方法
# python
Python 2.6.6 (r266:84292, Aug 9 2016, 06:11:56)
Type "help", "copyright", "credits" or "license" for more information.
>>> x=0
>>> a=list(x for x in xrange(9))
>>> x
0
>>> a=[x for x in xrange(9)]
>>> x
8
解决方案 6:
在 python3 中,在列表推导中,变量在其范围结束后不会发生变化,但是当我们使用简单的 for 循环时,变量会被重新分配到范围之外。
i = 1 print(i) print([i in range(5)]) print(i) i 的值将仅保持为 1。
现在只需使用简单的 for 循环即可重新分配 i 的值。