拆包、扩展拆包和嵌套扩展拆包-IT科技

摘要：问题描述：考虑以下表达式。请注意，有些表达式被重复以呈现“上下文”。（这是一个很长的列表）a, b = 1, 2 # simple sequence assignment a, b = ['green', 'blue'] # list ...

问题描述：

考虑以下表达式。请注意，有些表达式被重复以呈现“上下文”。

（这是一个很长的列表）

a, b = 1, 2                          # simple sequence assignment
a, b = ['green', 'blue']             # list asqignment
a, b = 'XY'                          # string assignment
a, b = range(1,5,2)                  # any iterable will do


                                     # nested sequence assignment

(a,b), c = "XY", "Z"                 # a = 'X', b = 'Y', c = 'Z' 

(a,b), c = "XYZ"                     # ERROR -- too many values to unpack
(a,b), c = "XY"                      # ERROR -- need more than 1 value to unpack

(a,b), c, = [1,2],'this'             # a = '1', b = '2', c = 'this'
(a,b), (c,) = [1,2],'this'           # ERROR -- too many values to unpack


                                     # extended sequence unpacking

a, *b = 1,2,3,4,5                    # a = 1, b = [2,3,4,5]
*a, b = 1,2,3,4,5                    # a = [1,2,3,4], b = 5
a, *b, c = 1,2,3,4,5                 # a = 1, b = [2,3,4], c = 5

a, *b = 'X'                          # a = 'X', b = []
*a, b = 'X'                          # a = [], b = 'X'
a, *b, c = "XY"                      # a = 'X', b = [], c = 'Y'
a, *b, c = "X...Y"                   # a = 'X', b = ['.','.','.'], c = 'Y'

a, b, *c = 1,2,3                     # a = 1, b = 2, c = [3]
a, b, c, *d = 1,2,3                  # a = 1, b = 2, c = 3, d = []

a, *b, c, *d = 1,2,3,4,5             # ERROR -- two starred expressions in assignment

(a,b), c = [1,2],'this'              # a = '1', b = '2', c = 'this'
(a,b), *c = [1,2],'this'             # a = '1', b = '2', c = ['this']

(a,b), c, *d = [1,2],'this'          # a = '1', b = '2', c = 'this', d = []
(a,b), *c, d = [1,2],'this'          # a = '1', b = '2', c = [], d = 'this'

(a,b), (c, *d) = [1,2],'this'        # a = '1', b = '2', c = 't', d = ['h', 'i', 's']

*a = 1                               # ERROR -- target must be in a list or tuple
*a = (1,2)                           # ERROR -- target must be in a list or tuple
*a, = (1,2)                          # a = [1,2]
*a, = 1                              # ERROR -- 'int' object is not iterable
*a, = [1]                            # a = [1]
*a = [1]                             # ERROR -- target must be in a list or tuple
*a, = (1,)                           # a = [1]
*a, = (1)                            # ERROR -- 'int' object is not iterable

*a, b = [1]                          # a = [], b = 1
*a, b = (1,)                         # a = [], b = 1

(a,b),c = 1,2,3                      # ERROR -- too many values to unpack
(a,b), *c = 1,2,3                    # ERROR - 'int' object is not iterable
(a,b), *c = 'XY', 2, 3               # a = 'X', b = 'Y', c = [2,3]


                                     # extended sequence unpacking -- NESTED

(a,b),c = 1,2,3                      # ERROR -- too many values to unpack
*(a,b), c = 1,2,3                    # a = 1, b = 2, c = 3

*(a,b) = 1,2                         # ERROR -- target must be in a list or tuple
*(a,b), = 1,2                        # a = 1, b = 2

*(a,b) = 'XY'                        # ERROR -- target must be in a list or tuple
*(a,b), = 'XY'                       # a = 'X', b = 'Y'

*(a, b) = 'this'                     # ERROR -- target must be in a list or tuple
*(a, b), = 'this'                    # ERROR -- too many values to unpack
*(a, *b), = 'this'                   # a = 't', b = ['h', 'i', 's']

*(a, *b), c = 'this'                 # a = 't', b = ['h', 'i'], c = 's'

*(a,*b), = 1,2,3,3,4,5,6,7           # a = 1, b = [2, 3, 3, 4, 5, 6, 7]

*(a,*b), *c = 1,2,3,3,4,5,6,7        # ERROR -- two starred expressions in assignment
*(a,*b), (*c,) = 1,2,3,3,4,5,6,7     # ERROR -- 'int' object is not iterable
*(a,*b), c = 1,2,3,3,4,5,6,7         # a = 1, b = [2, 3, 3, 4, 5, 6], c = 7
*(a,*b), (*c,) = 1,2,3,4,5,'XY'      # a = 1, b = [2, 3, 4, 5], c = ['X', 'Y']

*(a,*b), c, d = 1,2,3,3,4,5,6,7      # a = 1, b = [2, 3, 3, 4, 5], c = 6, d = 7
*(a,*b), (c, d) = 1,2,3,3,4,5,6,7    # ERROR -- 'int' object is not iterable
*(a,*b), (*c, d) = 1,2,3,3,4,5,6,7   # ERROR -- 'int' object is not iterable
*(a,*b), *(c, d) = 1,2,3,3,4,5,6,7   # ERROR -- two starred expressions in assignment


*(a,b), c = 'XY', 3                  # ERROR -- need more than 1 value to unpack
*(*a,b), c = 'XY', 3                 # a = [], b = 'XY', c = 3
(a,b), c = 'XY', 3                   # a = 'X', b = 'Y', c = 3

*(a,b), c = 'XY', 3, 4               # a = 'XY', b = 3, c = 4
*(*a,b), c = 'XY', 3, 4              # a = ['XY'], b = 3, c = 4
(a,b), c = 'XY', 3, 4                # ERROR -- too many values to unpack

如何手动正确推导此类表达式的结果？

解决方案 1：

我很抱歉这篇文章太长，但我决定选择完整性。

一旦你了解了一些基本规则，概括它们并不难。我会尽力用几个例子来解释。既然你在谈论“手动”评估这些，我会建议一些简单的替换规则。基本上，如果所有可迭代对象的格式都相同，你可能会发现更容易理解表达式。

仅出于解包目的，以下替换在右侧有效=（即对于右值）：

'XY' -> ('X', 'Y')
['X', 'Y'] -> ('X', 'Y')

如果您发现某个值没有被解包，那么您将撤消替换。（请参阅下文以了解更多解释。）

另外，当你看到“裸”逗号时，假设有一个顶级元组。在左侧和右侧都执行此操作（即左值和右值）：

'X', 'Y' -> ('X', 'Y')
a, b -> (a, b)

记住这些简单的规则，下面是一些示例：

(a,b), c = "XY", "Z"                 # a = 'X', b = 'Y', c = 'Z'

应用上述规则，我们转换"XY"为('X', 'Y')，并覆盖括号中的裸逗号：

((a, b), c) = (('X', 'Y'), 'Z')

这里的视觉对应关系使得任务的执行方式变得相当明显。

这是一个错误的例子：

(a,b), c = "XYZ"

按照上述替换规则，我们得到以下内容：

((a, b), c) = ('X', 'Y', 'Z')

这显然是错误的；嵌套结构不匹配。现在让我们看看它在一个稍微复杂一点的例子中是如何工作的：

(a,b), c, = [1,2],'this'             # a = '1', b = '2', c = 'this'

应用上述规则，我们得到

((a, b), c) = ((1, 2), ('t', 'h', 'i', 's'))

但现在从结构上可以清楚看出'this'不会被解包，而是直接分配给c。所以我们撤消替换。

((a, b), c) = ((1, 2), 'this')

现在让我们看看当我们包装c一个元组时会发生什么：

(a,b), (c,) = [1,2],'this'           # ERROR -- too many values to unpack

成为

((a, b), (c,)) = ((1, 2), ('t', 'h', 'i', 's'))

同样，错误显而易见。c不再是裸变量，而是序列内的变量，因此右侧对应的序列被解包为(c,)。但序列的长度不同，因此出现错误。

现在使用*运算符进行扩展解包。这有点复杂，但仍然相当简单。前面带有的变量*变为列表，其中包含相应序列中未分配给变量名的任何项目。从一个相当简单的例子开始：

a, *b, c = "X...Y"                   # a = 'X', b = ['.','.','.'], c = 'Y'

这变成

(a, *b, c) = ('X', '.', '.', '.', 'Y')

分析此问题的最简单方法是从两端开始。'X'被分配给a，'Y'被分配给c。序列中的其余值放入列表中并分配给b。

像(*a, b)和这样的左值(a, *b)只是上述情况的特殊情况。您不能*在一个左值序列中有两个运算符，因为这会产生歧义。在这种情况下，值应该放在哪里(a, *b, *c, d)——在b或中c？我稍后会考虑嵌套的情况。

*a = 1                               # ERROR -- target must be in a list or tuple

这里的错误很容易解释。目标 ( *a) 必须在元组中。

*a, = (1,2)                          # a = [1,2]

这是可行的，因为有一个裸逗号。应用规则...

(*a,) = (1, 2)

由于除了之外没有其他变量*a，*a因此会吸收右值序列中的所有值。如果(1, 2)用单个值替换会怎样？

*a, = 1                              # ERROR -- 'int' object is not iterable

变成

(*a,) = 1

同样，这里的错误是不言而喻的。您无法解压非序列的东西，并且*a需要一些东西来解压。所以我们把它放在一个序列中

*a, = [1]                            # a = [1]

这相当于

(*a,) = (1,)

最后，这是一个常见的混淆点：(1)是一样的1——你需要一个逗号来区分元组和算术语句。

*a, = (1)                            # ERROR -- 'int' object is not

现在来谈谈嵌套。实际上，这个示例不在您的“嵌套”部分中；也许您没有意识到它是嵌套的？

(a,b), *c = 'XY', 2, 3               # a = 'X', b = 'Y', c = [2,3]

成为

((a, b), *c) = (('X', 'Y'), 2, 3)

顶级元组中的第一个值被分配，并且顶级元组中的其余值（2和3）也被分配给c- 正如我们所期望的那样。

(a,b),c = 1,2,3                      # ERROR -- too many values to unpack
*(a,b), c = 1,2,3                    # a = 1, b = 2, c = 3

我已经在上面解释了为什么第一行会抛出错误。第二行很愚蠢，但下面是它起作用的原因：

(*(a, b), c) = (1, 2, 3)

如前所述，我们从两端开始。3被赋值给c，然后将剩余的值赋值给*前面的变量，在本例中为(a, b)。因此，这相当于(a, b) = (1, 2)，这恰好可以工作，因为元素数量正确。我想不出任何理由会这样出现在工作代码中。同样，

*(a, *b), c = 'this'                 # a = 't', b = ['h', 'i'], c = 's'

变成

(*(a, *b), c) = ('t', 'h', 'i', 's')

从两端开始，'s'被分配给c，并被('t', 'h', 'i')分配给(a, *b)。再次从两端开始，'t'被分配给a，并被('h', 'i')分配给 b 作为列表。这是另一个愚蠢的例子，不应该出现在工作代码中。

解决方案 2：

我发现 Python 2 元组解包非常简单。左侧的每个名称对应于右侧的整个序列或序列中的单个项。如果名称对应于任何序列的单个项，那么必须有足够的名称来涵盖所有项。

然而，扩展解包肯定会令人困惑，因为它的功能非常强大。事实上，你永远不应该执行你给出的最后 10 个或更多有效示例——如果数据是结构化的，它应该以一个dict或一个类实例的形式出现，而不是像列表这样的非结构化形式。

显然，新语法可能会被滥用。你的问题的答案是，你不应该阅读这样的表达式——它们是不好的做法，我怀疑它们会被使用。

仅仅因为您可以编写任意复杂的表达式并不意味着您应该这样做。您可以编写类似的代码，map(map, iterable_of_transformations, map(map, iterable_of_transformations, iterable_of_iterables_of_iterables))但您不会这样做。

解决方案 3：

我认为您的代码可能会产生误导，请使用其他形式来表达它。

这就像在表达式中使用额外的括号来避免运算符优先级的问题。这始终是一项很好的投资，可让您的代码更易读。

我更喜欢仅对诸如交换之类的简单任务使用解包。

解决方案 4：

左侧加星号的原本想法是为了提高可迭代对象解包的可读性，如下所示：

first_param, rest_param, third_param = param[0], param[1:-1], param[-1]

这句话相当于

first_param, *rest_param, third_param = param

在上面的语句中，带星号的表达式用于“捕获”所有未分配给“强制目标”的元素（在此示例中为first_param& ）third_param

左侧星号表达式的使用有以下规则：

左侧最多有一个带星号的表达式，否则解包将不唯一

*a,b,*c = range(5) # wrong
*a,b,c = range(5) # right
a,*b,c = range(5) # right

为了收集“剩余”元素，带星号的表达式必须与强制目标一起使用。尾随逗号用于表示强制目标不存在

*a = range(5) # wrong
*a, = range(5) # right

我相信如果你掌握了这两个规则，你就可以推导出左侧带星号表达式的任何结果。

问题描述：

解决方案 1：

解决方案 2：

解决方案 3：

解决方案 4：

云端的项目管理软件