functools partial 如何完成其功能?
- 2025-02-20 09:23:00
- admin 原创
- 29
问题描述:
我无法理解它的partial
工作原理。我从这里functools
有以下代码:
>>> sum = lambda x, y : x + y
>>> sum(1, 2)
3
>>> incr = lambda y : sum(1, y)
>>> incr(2)
3
>>> def sum2(x, y):
return x + y
>>> incr2 = functools.partial(sum2, 1)
>>> incr2(4)
5
现在在排队
incr = lambda y : sum(1, y)
我知道无论我传递给它什么参数都会incr
被传递y
并lambda
返回sum(1, y)
。1 + y
我理解这一点。但我不明白这一点incr2(4)
。
在部分函数中如何4
传递?对我来说,应该替换。和之间有什么关系?x
`4sum2
x`4
解决方案 1:
大致来说,partial
执行以下操作(除了关键字参数支持等):
def partial(func, *part_args):
def wrapper(*extra_args):
return func(*part_args, *extra_args)
return wrapper
因此,通过调用,partial(sum2, 4)
您可以创建一个新函数(准确地说是可调用函数),其行为类似于sum2
,但位置参数少一个。缺少的参数始终由 替代4
,因此partial(sum2, 4)(2) == sum2(4, 2)
至于为什么需要它,有多种情况。举个例子,假设你必须将一个函数传递到某个需要 2 个参数的地方:
class EventNotifier(object):
def __init__(self):
self._listeners = []
def add_listener(self, callback):
''' callback should accept two positional arguments, event and params '''
self._listeners.append(callback)
# ...
def notify(self, event, *params):
for f in self._listeners:
f(event, params)
但是您已经拥有的函数需要访问第三个context
对象来完成其工作:
def log_event(context, event, params):
context.log_event("Something happened %s, %s", event, params)
因此,有几种解决方案:
自定义对象:
class Listener(object):
def __init__(self, context):
self._context = context
def __call__(self, event, params):
self._context.log_event("Something happened %s, %s", event, params)
notifier.add_listener(Listener(context))
Lambda:
log_listener = lambda event, params: log_event(context, event, params)
notifier.add_listener(log_listener)
使用部分:
context = get_context() # whatever
notifier.add_listener(partial(log_event, context))
在这三者中,partial
它是最短和最快的。(不过,对于更复杂的情况,您可能需要自定义对象)。
解决方案 2:
部分非常有用。
例如,在“管道”函数调用序列中(其中一个函数的返回值是传递给下一个函数的参数)。
有时,此类管道中的某个函数只需要一个参数,但其上游的紧邻函数却返回两个值。
在这种情况下,functools.partial
可能允许您保持此功能管道完好无损。
这是一个具体的、孤立的例子:假设您想根据每个数据点与某个目标的距离对某些数据进行排序:
# create some data
import random as RND
fnx = lambda: RND.randint(0, 10)
data = [ (fnx(), fnx()) for c in range(10) ]
target = (2, 4)
import math
def euclid_dist(v1, v2):
x1, y1 = v1
x2, y2 = v2
return math.sqrt((x2 - x1)**2 + (y2 - y1)**2)
要根据与目标的距离对这些数据进行排序,您当然需要这样做:
data.sort(key=euclid_dist)
但是你不能——sort方法的key参数只接受带有单个参数的函数。
因此将其重写euclid_dist
为一个只接受一个参数的函数:
from functools import partial
p_euclid_dist = partial(euclid_dist, target)
p_euclid_dist
现在接受一个参数,
>>> p_euclid_dist((3, 3))
1.4142135623730951
现在您可以通过传入 sort 方法的 key 参数的部分函数来对数据进行排序:
data.sort(key=p_euclid_dist)
# verify that it works:
for p in data:
print(round(p_euclid_dist(p), 3))
1.0
2.236
2.236
3.606
4.243
5.0
5.831
6.325
7.071
8.602
或者例如,函数的一个参数在外循环中发生变化,但在内循环迭代期间保持不变。通过使用部分函数,您不必在内循环迭代期间传入附加参数,因为修改后的(部分)函数不需要它。
>>> from functools import partial
>>> def fnx(a, b, c):
return a + b + c
>>> fnx(3, 4, 5)
12
创建一个部分函数(使用关键字 arg)
>>> pfnx = partial(fnx, a=12)
>>> pfnx(b=4, c=5)
21
你也可以创建一个带有位置参数的部分函数
>>> pfnx = partial(fnx, 12)
>>> pfnx(4, 5)
21
但这会引发(例如,使用关键字参数创建部分,然后使用位置参数调用)
>>> pfnx = partial(fnx, a=12)
>>> pfnx(4, 5)
Traceback (most recent call last):
File "<pyshell#80>", line 1, in <module>
pfnx(4, 5)
TypeError: fnx() got multiple values for keyword argument 'a'
另一个用例:使用 python 的multiprocessing
库编写分布式代码。使用 Pool 方法创建一个进程池:
>>> import multiprocessing as MP
>>> # create a process pool:
>>> ppool = MP.Pool()
Pool
有一个 map 方法,但它只需要一个可迭代对象,因此如果您需要传递具有更长参数列表的函数,请将该函数重新定义为部分函数,以修复除一个之外的所有问题:
>>> ppool.map(pfnx, [4, 6, 7, 8])
解决方案 3:
简而言之,partial
为函数的参数提供默认值,否则这些参数将没有默认值。
from functools import partial
def foo(a,b):
return a+b
bar = partial(foo, a=1) # equivalent to: foo(a=1, b)
bar(b=10)
#11 = 1+10
bar(a=101, b=10)
#111=101+10
解决方案 4:
部分函数可用于创建新的派生函数,这些函数具有预先分配的一些输入参数
要了解部分内容的实际用法,请参阅此处的这篇非常好的博客文章
博客中有一个简单但简洁的初学者示例,介绍了如何使用partial
onre.search
使代码更具可读性。 re.search
方法的签名是:
search(pattern, string, flags=0)
通过应用,partial
我们可以创建正则表达式的多个版本search
来满足我们的要求,例如:
is_spaced_apart = partial(re.search, '[a-zA-Z]s=')
is_grouped_together = partial(re.search, '[a-zA-Z]=')
现在is_spaced_apart
和is_grouped_together
是从中派生出的两个新函数,re.search
它们pattern
应用了参数(因为pattern
是方法签名中的第一个参数re.search
)。
这两个新函数(可调用)的签名是:
is_spaced_apart(string, flags=0) # pattern '[a-zA-Z]s=' applied
is_grouped_together(string, flags=0) # pattern '[a-zA-Z]=' applied
你可以这样在某些文本上使用这些部分函数:
for text in lines:
if is_grouped_together(text):
some_action(text)
elif is_spaced_apart(text):
some_other_action(text)
else:
some_default_action()
您可以参考上面的链接来更深入地了解该主题,因为它涵盖了这个特定的例子以及更多内容。
解决方案 5:
在我看来,这是在 Python 中实现柯里化的一种方法。
from functools import partial
def add(a,b):
return a + b
def add2number(x,y,z):
return x + y + z
if __name__ == "__main__":
add2 = partial(add,2)
print("result of add2 ",add2(1))
add3 = partial(partial(add2number,1),2)
print("result of add3",add3(1))
结果是 3 和 4。
解决方案 6:
这个答案更像是一个示例代码。以上所有答案都很好地解释了为什么应该使用部分。我将给出我对部分的观察和用例。
from functools import partial
def adder(a,b,c):
print('a:{},b:{},c:{}'.format(a,b,c))
ans = a+b+c
print(ans)
partial_adder = partial(adder,1,2)
partial_adder(3) ## now partial_adder is a callable that can take only one argument
上述代码的输出应为:
a:1,b:2,c:3
6
请注意,在上面的例子中,返回了一个新的可调用函数,它将以参数 (c) 作为其参数。请注意,它也是该函数的最后一个参数。
args = [1,2]
partial_adder = partial(adder,*args)
partial_adder(3)
上述代码的输出也是:
a:1,b:2,c:3
6
请注意,* 用于解包非关键字参数,并且返回的可调用函数所能接受的参数与上面相同。
另一个观察是:
下面的例子说明 partial 返回一个可调用函数,它将以未声明的参数(a)作为参数。
def adder(a,b=1,c=2,d=3,e=4):
print('a:{},b:{},c:{},d:{},e:{}'.format(a,b,c,d,e))
ans = a+b+c+d+e
print(ans)
partial_adder = partial(adder,b=10,c=2)
partial_adder(20)
上述代码的输出应为:
a:20,b:10,c:2,d:3,e:4
39
相似地,
kwargs = {'b':10,'c':2}
partial_adder = partial(adder,**kwargs)
partial_adder(20)
以上代码打印
a:20,b:10,c:2,d:3,e:4
39
Pool.map_async
当我使用模块中的方法时,我不得不使用它multiprocessing
。您只能向 worker 函数传递一个参数,因此我不得不使用它partial
来使我的 worker 函数看起来像一个只有一个输入参数的可调用函数,但实际上我的 worker 函数有多个输入参数。
解决方案 7:
还值得一提的是,当部分函数传递另一个函数时,我们想要“硬编码”一些参数,这应该是最右边的参数
def func(a,b):
return a*b
prt = partial(func, b=7)
print(prt(4))
#return 28
但如果我们做同样的事情,但改变一个参数
def func(a,b):
return a*b
prt = partial(func, a=7)
print(prt(4))
它会抛出错误,“TypeError: func() 为参数‘a’获得了多个值”
解决方案 8:
添加机器学习中的几个案例,其中函数式编程柯里化functools.partial
可能非常有用:
在同一数据集上构建多个模型
下面的示例展示了如何在同一数据集上拟合linear regression
、support vector machine
和回归模型,以预测目标并计算分数。random forest
`diabetes`
(部分) 函数是通过柯里化 (使用)classify_diabetes()
从函数创建的。后面的函数不再需要传递数据,我们可以直接传递模型类的实例。classify_data()
`functools.partial()`
from functools import partial
from sklearn.linear_model import LinearRegression
from sklearn.svm import SVR
from sklearn.ensemble import RandomForestRegressor
from sklearn.datasets import load_diabetes
def classify_data(data, model):
reg = model.fit(data['data'], data['target'])
return model.score(data['data'], data['target'])
diabetes = load_diabetes()
classify_diabetes = partial(classify_data, diabetes) # curry
for model in [LinearRegression(), SVR(), RandomForestRegressor()]:
print(f'model {type(model).__name__}: score = {classify_diabetes(model)}')
# model LinearRegression: score = 0.5177494254132934
# model SVR: score = 0.2071794500005485
# model RandomForestRegressor: score = 0.9216794155402649
设置机器学习管道
pipeline()
这里使用柯里化创建函数,该函数StandardScaler()
在对数据进行模型拟合之前已经用于预处理(缩放/规范化),如下一个示例所示:
from sklearn.pipeline import make_pipeline
from sklearn.preprocessing import StandardScaler
pipeline = partial(make_pipeline, StandardScaler()) # curry
for model in [LinearRegression(), SVR(), RandomForestRegressor()]:
print(f"model {type(model).__name__}: " \n f"score = {pipeline(model).fit(diabetes['data'], diabetes['target'])\n .score(diabetes['data'], diabetes['target'])}")
# model LinearRegression: score = 0.5177494254132934
# model SVR: score = 0.2071794500005446
# model RandomForestRegressor: score = 0.9180227193805106
解决方案 9:
对于那些想知道该partial
函数如何工作的人,请考虑该函数的实现my_partial
,它具有与该函数相同的功能functools.partial
:
my_partial 函数
def my_partial(func, *_args, **_kwargs):
def wrapper(*args, **kwargs):
return func(*(_args + args), **dict(_kwargs, **kwargs))
return wrapper
该my_partial
函数func
以*_args
(列表参数) 和**_kwargs
(关键字参数) 作为参数。使用_args
和_kwargs
,我们可以将初始参数my_partial
与函数一起固定给函数。
在函数内部my_partial
,我们有另一个函数。当使用带有一些可选参数的函数作为参数调用wrapper
外部函数( )时,我们返回该函数,该函数也接受列表参数和关键字参数。my_partial
`wrapper`
由于my_partial
和wrapper
函数都以这种方式接受参数,我们可以将参数传递给函数两次。首先,我们调用my_partial
并传递一个带有可选参数的函数,然后该my_partial
函数返回wrapper function
也接受选项参数的函数。这样我们就可以传递两次参数。
函数wrapper
将传递给 的位置参数my_partial
与其参数组合起来。函数调用作为参数传递给 的wrapper
函数 ( ) 。func
`my_partial`
在包装器中,我们返回func(*(_args + args), **dict(_kwargs, **kwargs))
。这里,_args
和args
都是tuples
,并且+
是连接运算符,它将和_args
中的元素组合在一起。注意我们之前args
提到过,因为有传递给的参数,并且由于它是第一个传递的,所以我们必须先得到它。这里,将两个字典合并为一个字典。_args
`args_args
my_partial`dict(**_kwargs, **kwargs)
用例:
通常,一个函数可能需要很多参数,并且假设我们必须重复使用该函数。在这种情况下,我们可以用 包装该函数partial
,指定可能需要多次传递给该函数的固定参数。
from functools import partial
def multiply(a, b):
return a * b
double = partial(multiply, 2)
print(double(10))
输出:
20
请注意,在上面的语句中partial(multiply, 2)
,我们指定参数 a 为multiply
2。因此,当我们必须将一个值加倍时,我们不需要将值 2 多次传递给乘法函数。
这确实是一个简单的函数(multiply
),但通常情况下,我们必须向函数传递许多参数。在这种情况下,我们可以使用 partial 来指定可能需要多次传递的参数。
解决方案 10:
仅添加一个用例。
functools.partial
在多处理中非常有用。例如,当您想要使用一个接受三个int
s以及两个常量s的函数时:list
`int`int
from multiprocessing import Pool, cpu_count
from functools import partial
def run(a, b, c):
return a+b+c
a = [1,2,3,4,5]
b = 10
c = 20
with Pool(cpu_count()) as pool:
results = pool.map(partial(run, b=b, c=c), a)
print(results)
出去:
[31,32,33,34,35]
等效于不multiprocessing
使用、使用functools.partial
for 循环,例如:
from functools import partial
def run(a, b, c):
return a+b+c
a = [1,2,3,4,5]
b = 10
c = 20
p = partial(run, b=b, c=c)
results = []
for i in a:
results.append(p(i))
print(results)
没有functools.partial
或的等价物multiprocessing
,例如:
results = []
for i in a:
results.append(run(i, b, c))
print(results)
这样做的原因是multiprocessing.Pool.pool.map
需要,因此可以args = (func, iterable(object))
在需要多个参数func
的地方使用,并且在您的用例中第一个参数会变化,其余参数为常量。注意:使用 时按 的顺序;使用可能更快,但顺序未知。object
`partialfunc
resultsa
pool.mappool.map_async
results`
当len(a)
很大时,该multiprocessing
示例比使用 for 循环的示例性能更好,因为它pool.map(partial(run, b, c), a)
使用cpu_count()
进程并行执行。
- 2025年20款好用的项目管理软件推荐,项目管理提效的20个工具和技巧
- 2024年开源项目管理软件有哪些?推荐5款好用的项目管理工具
- 2024年常用的项目管理软件有哪些?推荐这10款国内外好用的项目管理工具
- 项目管理软件有哪些?推荐7款超好用的项目管理工具
- 项目管理软件有哪些最好用?推荐6款好用的项目管理工具
- 项目管理软件哪个最好用?盘点推荐5款好用的项目管理工具
- 项目管理软件排行榜:2024年项目经理必备5款开源项目管理软件汇总
- 项目管理必备:盘点2024年13款好用的项目管理软件
- 项目管理软件有哪些,盘点推荐国内外超好用的7款项目管理工具
- 2024项目管理软件排行榜(10类常用的项目管理工具全推荐)