事情是这样的:我想要(例如)生成 4 个伪随机数,将它们加在一起等于 40。
在 Python 中如何实现这一点?我可以生成一个 1-40 的随机数,然后生成 1 和余数之间的另一个数,等等,但第一个数“抓取”更多内容的机会更大。
解决方案 1:
这是标准解决方案。它与 Laurence Gonsalves 的答案类似,但比该答案有两个优点。
它是均匀的:每个 4 个正整数的组合,加起来等于 40,都有同样的可能性形成这种方案。
它很容易适应其他总数(7 个数字加起来等于 100,等等)
import random
def constrained_sum_sample_pos(n, total):
"""Return a randomly chosen list of n positive integers summing to total.
Each such list is equally likely to occur."""
dividers = sorted(random.sample(range(1, total), n - 1))
return [a - b for a, b in zip(dividers + [total], [0] + dividers)]
>>> constrained_sum_sample_pos(4, 40)
[4, 4, 25, 7]
>>> constrained_sum_sample_pos(4, 40)
[9, 6, 5, 20]
>>> constrained_sum_sample_pos(4, 40)
[11, 2, 15, 12]
>>> constrained_sum_sample_pos(4, 40)
[24, 8, 3, 5]
(a, b, c, d)
解释: (1) 4 元组正整数a + b + c + d == 40
,与 (2) 整数三元(e, f, g)
组之间存在一一对应关系0 < e < f < g < 40
,并且使用 很容易生成后者random.sample
。 对应关系在一个方向上由 给出(e, f, g) = (a, a + b, a + b + c)
,(a, b, c, d) = (e, f - e, g - f, 40 - g)
在反方向上由 给出。
)而不是正整数,那么有一个简单的转换:如果(a, b, c, d)
,那么(a+1, b+1, c+1, d+1)
def constrained_sum_sample_nonneg(n, total):
"""Return a randomly chosen list of n nonnegative integers summing to total.
Each such list is equally likely to occur."""
return [x - 1 for x in constrained_sum_sample_pos(n, total + n)]
图形说明constrained_sum_sample_pos(4, 10)
0 1 2 3 4 5 6 7 8 9 10 # The universe.
| | # Place fixed dividers at 0, 10.
| | | | | # Add 4 - 1 randomly chosen dividers in [1, 9]
a b c d # Compute the 4 differences: 2 3 4 1
解决方案 2:
from numpy.random import multinomial
multinomial(40, [1/4.] * 4)
在这个例子中,每个变量将分布为二项分布,其平均值n * p
等于40 * 1/4 = 10
解决方案 3:
b = random.randint(2, 38)
a = random.randint(1, b - 1)
c = random.randint(b + 1, 39)
return [a, b - a, c - b, 40 - c]
将总范围随机分为两部分,即 b。奇数范围是因为至少有 2 个低于中点,至少有 2 个高于中点。(这来自每个值的 1 个最小值)。
将每个范围随机分成两部分。同样,边界是为了考虑 1 的最小值。
返回每个切片的大小。它们加起来为 40。
解决方案 4:
生成 4 个随机数,计算它们的和,将每个数除以和并乘以 40。
解决方案 5:
在 [1,37] 范围内(允许重复),四个整数的排列方式只有 37^4 = 1,874,161 种。枚举它们,保存并计算加起来等于 40 的排列方式。(这将是一个更小的数字,N)。
在区间 [0, N-1] 中抽取均匀分布的随机整数 K,并返回第 K 个排列。很容易看出,这保证了可能结果空间的均匀分布,每个序列位置的分布相同。(我看到的许多答案的最终选择都会比前三个偏低!)
解决方案 6:
具有选定概率的项(总和为 1),重复该n
不幸的是,目前 SciPy 似乎还没有实现从这个分布中抽样的功能,所以我就此提出了一个问题。与此同时,以下函数将在所有可能的分割中以统一的方式生成m
import scipy.stats as sps
def random_split(n,m):
""" Generate m non-negative integers summing to n. """
p = sps.dirichlet.rvs(alpha=[1]*m, size=1)
return sps.multinomial.rvs(n=n, p=p[0], size=1)
从总和中减去并手动将 1 添加到所有项中:
import scipy.stats as sps
def random_split_positive(n,m):
""" Generate m positive integers summing to n. """
p = sps.dirichlet.rvs(alpha=[1]*m, size=1)
return 1+sps.multinomial.rvs(n=n-m, p=p[0], size=1)
import scipy.stats as sps
def random_split_float(s,m):
""" Generate m non-negative numbers summing to s. """
return s*sps.dirichlet.rvs(alpha=[1]*m, size=1)
解决方案 7:
这是对@Mark Dickinson版本的一个小小的改进,允许生成的整数中出现零(这样它们就是非负的,而不是正的):
import random
def constrained_sum_sample_pos(n, total):
"""Return a randomly chosen list of n non-negative integers summing to total.
Each such list is equally likely to occur."""
dividers = sorted(random.choices(range(0, total), k=n-1))
return [a - b for a, b in zip(dividers + [total], [0] + dividers)]
放回抽样,与不放回抽样相反。它是 Python 3.6 中的新增功能。random.sample()
解决方案 8:
import numpy as np
def randofsum_unbalanced(s, n):
# Where s = sum (e.g. 40 in your case) and n is the output array length (e.g. 4 in your case)
r = np.random.rand(n)
a = np.array(np.round((r/np.sum(r))*s,0),dtype=int)
while np.sum(a) > s:
a[np.random.choice(n)] -= 1
while np.sum(a) < s:
a[np.random.choice(n)] += 1
return a
def randofsum_balanced(s, n):
return np.random.multinomial(s,np.ones(n)/n,size=1)[0]
解决方案 9:
def constrained_sum_sample(n, total, variance=50):
"""Return a random-ish list of n positive integers summing to total.
variance: int; percentage of the gap between the uniform spacing to vary the result.
divisor = total/n
jiggle = divisor * variance / 100 / 2
dividers = [int((x+1)*divisor + random.random()*jiggle) for x in range(n-1)]
result = [a - b for a, b in zip(dividers + [total], [0] + dividers)]
return result
[12, 8, 10, 10]
[10, 11, 10, 9]
[11, 9, 11, 9]
[11, 9, 12, 8]