原文:https://docs.scipy.org/doc/numpy/reference/generated/numpy.random.hypergeometric.html
校对:(虚位以待)
numpy.random.
hypergeometric
(ngood, nbad, nsample, size=None)从超几何分布绘制样本。
样本是从具有指定参数的超几何分布绘制的,ngood(做出良好选择的方法),nbad(做出错误选择的方法)和nsample =抽样项目数,小于或等于总和ngood + nbad。
参数: | ngood:int或array_like
nbad:int或array_like
nsample:int或array_like
size:int或tuple的整数,可选
|
---|---|
返回: | samples:ndarray或scalar
|
也可以看看
scipy.stats.distributions.hypergeom
笔记
超几何分布的概率密度为
其中和
对于P(x)x成功的概率,n = ngood,m = nbad,N =样本数。
考虑一个有黑色和白色大理石的缸,它们的颜色是黑色的,而nbad是白色的。如果你绘制没有替换的nsample球,那么超几何分布描述了绘制的样本中的黑球的分布。
注意,这种分布与二项分布非常相似,除了在这种情况下,绘制样本而不替换,而在二项式情况下,样本用替换来绘制(或者样本空间是无限的)。随着样本空间变大,该分布接近二项式。
参考文献
[R225] | Lentner,Marvin,“Elementary Applied Statistics”,Bogden和Quigley,1972。 |
[R226] | Weisstein,Eric W.“超几何分布”。来自MathWorld-Wolfram Web资源。http://mathworld.wolfram.com/HypergeometricDistribution.html |
[R227] | 维基百科,“超几何分布”,http://en.wikipedia.org/wiki/Hypergeometric_distribution |
例子
从分布绘制样本:
>>> ngood, nbad, nsamp = 100, 2, 10
# number of good, number of bad, and number of samples
>>> s = np.random.hypergeometric(ngood, nbad, nsamp, 1000)
>>> hist(s)
# note that it is very unlikely to grab both bad items
假设你有一个15白色和15黑色大理石的缸。如果你随机拉15个大理石,12个或更多的是一种颜色的可能性有多大?
>>> s = np.random.hypergeometric(15, 15, 15, 100000)
>>> sum(s>=12)/100000. + sum(s<=3)/100000.
# answer = 0.003 ... pretty unlikely!