原文:https://docs.scipy.org/doc/numpy/reference/generated/numpy.random.pareto.html
校对:(虚位以待)
numpy.random.
pareto
(a, size=None)从具有指定形状的Pareto II或Lomax分布绘制样品。
Lomax或Pareto II分布是偏移的Pareto分布。经典的帕累托分布可以通过加上1并乘以标度参数m
从Lomax分布获得(参见注释)。The smallest value of the Lomax distribution is zero while for the classical Pareto distribution it is mu
, where the standard Pareto distribution has location mu = 1
. Lomax也可以被认为是广义帕累托分布的简化版本(在SciPy中可用),比例设置为1并且位置设置为零。
Pareto分布必须大于零,并且在上面是无界的。它也被称为“80-20规则”。在这种分布中,80%的权重在该范围的最低20%,而另外20%的权重在剩余的80%的范围内。
参数: | shape:float,> 0。
size:int或tuple的整数,可选
|
---|
也可以看看
scipy.stats.distributions.lomax.pdf
scipy.stats.distributions.genpareto.pdf
笔记
帕累托分布的概率密度为
其中是形状,刻度。
帕累托分布以意大利经济学家Vilfredo Pareto命名,是一个幂律概率分布,用于许多现实世界的问题。在经济学领域之外,它通常被称为布拉德福德分布。帕累托开发了分布来描述一个经济体中财富的分布。它还在保险,网页访问统计,油田大小和许多其他问题中使用,包括Sourceforge [R251]中项目的下载频率。它是所谓的“胖尾”分布之一。
参考文献
[R251] | (1,2) Francis Hunt和Paul Johnson,On the Pareto Distribution of Sourceforge projects。 |
[R252] | Pareto,V。(1896)。政治经济学课程。洛桑。 |
[R253] | Reiss,R.D.,Thomas,M。(2001),Statistical Analysis of Extreme Values,Birkhauser Verlag,Basel,第23-30页。 |
[R254] | 维基百科,“帕累托分布”,http://en.wikipedia.org/wiki/Pareto_distribution |
例子
从分布绘制样本:
>>> a, m = 3., 2. # shape and mode
>>> s = (np.random.pareto(a, 1000) + 1) * m
显示样本的直方图,以及概率密度函数:
>>> import matplotlib.pyplot as plt
>>> count, bins, _ = plt.hist(s, 100, normed=True)
>>> fit = a*m**a / bins**(a+1)
>>> plt.plot(bins, max(count)*fit/max(fit), linewidth=2, color='r')
>>> plt.show()