原文:https://docs.scipy.org/doc/numpy/reference/generated/numpy.random.gumbel.html
校对:(虚位以待)
numpy.random.
gumbel
(loc=0.0, scale=1.0, size=None)从Gumbel分布绘制样本。
从具有指定位置和比例的Gumbel分布绘制样本。有关Gumbel分发的更多信息,请参阅下面的注释和参考。
参数: | loc:float
scale:float
size:int或tuple的整数,可选
|
---|---|
返回: | samples:ndarray或scalar |
笔记
Gumbel(或最小极值(SEV)或最小极值类型I)分布是用于建模极值问题的一类广义极值(GEV)分布之一。Gumbel是极值类型I分布的特殊情况,最大值来自具有“指数样”尾部的分布。
Gumbel分布的概率密度是
其中是模式,位置参数,是缩放参数。
Gumbel(命名为德国数学家Emil Julius Gumbel)早在水文学文献中用于对洪水事件的发生进行建模。它也用于建模最大风速和降雨率。它是一个“胖尾”分布 - 在分布尾部的事件的概率大于如果使用高斯分布的概率,因此出人意料地频繁发生100年的洪水。洪水最初被建模为高斯过程,低估了极端事件的频率。
它是一类极端值分布,广义极值(GEV)分布,其中还包括Weibull和Frechet。
该函数的平均值为,方差为。
参考文献
[R223] | Gumbel,E.J。,“极端统计”,纽约:哥伦比亚大学出版社,1958。 |
[R224] | Reiss,R.-D.和Thomas,M.,“来自保险,金融,水文和其他领域的极端价值的统计分析”,巴塞尔:Birkhauser Verlag,2001。 |
例子
从分布绘制样本:
>>> mu, beta = 0, 0.1 # location and scale
>>> s = np.random.gumbel(mu, beta, 1000)
显示样本的直方图,以及概率密度函数:
>>> import matplotlib.pyplot as plt
>>> count, bins, ignored = plt.hist(s, 30, normed=True)
>>> plt.plot(bins, (1/beta)*np.exp(-(bins - mu)/beta)
... * np.exp( -np.exp( -(bins - mu) /beta) ),
... linewidth=2, color='r')
>>> plt.show()
显示如何从高斯过程中产生极值分布,并与高斯比较:
>>> means = []
>>> maxima = []
>>> for i in range(0,1000) :
... a = np.random.normal(mu, beta, 1000)
... means.append(a.mean())
... maxima.append(a.max())
>>> count, bins, ignored = plt.hist(maxima, 30, normed=True)
>>> beta = np.std(maxima) * np.sqrt(6) / np.pi
>>> mu = np.mean(maxima) - 0.57721*beta
>>> plt.plot(bins, (1/beta)*np.exp(-(bins - mu)/beta)
... * np.exp(-np.exp(-(bins - mu)/beta)),
... linewidth=2, color='r')
>>> plt.plot(bins, 1/(beta * np.sqrt(2 * np.pi))
... * np.exp(-(bins - mu)**2 / (2 * beta**2)),
... linewidth=2, color='g')
>>> plt.show()