我正在尝试使用 fitdist ()
包中的 fitdistrplus
函数来使我的数据适合不同的分布。假设我的数据如下所示:
x = c (1.300000, 1.220000, 1.160000, 1.300000, 1.380000, 1.240000,
1.150000, 1.180000, 1.350000, 1.290000, 1.150000, 1.240000,
1.150000, 1.120000, 1.260000, 1.120000, 1.460000, 1.310000,
1.270000, 1.260000, 1.270000, 1.180000, 1.290000, 1.120000,
1.310000, 1.120000, 1.220000, 1.160000, 1.460000, 1.410000,
1.250000, 1.200000, 1.180000, 1.830000, 1.670000, 1.130000,
1.150000, 1.170000, 1.190000, 1.380000, 1.160000, 1.120000,
1.280000, 1.180000, 1.170000, 1.410000, 1.550000, 1.170000,
1.298701, 1.123595, 1.098901, 1.123595, 1.110000, 1.420000,
1.360000, 1.290000, 1.230000, 1.270000, 1.190000, 1.180000,
1.298701, 1.136364, 1.098901, 1.123595, 1.316900, 1.281800,
1.239400, 1.216989, 1.785077, 1.250800, 1.370000)
接下来,如果我运行
fitdist (x, "gamma")
一切正常,但如果我使用 fitdist (x, "beta")
代替,我会收到以下错误:Error in start.arg.default(data10, distr = distname) :
values must be in [0-1] to fit a beta distribution
好的,所以我不是英语母语,但据我所知,此方法要求数据在 [0,1] 范围内,因此我使用
x_scaled = (x-min(x))/max(x)
对其进行缩放。这给了我一个向量,其值在该范围内,与原始向量 x
完全相关。由于
x_scaled
是 class matrix
,我使用 as.numeric()
将其转换为数值向量。然后使用 fitdist(x_scale,"beta")
拟合模型。这次我收到以下错误:
Error in fitdist(x_scale, "beta") :
the function mle failed to estimate the parameters, with the error code 100
所以在那之后我一直在做一些搜索引擎查询,但我没有发现任何有用的东西。有人知道这里出了什么问题吗?谢谢
最佳答案
通过阅读源码可以发现,fitdist
的默认估计方法是mle
,它会调用同一个包中的mledist
,为你选择的分布构造负对数似然,使用optim
或constrOptim
来计算数值最小化它。如果数值优化过程有任何问题,您会收到错误消息。
好像是因为当x_scaled
包含0或1时,在计算beta分布的负对数似然时会出现一些问题,所以数值优化方法就会崩溃。一个肮脏的技巧是让 x_scaled <- (x - min(x) + 0.001) / (max(x) - min(x) + 0.002)
,因此 x_scaled
中没有 0 或 1,并且 fitdist
将起作用。