我正在尝试使用 fitdist () 包中的 fitdistrplus 函数来使我的数据适合不同的分布。假设我的数据如下所示:

x = c (1.300000, 1.220000, 1.160000, 1.300000, 1.380000, 1.240000,
1.150000, 1.180000, 1.350000, 1.290000, 1.150000, 1.240000,
1.150000, 1.120000, 1.260000, 1.120000, 1.460000, 1.310000,
1.270000, 1.260000, 1.270000, 1.180000, 1.290000, 1.120000,
1.310000, 1.120000, 1.220000, 1.160000, 1.460000, 1.410000,
1.250000, 1.200000, 1.180000, 1.830000, 1.670000, 1.130000,
1.150000, 1.170000, 1.190000, 1.380000, 1.160000, 1.120000,
1.280000, 1.180000, 1.170000, 1.410000, 1.550000, 1.170000,
1.298701, 1.123595, 1.098901, 1.123595, 1.110000, 1.420000,
1.360000, 1.290000, 1.230000, 1.270000, 1.190000, 1.180000,
1.298701, 1.136364, 1.098901, 1.123595, 1.316900, 1.281800,
1.239400, 1.216989, 1.785077, 1.250800, 1.370000)

接下来,如果我运行 fitdist (x, "gamma") 一切正常,但如果我使用 fitdist (x, "beta") 代替,我会收到以下错误:
Error in start.arg.default(data10, distr = distname) :
  values must be in [0-1] to fit a beta distribution

好的,所以我不是英语母语,但据我所知,此方法要求数据在 [0,1] 范围内,因此我使用 x_scaled = (x-min(x))/max(x) 对其进行缩放。这给了我一个向量,其值在该范围内,与原始向量 x 完全相关。

由于 x_scaledclass matrix ,我使用 as.numeric() 将其转换为数值向量。然后使用 fitdist(x_scale,"beta") 拟合模型。

这次我收到以下错误:
Error in fitdist(x_scale, "beta") :
  the function mle failed to estimate the parameters, with the error code 100

所以在那之后我一直在做一些搜索引擎查询,但我没有发现任何有用的东西。有人知道这里出了什么问题吗?谢谢

最佳答案

通过阅读源码可以发现,fitdist的默认估计方法是mle,它会调用同一个包中的mledist,为你选择的分布构造负对数似然,使用optimconstrOptim来计算数值最小化它。如果数值优化过程有任何问题,您会收到错误消息。

好像是因为当x_scaled包含0或1时,在计算beta分布的负对数似然时会出现一些问题,所以数值优化方法就会崩溃。一个肮脏的技巧是让 x_scaled <- (x - min(x) + 0.001) / (max(x) - min(x) + 0.002) ,因此 x_scaled 中没有 0 或 1,并且 fitdist 将起作用。

10-08 00:47