我有一个包含观测值(x,y)的表,需要估计更接近它们的泊松分布的平均值看起来R和Octave都可以在Linux上做到这一点,但我想知道是否有一种多平台的方法可以做到这一点。我可以将任何东西与程序捆绑在一起,但我不能要求安装任何东西来运行它。
我试着自己找一个算法来做,但找不到,所以我不知道该怎么做。
作为记录,我确实找到了一个简单的算法来实现它,基本上就是求所有值的和除以示例的数量,但是即使是直接从一本书中获取的一个小示例,它也失败了。
例子:

requisitions per day : absolute frequency (days) : relative frequency
 8 :  2 : 0.016
 9 :  4 : 0.033
10 :  6 : 0.050
11 :  8 : 0.066
12 : 10 : 0.083
13 : 12 : 0.100
14 : 13 : 0.108
15 : 14 : 0.116
16 : 12 : 0.100
17 : 10 : 0.083
18 :  9 : 0.075
19 :  7 : 0.058
20 :  5 : 0.041
21 :  3 : 0.025
22 :  2 : 0.016
23 :  2 : 0.016
24 :  1 : 0.008

泊松分布的平均值应该是15(根据我得到例子的那本书)。上面我说的方法,在其中一个答案里,给了我16个利用欧氏距离的平方和,我还发现平均值为15的泊松比平均值为16的泊松更接近数据。

最佳答案

均值的mle就是样本均值。见维基百科:
http://en.wikipedia.org/wiki/Poisson_distribution#Maximum_likelihood
只是平均你的数据向量。
更新:我正在扩展这个答案,基于刚刚添加到问题中的示例数据。
我对样本数据的解释是

reqs-per-day   frequency
 8             2
 9             4
10             6

意思是有两天,每天的申请数是8四天的申请数是9。因此,我假设数据等于:
8,8,9,9,9,9,10,10,10,10,10,10,...

其中,此列表中的每个条目对应一天。这个单子的顺序无关紧要我认为你应该平均一下这个单子。
频率场的总和是120我认为这意味着实验总共有120天。

关于java - 泊松分布的最大似然估计?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/6025094/

10-09 00:17