因此,我正在使用statsmodel程序包对数据集进行泊松回归,因此我确保我的训练y确实是计数和整数。但是,当我打印预测值时(下面是测试模式),它们是浮点数。

我非常困惑,我希望它们是整数,因为输入数据和模型拟合的是整数,而泊松输出计数数据。你知道我在哪里犯错吗?在此先感谢一吨。

import statsmodels.api as sm
poi_model = sm.GLM(trainingy,trainingx, family=sm.families.Poisson())
poi_results = poi_model.fit()
paramet = poi_results.params
testmodely = poi_model.predict(paramet, testx, linear=False)

最佳答案

泊松模型预测平均值,即泊松随机变量的期望值或强度。这通常不是整数。使用泊松强度,我们可以在假设分布假设正确的情况下获得新观测值的完整分布。

这类似于逻辑回归或logit,其中预测是观察事件或类的概率。这也是相应随机变量的平均值或期望值。
在分类问题中,概率由最有可能的类别的分配代替,该分配为二进制0、1,而不是实数。

07-24 09:52
查看更多