我有如下数据
df.head()
name location duration month status
aim bgy 12 active
terra pm 3 inactive
jerry bgy 23 inactive
finn dm 8 active
pearl bgy 21 active
doe pm 9 inactive
pearl pm 11 inactive
我拥有大约2000个数据点,并有大约6个唯一的位置名称。我需要在给定任何名称,位置,当前持续时间详细信息的情况下构建/训练一个预测模型,该模型应以概率%预测状态(有效/无效)
所以如果这个模型的输入是
name location duration month
jim bgy 6
tim pm 9
sara bgy 12
我应该得到像
name location duration month status active_probability
jim bgy 6 active 0.9
tim pm 9 inactive 0.0
sara bgy 12 active 0.8
最佳答案
您可以尝试使用LightGBM。它非常易于使用,并且运行速度非常快。