我希望评估Python中的随机森林回归器的测试性能,除了在训练集上运行交叉验证外,还想知道在预测的Y测试结果与测试结果之间进行某种相关性分析是否合适实际的Y测试结果?
我可能过于简化的想法是,两者之间的显着相关将表明预测的Y与实际的测试Y一致,因此预测是好的。
任何其他建议都值得欢迎。谢谢。
最佳答案
您可以运行相关性分析,这是适当的,但是如果相关性很大,那么并不总是正确的,那么您的模型就不错。您还必须查看变化。还取决于您要解决的任务(分类,细分,回归等),您可以使用指标来检测您的预测水平。您可以在http://scikit-learn.org/stable/modules/model_evaluation.html中找到不同的指标。