Closed. This question is off-topic。它当前不接受答案。
想改善这个问题吗? Update the question,因此它是on-topic,用于堆栈溢出。
在10个月前关闭。
在机器学习中,我们知道在准备好部署模型时应该使用测试数据集。在此之前,我们使用训练数据集训练模型并将其分为训练和验证或交叉验证方法。在这里,每组都有相应的标签。
因此,通过从模型进行预测来评估或找到混淆矩阵非常简单。我们首先可以预测
但是,如何测量此测试集的性能,或者仅通过使用训练集来确保模型性能?听起来像是一个愚蠢的问题,但是对我的快速建议或纠正非常赞赏。谢谢。
想改善这个问题吗? Update the question,因此它是on-topic,用于堆栈溢出。
在10个月前关闭。
在机器学习中,我们知道在准备好部署模型时应该使用测试数据集。在此之前,我们使用训练数据集训练模型并将其分为训练和验证或交叉验证方法。在这里,每组都有相应的标签。
因此,通过从模型进行预测来评估或找到混淆矩阵非常简单。我们首先可以预测
y_pred
并将其与y_val
进行比较。在这种情况下,如何获得没有标签的测试集的准确性或测量其性能。而且我知道,它不应该设置标签。但是,如何测量此测试集的性能,或者仅通过使用训练集来确保模型性能?听起来像是一个愚蠢的问题,但是对我的快速建议或纠正非常赞赏。谢谢。
最佳答案
你不能。基本上,您有两个选择:手动标记测试数据(可能只是一部分),或者信任训练准确性,并可能将其降低10%。我建议第一种方法。