我正在做一个分类,并且我有一个关于仅使用LDA进行降维的问题:
是否应将LDA应用于包括训练和测试数据的整个特征矩阵,然后(减小数据的维数)对特征矩阵进行划分以提供训练和测试集进行分类?是真的吗
然后,假设我们需要在应用LDA之前对数据进行分区。如何使用Matlab的内部分类器(如kNN和SVM)对测试数据进行分类?
最佳答案
您应该在火车上生成LDA,然后再将其应用于测试仪。
原因是您无需检查整个处理链如何处理看不见的数据。如果您在训练/测试中生成了LDA模型,则可能会导致重要性不高的信息消失。
实际上,如果您确定尺寸数,则应该进行训练/测试/验证拆分。在此确定火车/测试的最佳尺寸。然后在训练中构建LDA + Model,合并测试并进行验证评估。
关于machine-learning - LDA作为分区之前或之后的尺寸缩减,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/46504688/