目前,我正在使用Backpropagation进行ANN的分类任务。但是我对标准化我正在使用的数据集有些困惑(我没有很强的统计/概率背景)。
数据示例如下所示:
5.1, 3.5, 1.4, 0.2, 1
5.2, 2.7, 3.9, 1.4, 2
5.9, 3.0, 5.1, 1.8, 3
每个类的最后一个标记是类。
现在,由于我正在使用Sigmoid传递函数,因此我的网络显然无法输出大于1的值,因此需要对数据进行归一化/缩放。
我的第一个问题;我需要同时缩放功能和类,还是仅缩放类?
我的第二个问题是,有没有“事实上的”或常用的方法来进行这种缩放?
问候,
杰克·亨特
最佳答案
通常建议同时缩放功能。缩放应该像scaled_feature =(feature-min(featurearray))/(max(featurearray)-min(featurearray))一样简单。
因此,对于第一个属性列,新数据将是:
(5.1-5.1)/(5.9-5.1);
(5.2-5.1)/(5.9-5.1);
(5.9-5.1)/(5.9-5.1)
关于machine-learning - ANN训练集缩放,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/14817696/