目前,我正在使用Backpropagation进行ANN的分类任务。但是我对标准化我正在使用的数据集有些困惑(我没有很强的统计/概率背景)。

数据示例如下所示:

5.1, 3.5, 1.4, 0.2, 1
5.2, 2.7, 3.9, 1.4, 2
5.9, 3.0, 5.1, 1.8, 3


每个类的最后一个标记是类。

现在,由于我正在使用Sigmoid传递函数,因此我的网络显然无法输出大于1的值,因此需要对数据进行归一化/缩放。

我的第一个问题;我需要同时缩放功能和类,还是仅缩放类?

我的第二个问题是,有没有“事实上的”或常用的方法来进行这种缩放?

问候,
杰克·亨特

最佳答案

通常建议同时缩放功能。缩放应该像scaled_feature =(feature-min(featurearray))/(max(featurearray)-min(featurearray))一样简单。

因此,对于第一个属性列,新数据将是:
(5.1-5.1)/(5.9-5.1);
(5.2-5.1)/(5.9-5.1);
(5.9-5.1)/(5.9-5.1)

关于machine-learning - ANN训练集缩放,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/14817696/

10-12 22:50
查看更多