一、scikit-learn中的scaler
对测试数据集如何归一化?
测试数据集不能跟训练数据集归一化一样,应该把测试数据集与训练数据集归一化后的数据集进行相应的归一化,也就是(x_test-mean_train)/std_train,来得到均值归一化的结果;
测试数据是模拟真实环境:
1.真实环境很有可能无法得到所有测试数据的均值和方差;
2.对数据的归一化也是算法的一部分;
综上
我们需要保存训练数据集得到的均值和方差;
为了方便进行这一步操作,在scikit-learn中使用Scaler类进行封装
二、演示