在进行特征选择后,我具有18个维度的特征,将用于训练分类器,RNN,HMM等。

功能包括stddev,加速度计和陀螺仪的均值和导数。
这些功能具有不同的单位,标准化/标准化将失去功能的真实含义。

例如,一个特征向量的单位是旋转速度(度/秒),该特征中的值在-120到120之间。
另一个是x轴加速度的stddev,该值主要在0到2之间。
如果要进行标准化,则所有特征向量都将居于0附近,负/正值分布在零附近。 ->即使stddev也会有负值!它完全失去了实际意义吗?

我走错了路吗?任何信息表示赞赏!谢谢!

最佳答案

强烈建议将特征缩放和归一化作为预处理步骤,甚至可以受益于梯度下降(最常见的学习算法),即使在您的情况下它也很有用,但是如果您有疑问,可以执行交叉验证。例如,当使用图像和神经网络时,有时将特征(像素)归一化后会得到负值,这不会使训练数据失去意义。

关于machine-learning - 在机器学习中是否有必要对数据进行标准化/标准化?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/40733002/

10-12 18:24