在关于神经网络和深度学习的online textbook中,作者从最小化二次成本函数的角度说明了神经网络的基本知识,他说这是均方误差的同义词。 不过,我对他的功能有两点困惑(下面的伪代码)。
MSE≡(1 / 2n)* ∑‖y_true-y_pred‖ ^ 2
您能提供的任何见解都将不胜感激!
最佳答案
成本函数乘以0.5的系数并不重要。实际上,您可以将其乘以所需的任何实常数,并且学习将是相同的。它仅用于使成本函数相对于输出的导数将只是$$ y-y_ {t} $$。这在某些应用中很方便,例如反向传播。