我很困惑为什么dz=da*g'(z)
众所周知,在a=g(z)的正向传播中,取z的导数后,我可以得到da/dz=g'(z),所以dz=da*1/g'(z)
谢谢!!

最佳答案

据我所记得,在许多课程中,像dZ这样的表示形式是写dJ/dZ等的较短方法。就各种参数,激活和加权总和等而言,所有导数都是成本。

关于machine-learning - 在神经网络的反向传播中,如何获得微分方程?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/54739817/

10-12 17:48