我很困惑为什么dz=da*g'(z)
?
众所周知,在a=g(z)
的正向传播中,取z
的导数后,我可以得到da/dz=g'(z)
,所以dz=da*1/g'(z)
?
谢谢!!
最佳答案
据我所记得,在许多课程中,像dZ
这样的表示形式是写dJ/dZ
等的较短方法。就各种参数,激活和加权总和等而言,所有导数都是成本。
关于machine-learning - 在神经网络的反向传播中,如何获得微分方程?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/54739817/