如图所示:



有人可以帮助我了解增量下降算法中梯度的确切含义吗?

最佳答案

相对于theta 0,该术语是derivative


theta标记为X轴坐标(设为A)
在Y轴上找到对应的坐标(设为B),因此该点属于函数J
在点(A,B)上绘制该函数的切线
导数是该切线的斜率。




导数用于控制成本函数(J函数)最小化的两个方面:


方向-坡度的符号告诉您应该沿着X轴移动哪个方向才能收敛J
速率-斜率的大小告诉您应该移动多快

07-25 22:50