如图所示:
有人可以帮助我了解增量下降算法中梯度的确切含义吗?
最佳答案
相对于theta 0
,该术语是derivative。
将theta
标记为X轴坐标(设为A)
在Y轴上找到对应的坐标(设为B),因此该点属于函数J
在点(A,B)上绘制该函数的切线
导数是该切线的斜率。
导数用于控制成本函数(J函数)最小化的两个方面:
方向-坡度的符号告诉您应该沿着X轴移动哪个方向才能收敛J
速率-斜率的大小告诉您应该移动多快
如图所示:
有人可以帮助我了解增量下降算法中梯度的确切含义吗?
最佳答案
相对于theta 0
,该术语是derivative。
将theta
标记为X轴坐标(设为A)
在Y轴上找到对应的坐标(设为B),因此该点属于函数J
在点(A,B)上绘制该函数的切线
导数是该切线的斜率。
导数用于控制成本函数(J函数)最小化的两个方面:
方向-坡度的符号告诉您应该沿着X轴移动哪个方向才能收敛J
速率-斜率的大小告诉您应该移动多快