【cs229-Lecture4】Newton’s  method-LMLPHP

首先,选择一个接近函数【cs229-Lecture4】Newton’s  method-LMLPHP零点【cs229-Lecture4】Newton’s  method-LMLPHP,计算相应的【cs229-Lecture4】Newton’s  method-LMLPHP和切线斜率【cs229-Lecture4】Newton’s  method-LMLPHP(这里【cs229-Lecture4】Newton’s  method-LMLPHP表示函数【cs229-Lecture4】Newton’s  method-LMLPHP导数)。然后我们计算穿过点【cs229-Lecture4】Newton’s  method-LMLPHP并且斜率为【cs229-Lecture4】Newton’s  method-LMLPHP的直线和【cs229-Lecture4】Newton’s  method-LMLPHP轴的交点的【cs229-Lecture4】Newton’s  method-LMLPHP坐标,也就是求如下方程的解:

【cs229-Lecture4】Newton’s  method-LMLPHP

我们将新求得的点的【cs229-Lecture4】Newton’s  method-LMLPHP坐标命名为【cs229-Lecture4】Newton’s  method-LMLPHP,通常【cs229-Lecture4】Newton’s  method-LMLPHP会比【cs229-Lecture4】Newton’s  method-LMLPHP更接近方程【cs229-Lecture4】Newton’s  method-LMLPHP的解。因此我们现在可以利用【cs229-Lecture4】Newton’s  method-LMLPHP开始下一轮迭代。迭代公式可化简为如下所示:

【cs229-Lecture4】Newton’s  method-LMLPHP

已经证明,如果【cs229-Lecture4】Newton’s  method-LMLPHP连续的,并且待求的零点【cs229-Lecture4】Newton’s  method-LMLPHP是孤立的,那么在零点【cs229-Lecture4】Newton’s  method-LMLPHP周围存在一个区域,只要初始值【cs229-Lecture4】Newton’s  method-LMLPHP位于这个邻近区域内,那么牛顿法必定收敛。 并且,如果【cs229-Lecture4】Newton’s  method-LMLPHP不为0, 那么牛顿法将具有平方收敛的性能. 粗略的说,这意味着每迭代一次,牛顿法结果的有效数字将增加一倍。

from:http://blog.csdn.net/luoleicn/article/details/6527049

在上面讨论的是2维情况,高维情况的牛顿迭代公式是:

【cs229-Lecture4】Newton’s  method-LMLPHP

其中H是hessian矩阵,定义为:

【cs229-Lecture4】Newton’s  method-LMLPHP

高维情况依然可以用牛顿迭代求解,但是问题是Hessian矩阵引入的复杂性,使得牛顿迭代求解的难度大大增加,但是已经有了解决这个问题的办法就是Quasi-Newton methond,不再直接计算hessian矩阵,而是每一步的时候使用梯度向量更新hessian矩阵的近似。

05-11 20:20