梯度下降算法为:
(摘自安德列斯NG Coursera课程)
如果有超过2个theta参数(特征权重),该算法应如何实施?
是否应包含额外的theta值:
并重复直到收敛,换句话说,直到theta0,theta1,theta2不再改变?
最佳答案
也许然后将theta转换为矩阵符号
big theta = big theta - alpha/m * sigma(h(big theta(X) - Y) * X .
Ng的表示法是向那些不太喜欢矩阵表示法的人讲清楚-我怀疑其中包括您自己。 –
矩阵公式(一个方程而不是多个方程)可能比OP中按顺序/单独描述的方程更清晰。单一矩阵表示法表明,更新实际上是对设计矩阵中所有向量的原子操作。基础线性代数库的责任是使该“发生”。
关于machine-learning - 超过2个theta值的梯度下降,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/33847827/