我正在安德鲁·伍(Andrew Ng)教授的Coursera课程上学习机器学习。讲师将假设定义为“输入”(在我的情况下为x)的线性函数,如下所示:
hθ(x)=θ0+θ1(x)
在监督学习中,我们有一些训练数据,并据此尝试“推论”一个将输入紧密映射到相应输出的功能。为了推论该函数,我们将假设作为输入(x)的线性函数进行介绍。我的问题是,为什么选择包含两个θ的函数?为什么y
(i
)= a * x
(i
)这么简单,而a
是系数呢?稍后,我们可以使用算法为给定示例a
找到(i)
的“好”值?这个问题可能看起来很愚蠢。我很抱歉,但是我不是很擅长机器学习,我只是一个初学者。请帮助我理解这一点。
谢谢!
最佳答案
a
对应于θ1。您提出的线性模型忽略了截距θ0。
考虑一个输出函数y
等于常数5
,或者等于一个常数加上一个很小的x
分数,该分数永远不会超过.01
。如果您的模型没有可以吸收D.C.分量的θ0,将误差函数设为零将很困难。