我正在安德鲁·伍(Andrew Ng)教授的Coursera课程上学习机器学习。讲师将假设定义为“输入”(在我的情况下为x)的线性函数,如下所示:

hθ(x)=θ0+θ1(x)

在监督学习中,我们有一些训练数据,并据此尝试“推论”一个将输入紧密映射到相应输出的功能。为了推论该函数,我们将假设作为输入(x)的线性函数进行介绍。我的问题是,为什么选择包含两个θ的函数?为什么yi)= a * xi)这么简单,而a是系数呢?稍后,我们可以使用算法为给定示例a找到(i)的“好”值?这个问题可能看起来很愚蠢。我很抱歉,但是我不是很擅长机器学习,我只是一个初学者。请帮助我理解这一点。

谢谢!

最佳答案

a对应于θ1。您提出的线性模型忽略了截距θ0。

考虑一个输出函数y等于常数5,或者等于一个常数加上一个很小的x分数,该分数永远不会超过.01。如果您的模型没有可以吸收D.C.分量的θ0,将误差函数设为零将很困难。

07-24 19:39