Closed. This question is off-topic。它当前不接受答案。
想改善这个问题吗? Update the question,因此它是on-topic,用于堆栈溢出。
5年前关闭。
我想以mm为单位计算今天的降水量,所以我想先知道是线性回归还是Logistic回归问题,以及如何计算是否我的数据集的某些属性具有较大的否。实例。
以及如何知道何时使用特征缩放以及如果我在必要的地方不使用特征缩放,我的程序将如何起作用。
我可以使用具有功能缩放的Java代码吗?
想改善这个问题吗? Update the question,因此它是on-topic,用于堆栈溢出。
5年前关闭。
我想以mm为单位计算今天的降水量,所以我想先知道是线性回归还是Logistic回归问题,以及如何计算是否我的数据集的某些属性具有较大的否。实例。
以及如何知道何时使用特征缩放以及如果我在必要的地方不使用特征缩放,我的程序将如何起作用。
我可以使用具有功能缩放的Java代码吗?
最佳答案
如果您要计算今天的降雨量,那么您应该进行线性回归,它最适合此问题。
由于数量属于R(实数),因此它是一个具体值,如果您具有分类尤其是二进制分类,则必须使用Logistic回归。
假设计算今天的降雨量有6个属性,那么您的模型必须是: y = w(0)+x(1)w(1)+x(2)w(2)+x(3)w(3)+x(4)w(4)+x(5)w(5)+x(6)w(6)
y
是您想要预测的降雨量。
其中x(1)...x(6)
是属性,而w(0)...w(6)
是您要计算的内容。
那么您应该减少的损失函数:
现在您要计算w(0)... w(6)。
现在在其中使用梯度下降。
//实际上,我没有任何梯度下降的图像,但是我可以使您从中了解。theta(j)
是w(j)
,alpha
是学习率。并且E
是J(theta)
,t(p)
是给定值,其中y(p)
是原始y
的预测值。
当数据太稀疏时,可以使用feature scaling将所有元素除以最大元素,以标准化独立数据,因此首先选择特征然后进行缩放。
有关Linear regression的更多信息。
为什么不能在这里应用逻辑回归?
因为在逻辑回归中,我们得到了最适合二进制分类的S形曲线。
大于0.5取1或为true,或者小于0.5取0或false。
希望这对您有用。
08-19 19:58