machine-learning - 错误项e的含义

我正在读《统计学习入门》这本书。这本书说：

更一般而言，假设我们观察到定量响应Y和一组预测变量X1，X2，... Xn。

我们假设Y和X之间存在某种关系（X1，X2，... Xn），这些关系可以用非常一般的形式写成：

Y = f（X）+ e

在这里，f是X的某个固定但未知的函数，e是一个独立于X且均值为零的随机误差项。

我想知道零均值是什么意思？

最佳答案

我想知道零均值是什么意思？

这意味着，被视为随机变量的e的期望值为0。换句话说，如果您计算这些误差的平均值，则样本集将增长为无穷大-它将收敛为零。

实际上，它只是意味着您的噪声不会改变f（x）函数，但是，如果您观察到某些“正”噪声，则观察到相同强度的“负”噪声的可能性就完全相同。请注意，如果您的e的均值为m，则表示

E[f(x) + e] = E[f(x)] + E[e] = E[f(x)] + m

因此，对于每个单点“ x”，您都希望观察到值f（x）+ m而不是f（x）。因此，它将与建模相同

g(x) + e'

哪里

g(x) = f(x) + m

而e'现在是零均值随机噪声。因此，整个统计设置对于非零均值噪声仍然有效，但是您的任务（ML正在解决）不是建模“ f”而是建模“ g”。

关于machine-learning - 错误项e的含义，我们在Stack Overflow上找到一个类似的问题：https://stackoverflow.com/questions/36857290/