我正在读《统计学习入门》这本书。这本书说:

更一般而言,假设我们观察到定量响应Y和一组预测变量X1,X2,... Xn。

我们假设Y和X之间存在某种关系(X1,X2,... Xn),这些关系可以用非常一般的形式写成:

Y = f(X)+ e

在这里,f是X的某个固定但未知的函数,e是一个独立于X且均值为零的随机误差项。

我想知道零均值是什么意思?

最佳答案

我想知道零均值是什么意思?


这意味着,被视为随机变量的e的期望值为0。换句话说,如果您计算这些误差的平均值,则样本集将增长为无穷大-它将收敛为零。

实际上,它只是意味着您的噪声不会改变f(x)函数,但是,如果您观察到某些“正”噪声,则观察到相同强度的“负”噪声的可能性就完全相同。请注意,如果您的e的均值为m,则表示

E[f(x) + e] = E[f(x)] + E[e] = E[f(x)] + m


因此,对于每个单点“ x”,您都希望观察到值f(x)+ m而不是f(x)。因此,它将与建模相同

g(x) + e'


哪里

g(x) = f(x) + m


e'现在是零均值随机噪声。因此,整个统计设置对于非零均值噪声仍然有效,但是您的任务(ML正在解决)不是建模“ f”而是建模“ g”。

关于machine-learning - 错误项e的含义,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/36857290/

10-12 18:24