有没有一种方法可以正确地以VW输入格式表示缺失值-不是用平均值或中位数来插补,不是将它们设置为0或任何其他常数,而是将它们视为真正缺失,以便SGD和FTRL-Proximal算法可以针对给定示例从梯度计算中排除这些坐标?
最佳答案
大众期望稀疏特征表示输入格式,请参见VW wiki。因此,正确处理缺失值。简而言之,不要列出其值缺失的要素。
关于machine-learning - 在Vowpal Wabbit中将缺失值视为真正缺失,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/33301462/