我的问题基本上是:在学习问题中,是否存在不建议使用神经网络的数据集?这种数据集的一些普遍特征是什么?

我问的原因是:
在某些文章中,证明了神经网络可以学习任何功能。但是所有数据集都代表一个函数吗?如果他们没有资格这样做;不合格数据集的属性是什么?

在我的研究中,我很难找到一个好的架构和参数组合。我对数据集本身感到怀疑。因为我看到以下模式

    
输入1输入2目标
0.8 0.6 0.3
0.8 0.6 0.3
0.8 0.6 0.0
0.8 0.6 0.1


作为人类,我无法通过查看输入来对目标进行预测,而且我希望神经网络也无法准确预测。因此,对于这种情况,建议使用其他方法。

最佳答案

只要您不能说出真正的价值,就没有明确的答案。更具体地说,是有一个真正的价值。

但是,有两种情况很常见,可能会导致产生此类数据。

1.)嘈杂的输出,可以说您观察到的数据来自某个函数

 f(x,y) = g(x,y) + N(0,0.1)


g(x,y)给出唯一值的情况下,函数中会添加正态分布的噪声。如果您有足够的培训日期,您的NN将慢慢收敛到正确的值。即使噪声不是正态分布,也可以进行分布式训练

2.)没有唯一的真实价值还有另一种情况是可以想象的。没有唯一的真实价值。给定我上面的训练数据,就像人类一样会学习。在0.5情况下为f(0.8,0.6)=0.3的结果,依此类推。神经网络也能够学习这些功能。

什么是神经网络无法学习。机器学习中有一些可能无法学习的假设。例如,如果您的数据不是独立的,那将是一个大问题。因此,如果您的培训数据中的目标与输入无关,则0.3,0.3,0.0,0.1,0.3,0.3,0.0,0.1,....学习模式将很困难。

通常,您需要能够制定要学习的内容。这通常是根据目标函数完成的,否则,您将无法确定网络会学到什么(参见免费午餐定理)

关于machine-learning - 不建议使用神经网络的数据集,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/34699107/

10-12 18:11
查看更多