我正在尝试建立一个基于卷积的模型。我训练了以下两种不同的结构。如您所见,对于单层而言,历元数没有明显变化。双层Conv2D可以提高火车数据集的准确性和损失,但是验证特性将是一个悲剧。
根据我无法增加数据集的事实,该怎么做才能改善验证特性?
我已经检查了正则化器L1和L2,但它们并未影响我的模型。
 python - Keras:过度拟合的Conv2D-LMLPHP
python - Keras:过度拟合的Conv2D-LMLPHP

最佳答案

我尝试了各种已知可以在小型数据集上很好地工作的模型,但是正如我所怀疑的那样,这也是我的最终判决-这是一个失败的原因。

您没有足够的数据来训练一个好的DL模型,甚至没有像SVM这样的ML模型-因为拥有八个单独的类而使情况更加恶化。使用SVM进行二进制分类时,您的数据集将有机会,但对于8类而言,则没有机会。作为最后的选择,您可以尝试XGBoost,但我不会打赌。

你能做什么?获取更多数据。没有办法解决。我没有确切的数字,但是对于8类分类,我想您需要当前数据的50-200倍才能获得合理的结果。还请注意,在这个数字较大的情况下,如果使用更大的验证集,您的验证性能肯定会差很多。



对于读者,OP与我分享了他的数据集;形状为:X = (1152, 1024, 1), y = (1152, 8)

09-30 10:24