我正在使用pybrain实现在python中使用前馈神经网络。对于训练,我将使用反向传播算法。我知道,对于神经网络,我们需要拥有适量的数据,以免对网络进行不足/过度的训练。我可以为数据集获得约1200种不同的训练数据模板。
所以这是问题:
如何为我的训练计算最佳数据量?由于我尝试使用数据集中的500个项目并且花费了许多小时才能收敛,所以我宁愿不必尝试过多的大小。使用这种最后的尺寸,我们的效果很好,但是我想找到最佳数量。神经网络大约有7个输入,3个隐藏节点和1个输出。

最佳答案

如何计算最佳金额
  我的训练数据?


这完全取决于解决方案。科学也有一些艺术。知道您是否过度适应区域的唯一方法是针对一组验证数据(即您不训练使用的数据)定期测试网络。当该组数据的性能开始下降时,您可能已经受够了训练-回滚到上一次迭代。


  结果是相当不错的
  最后的尺寸,但我想找到
  最适量。


“最佳”不一定是可能的;这也取决于您的定义。通常,您要寻找的是高度自信的结果,即一组给定的权重将在看不见的数据上表现出色。这就是验证集背后的想法。

07-24 19:29
查看更多