正如标题所暗示的,我有一个时间序列数据集,但有很多缺失的数据。处理 LSTM 模型的最佳方法是什么?

为了提供更多详细信息,我有大约五个数据源来创建数据集,其中一些不允许我获取历史数据,因此我对该源中的功能遗漏了很多。我可以使用最近观察到的样本填写一些内容,但在大多数情况下这是不可能的。

我看到的一些建议是:

  • 隐马尔可夫建模
  • 期望最大化
  • 使用神经网络预测缺失值

  • 但无论如何,我觉得我将失去很多数据完整性。这通常是如何处理的/在 LSTM 模型中对此进行调整的最佳方法是什么?

    我正在使用 Python/Keras/TensorFlow。

    最佳答案

    也许模型顶层的 masking 会有所帮助。

    关于python - 处理 RNN/LSTM(时间序列)中的缺失数据,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/43680456/

    10-12 21:54
    查看更多