正如标题所暗示的,我有一个时间序列数据集,但有很多缺失的数据。处理 LSTM 模型的最佳方法是什么?
为了提供更多详细信息,我有大约五个数据源来创建数据集,其中一些不允许我获取历史数据,因此我对该源中的功能遗漏了很多。我可以使用最近观察到的样本填写一些内容,但在大多数情况下这是不可能的。
我看到的一些建议是:
但无论如何,我觉得我将失去很多数据完整性。这通常是如何处理的/在 LSTM 模型中对此进行调整的最佳方法是什么?
我正在使用 Python/Keras/TensorFlow。
最佳答案
也许模型顶层的 masking 会有所帮助。
关于python - 处理 RNN/LSTM(时间序列)中的缺失数据,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/43680456/