我是python新手,在pandas库中处理数据时遇到了困难。我有这样一个熊猫数据库:

    Year  Value
0    91     1
1    93     4
2    94     7
3    95    10
4    98    13

并希望完成丢失的年份,创建具有空值的行,如下所示:
    Year  Value
0    91     1
1    92     0
2    93     4
3    94     7
4    95    10
5    96     0
6    97     0
7    98    13

在python中如何做到这一点?
(我想这样做,这样我就可以在不跳过几年的情况下绘制价值)

最佳答案

我将创建一个新的数据框架,其中包含年份作为索引,并包含您需要覆盖的整个日期范围。然后,您可以简单地在两个数据框中设置值,并且索引将确保它们匹配的行是匹配的(我不得不使用FiRNA将缺失的年份设置为零,默认情况下它们将被设置为NaN):

df = pd.DataFrame({'Year':[91,93,94,95,98],'Value':[1,4,7,10,13]})
df.index = df.Year
df2 = pd.DataFrame({'Year':range(91,99), 'Value':0})
df2.index = df2.Year

df2.Value = df.Value
df2= df2.fillna(0)
df2
      Value  Year
Year
91        1    91
92        0    92
93        4    93
94        7    94
95       10    95
96        0    96
97        0    97
98       13    98

最后,如果不想将年份作为索引,可以使用reset_index
df2.drop('Year',1).reset_index()

   Year  Value
0    91      1
1    92      0
2    93      4
3    94      7
4    95     10
5    96      0
6    97      0
7    98     13

08-19 20:24