我是python新手,在pandas库中处理数据时遇到了困难。我有这样一个熊猫数据库:
Year Value
0 91 1
1 93 4
2 94 7
3 95 10
4 98 13
并希望完成丢失的年份,创建具有空值的行,如下所示:
Year Value
0 91 1
1 92 0
2 93 4
3 94 7
4 95 10
5 96 0
6 97 0
7 98 13
在python中如何做到这一点?
(我想这样做,这样我就可以在不跳过几年的情况下绘制价值)
最佳答案
我将创建一个新的数据框架,其中包含年份作为索引,并包含您需要覆盖的整个日期范围。然后,您可以简单地在两个数据框中设置值,并且索引将确保它们匹配的行是匹配的(我不得不使用FiRNA将缺失的年份设置为零,默认情况下它们将被设置为NaN
):
df = pd.DataFrame({'Year':[91,93,94,95,98],'Value':[1,4,7,10,13]})
df.index = df.Year
df2 = pd.DataFrame({'Year':range(91,99), 'Value':0})
df2.index = df2.Year
df2.Value = df.Value
df2= df2.fillna(0)
df2
Value Year
Year
91 1 91
92 0 92
93 4 93
94 7 94
95 10 95
96 0 96
97 0 97
98 13 98
最后,如果不想将年份作为索引,可以使用
reset_index
:df2.drop('Year',1).reset_index()
Year Value
0 91 1
1 92 0
2 93 4
3 94 7
4 95 10
5 96 0
6 97 0
7 98 13