我正在将具有 55 行的数据帧 df 中的数据插入到形状为 (55,60) 的 numpy 数组 matrix_of_coupons_and_facevalues 中。我正在使用下面的代码执行此操作。但是,我收到错误 IndexError: index 55 is out of bounds for axis 0 with size 55months_to_maturity 包含数字 [6:6:330]

for (i,row) in df.iterrows():
    matrix_of_coupons_and_facevalues[i,0:(row.months_to_maturity/ 6)-1] = 1/2
    matrix_of_coupons_and_facevalues[i,(row.months_to_maturity/6)-1] = 3/2

谢谢你

最佳答案

对于任何 future 的访客,以下是发生的事情:

DataFrame 的索引用于唯一地标记每一行,因此当您删除一行时,该索引将被删除,并且索引中有一个“间隙”。当您有一个有意义的索引时,这非常好。但是,当您只希望索引为您的行编号时,这不是您想要的。在这种情况下,df 包含 55 行,但索引有孔,因此最大索引大于 55,导致矩阵中的 IndexError。举个例子:

In [1]: import pandas as pd

In [2]: df = pd.DataFrame([[1,2],[3,4],[5,6]], columns=['x','y'])

In [3]: df
Out[3]:
   x  y
0  1  2
1  3  4
2  5  6

In [4]: df = df.drop(1)

In [5]: df
Out[5]:
   x  y
0  1  2
2  5  6

为了解决这种情况,您可以简单地将索引重新分配为包含正确数字范围的列表:
In [6]: df.index = list(range(len(df.index)))

In [7]: df
Out[7]:
   x  y
0  1  2
1  5  6

关于python - 将数据帧中的数据插入 numpy 数组,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/31414306/

10-13 07:21
查看更多