我想将时间序列数据包含在csv的数据框中。我使用以下过程:

path = [r'C:\data_' + str(x) + ".csv" for x in range(1150, 1177)]
data_df = pd.concat(pd.read_csv(f, delimiter = ",", header = None) for f in path)

data_df.head()


python -  Pandas 如何计算指数?-LMLPHP

结果如下:

data_df.info()


python -  Pandas 如何计算指数?-LMLPHP

索引(1到187481)与行数(5387507)有何不同?

在做

data_df.reset_index()


一切正常:

python -  Pandas 如何计算指数?-LMLPHP

那么如何计算初始指标呢?

最佳答案

indexes中存在重复项,因为index的每个DataFrame0函数中的concat开始。

正如MaxU所述,解决方案是将参数ignore_index=True添加到concat-docs

data_df = pd.concat(pd.read_csv(f, delimiter = ",", header = None) for f in path, ignore_index=True)

关于python - Pandas 如何计算指数?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/38269303/

10-14 09:02