我想将时间序列数据包含在csv的数据框中。我使用以下过程:
path = [r'C:\data_' + str(x) + ".csv" for x in range(1150, 1177)]
data_df = pd.concat(pd.read_csv(f, delimiter = ",", header = None) for f in path)
data_df.head()
结果如下:
data_df.info()
索引(1到187481)与行数(5387507)有何不同?
在做
data_df.reset_index()
一切正常:
那么如何计算初始指标呢?
最佳答案
indexes
中存在重复项,因为index
的每个DataFrame
从0
函数中的concat
开始。
正如MaxU所述,解决方案是将参数ignore_index=True
添加到concat
-docs:
data_df = pd.concat(pd.read_csv(f, delimiter = ",", header = None) for f in path, ignore_index=True)
关于python - Pandas 如何计算指数?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/38269303/