我在每个Excel工作表上都有3个表:sheet1-Gross,sheet2-Margin,sheet3-Revenue

因此,我能够遍历每张纸并将其取消旋转。

但是我如何才能将他们团结在一起?

python - 如何使用python pandas在循环中加入多个数据框-LMLPHP

    sheet_names = ['Gross','Margin','Revenue']

    full_table = pd.DataFrame()
    for sheet in sheet_names:
        df = pd.read_excel(BudgetData.xlsx', sheet_name = sheet, index=False)
        unpvt = pd.melt(df,id_vars=['Company'], var_name ='Month', value_name = sheet)
# how can I join unpivoted dataframes here?
        print(unpvt)


python - 如何使用python pandas在循环中加入多个数据框-LMLPHP

理想的结果:

python - 如何使用python pandas在循环中加入多个数据框-LMLPHP

更新:

谢谢@Celius Stingher。
我认为这就是我所需要的。它只是给我奇怪的排序:

python - 如何使用python pandas在循环中加入多个数据框-LMLPHP

并给我这个警告:

Sorting because non-concatenation axis is not aligned. A future version
of pandas will change to not sort by default.

To accept the future behavior, pass 'sort=False'.

To retain the current behavior and silence the warning, pass 'sort=True'.

  from ipykernel import kernelapp as app

最佳答案

因此,似乎您正在执行透视,但没有将每个未透视的数据帧保存在任何地方。让我们创建一个数据框列表,该列表将存储每个未透视的数据框。稍后,我们将数据帧列表作为pd.concat函数的参数传递,以执行串联。

sheet_names = ['Gross','Margin','Revenue']
list_of_df = []
full_table = pd.DataFrame()
for sheet in sheet_names:
    df = pd.read_excel(BudgetData.xlsx', sheet_name = sheet, index=False)
    df = pd.melt(df,id_vars=['Company'], var_name ='Month', value_name = sheet)
    list_of_df.append(df)

full_df = pd.concat(list_of_df,ignore_index=True)
full_df = full_df.sort_values(['Company','Month'])
print(full_df)


编辑:

现在,我了解了您的需求,让我们尝试另一种方法。循环之后,尝试对pd.concat进行以下代码解释:

full_df = list_of_df[0].merge(list_of_df[1],on=['Company','Month']).merge(list_of_df[2],on=['Company','Month'])

08-20 04:17
查看更多