我有两个数据框

df = pd.DataFrame({'A': [1,2,3,4], 'B': [5,6,7,8], 'C': [9,10,11,12]})

df2 = pd.DataFrame({'A': ['a','b','c','d'], 'B': ['e','f','g','h'], 'C': ['i','j','k','l']})


我正在尝试合并两个数据框,但也将每列的标题添加到单独的列中。我想要生产的是下面。

df3 = pd.DataFrame({'Serial': ['a','b','c','d','e','f','g','h','i','j','k','l'],
                'Cost': [1,2,3,4,5,6,7,8,9,10,11,12],
                'Name': ['A','A','A','A','B','B','B','B','C','C','C','C']})


我尝试遍历各列,但结果一团糟。

最佳答案

这是一种方法

In [33]: (pd.concat([df.unstack(), df2.unstack()], axis=1).reset_index()
           .drop('level_1', 1)
           .rename(columns={'level_0': 'Name', 0: 'Cost', 1: 'Serial'}))
Out[33]:
   Name  Cost Serial
0     A     1      a
1     A     2      b
2     A     3      c
3     A     4      d
4     B     5      e
5     B     6      f
6     B     7      g
7     B     8      h
8     C     9      i
9     C    10      j
10    C    11      k
11    C    12      l


其它的办法。

In [42]: pd.DataFrame({
            'Name': df.columns.repeat(len(df.index)),
            'Cost': df.values.flatten(order='k'),
            'Serial': df2.values.flatten(order='k')})
Out[42]:
    Cost Name Serial
0      1    A      a
1      2    A      b
2      3    A      c
3      4    A      d
4      5    B      e
5      6    B      f
6      7    B      g
7      8    B      h
8      9    C      i
9     10    C      j
10    11    C      k
11    12    C      l

08-24 21:38