我有以下数据框,其中的列ID_xID_y包含用单个空格分隔的数据:

df = pd.DataFrame({
    'fruit':['apple','orange','banana'],
    'ID_x' : ['1 2 3','4','5'],
    'ID_y' : ['A B', 'C D','E']
    }, index=['0','1','2'])


python - 如何使数据框中的每一行的每一列都有一个值?-LMLPHP

我想拆分列(ID_xID_y)中的每个值并创建新行,以使每一行代表拆分值的一一对应关系。

像这样:

python - 如何使数据框中的每一行的每一列都有一个值?-LMLPHP

任何想法如何解决这个问题?

到目前为止,我已经尝试过拆分列中的值:

col_x = 'ID_x'
col_y = 'ID_y'

df = df_unflat.assign(**{col_x:df_unflat[col_x].str.split(' ')})
df = df_unflat.assign(**{col_y:df_unflat[col_y].str.split(' ')})

最佳答案

尝试这种方法:

import pandas as pd
df = pd.DataFrame({
    'fruit':['apple','orange','banana'],
    'ID_x' : ['1 2 3','4','5'],
    'ID_y' : ['A B', 'C D','E']
    }, index=['0','1','2'])
id_x = df['ID_x'].str.split(' ').apply(Series, 1).stack()
id_y = df['ID_y'].str.split(' ').apply(Series, 1).stack()
id_x.index = id_x.index.droplevel(-1)
id_y.index = id_y.index.droplevel(-1)
id_x.name = 'ID_x'
id_y.name = 'ID_y'
del df['ID_x']
del df['ID_y']
df = df.join(id_x)
df = df.join(id_y)
df.reset_index(drop=True)


输出:

    fruit   ID_x    ID_y
0   apple   1       A
1   apple   1       B
2   apple   2       A
3   apple   2       B
4   apple   3       A
5   apple   3       B
6   orange  4       C
7   orange  4       D
8   banana  5       E

关于python - 如何使数据框中的每一行的每一列都有一个值?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/44080909/

10-12 16:53