我有一个看起来像这样的Pandas DataFrame?

Feature      Class
text1        [label1, label2]
text2        [label2, label3]


做这个的最好方式是什么?

Feature      Class
text1        label1
text1        label2
text2        label2
text2        label3


注意:在初始表中,类值是包含标签的Python列表。

最佳答案

您可以将numpy.repeatSeries.str.len一起使用,并按chain.from_iterable拼合列表:

from itertools import chain

df = pd.DataFrame({
    'Feature' : df['Feature'].values.repeat(df['Class'].str.len()),
    'Class' : list(chain.from_iterable(df['Class'].values.tolist()))
})
print (df)
  Feature   Class
0   text1  label1
1   text1  label2
2   text2  label2
3   text2  label3

关于python - 如何将多标签数据集分成多行,每行有一个标签?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/52658915/

10-13 09:16