本文介绍了展平 pandas 数组的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

DataFrame中的一列是数组.如何展平?

One of the columns in DataFrame is an array. How do I flatten it?

column1 column2 column3
var1     var11   [1, 2, 3, 4]
var2     var22   [1, 2, 3, 4, -2, 12]
var3     var33   [1, 2, 3, 4, 33, 544]

展平后应为:

column1 column2 column3
var1     var11   1
var1     var11   2
var1     var11   3
var1     var11   4
var2     var22   1
var2     var22   2
var2     var22   3
var2     var22   4
var2     var22   -2
......
var3     var33   544

我似乎unstack可以帮助我,但我不明白到底是什么.

I seemed unstack could help me but I couldn't understand how exactly.

推荐答案

这里是一种单线"方法,其中df是您的数据框:

Here is one 'one-liner' approach, where df is your dataframe:

import pandas as pd

df.join(df.column3.apply(pd.Series)).drop('column3', 1).set_index([u'column1', u'column2']).stack().reset_index().drop('level_2', 1).rename(columns={0:'column3'})

收益:

   column1 column2  column3
0     var1   var11        1
1     var1   var11        2
2     var1   var11        3
3     var1   var11        4
4     var2   var22        1
5     var2   var22        2
6     var2   var22        3
7     var2   var22        4
8     var2   var22       -2
9     var2   var22       12
10    var3   var33        1
11    var3   var33        2
12    var3   var33        3
13    var3   var33        4
14    var3   var33       33
15    var3   var33      544

这篇关于展平 pandas 数组的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!

08-29 02:32