This question already has answers here:
Pandas: assign an index to each group identified by groupby
                                
                                    (6个答案)
                                
                        
                                2年前关闭。
            
                    
我有一个DataFrame'Id'是唯一的,而'A', 'B', 'C'等...

在不同的行中,所有值'A', 'B', 'C'都相同。我想给他们一个组名(从1开始的运行索引)。

例如:

df = pd.DataFrame({"A": [1, 1, 1, 2], "B": [3, 4, 4, 4], "C": [5, 5, 5, 5]})
df
Out[127]:
   A  B  C
0  1  3  5
1  1  4  5
2  1  4  5
3  2  4  5


会变成

   A  B  C  grp
0  1  3  5    1
1  1  4  5    2
2  1  4  5    2
3  2  4  5    3


我知道我可以对['A', 'B', 'C']进行分组并获取密钥,但是,相比之下,我必须在未经优化的情况下遍历密钥和Dataframe。我无法以最佳方式做到这一点

最佳答案

使用GroupBy.ngroup

df['grp'] = df.groupby(['A', 'B', 'C']).ngroup() + 1
print (df)

   A  B  C  grp
0  1  3  5    1
1  1  4  5    2
2  1  4  5    2
3  2  4  5    3


如果列已排序:

df['grp'] = pd.factorize([tuple(x) for x in df.values])[0] + 1

关于python - Pandas -按所有列分组并在原始数据框中标记,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/52034526/

10-10 15:28