本文介绍了根据第2列中的不同值获取行的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我是熊猫的新手,曾尝试在Google上进行搜索,但仍然没有运气.如何通过column2中的不同值获取行?

I am a newbie to pandas, tried searching this on google but still no luck. How can I get the rows by distinct values in column2?

例如,我有下面的数据框:

For example, I have the dataframe bellow:

>>> df
COL1   COL2
a.com  22
b.com  45
c.com  34
e.com  45
f.com  56
g.com  22
h.com  45

我想基于COL2中的唯一值获取行

I want to get the rows based on unique values in COL2

>>> df
COL1  COL2
a.com 22
b.com 45
c.com 34
f.com 56

那么,我该怎么办呢?如果有人可以提供任何帮助,我将不胜感激.

So, how can I get that? I would appreciate it very much if anyone can provide any help.

推荐答案

使用 drop_duplicates ,其中指定列COL2用于检查重复项:

Use drop_duplicates with specifying column COL2 for check duplicates:

df = df.drop_duplicates('COL2')
#same as
#df = df.drop_duplicates('COL2', keep='first')
print (df)
    COL1  COL2
0  a.com    22
1  b.com    45
2  c.com    34
4  f.com    56

您还可以仅保留最后一个值:

You can also keep only last values:

df = df.drop_duplicates('COL2', keep='last')
print (df)
    COL1  COL2
2  c.com    34
4  f.com    56
5  g.com    22
6  h.com    45

或删除所有重复项:

df = df.drop_duplicates('COL2', keep=False)
print (df)
    COL1  COL2
2  c.com    34
4  f.com    56

这篇关于根据第2列中的不同值获取行的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!

08-19 01:54