本文介绍了根据第2列中的不同值获取行的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我是熊猫的新手,曾尝试在Google上进行搜索,但仍然没有运气.如何通过column2中的不同值获取行?
I am a newbie to pandas, tried searching this on google but still no luck. How can I get the rows by distinct values in column2?
例如,我有下面的数据框:
For example, I have the dataframe bellow:
>>> df
COL1 COL2
a.com 22
b.com 45
c.com 34
e.com 45
f.com 56
g.com 22
h.com 45
我想基于COL2中的唯一值获取行
I want to get the rows based on unique values in COL2
>>> df
COL1 COL2
a.com 22
b.com 45
c.com 34
f.com 56
那么,我该怎么办呢?如果有人可以提供任何帮助,我将不胜感激.
So, how can I get that? I would appreciate it very much if anyone can provide any help.
推荐答案
使用 drop_duplicates
,其中指定列COL2
用于检查重复项:
Use drop_duplicates
with specifying column COL2
for check duplicates:
df = df.drop_duplicates('COL2')
#same as
#df = df.drop_duplicates('COL2', keep='first')
print (df)
COL1 COL2
0 a.com 22
1 b.com 45
2 c.com 34
4 f.com 56
您还可以仅保留最后一个值:
You can also keep only last values:
df = df.drop_duplicates('COL2', keep='last')
print (df)
COL1 COL2
2 c.com 34
4 f.com 56
5 g.com 22
6 h.com 45
或删除所有重复项:
df = df.drop_duplicates('COL2', keep=False)
print (df)
COL1 COL2
2 c.com 34
4 f.com 56
这篇关于根据第2列中的不同值获取行的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!