我使用以下代码来表示重复的行

df['duplicate']=df.Column_A.duplicated()

但是,当我查看 df 时,我看到以下内容:
Column_A | duplicate
AAA        False
ABC        False
ABC        True

我需要第 2 行也为 True,以便我可以轻松过滤“重复”行。我怎样才能做到这一点?

最佳答案

根据 docs 使用 keep 参数并设置为 False 。如您所见,它默认为 first

import pandas as pd

df = pd.DataFrame({'Column_A': ['AAA', 'AAB', 'AAB', 'AAC']})
df['duplicate'] = df.duplicated(keep=False)

print(df)

     Column_A  duplicate
0    'AAA'     False
1    'AAB'     True
2    'AAB'     True
3    'AAC'     False

关于Python Pandas : flag duplicate rows,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/44554848/

10-11 07:34