我想从我的 Panda DataFrame 中删除少于 3 个非零值(不包括总列)的行。
所以目前我有。
year 2001 2002 2003 2004 2005 2006 2007 TOTAL
player
Emma 0 0 0 0 3 4 5 12
Max 3 5 0 0 0 0 0 8
Josh 1 2 4 1 2 1 0 11
Steve 0 0 0 0 3 0 0 3
Mike 1 0 0 0 0 0 2 3
但是我想要: year 2001 2002 2003 2004 2005 2006 2007 TOTAL
player
Emma 0 0 0 0 3 4 5 12
Josh 1 2 4 1 2 1 0 11
我正在考虑使用 for 循环,但我不确定如何实现它/它是否是解决我的问题的最佳方法。 最佳答案
pandas
I drop
TOTAl
和 sum
每行的非零数
df[df.drop('TOTAL', 1).ne(0).sum(1).gt(2)]
year 2001 2002 2003 2004 2005 2006 2007 TOTAL
player
Emma 0 0 0 0 3 4 5 12
Josh 1 2 4 1 2 1 0 11
numpy
更快的解决方案
v = df.values
m = (v[:, :-1] != 0).sum(1) > 2
pd.DataFrame(v[m], df.index[m], df.columns)
year 2001 2002 2003 2004 2005 2006 2007 TOTAL
player
Emma 0 0 0 0 3 4 5 12
Josh 1 2 4 1 2 1 0 11
关于python-3.x - 删除 Pandas 中少于 3 个非零值的行,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/43906035/