如何将这条线组合到pandas数据框中以删除丢失率超过90%的列?
此行将显示所有列及其丢失率:
percentage = (LoanStats_securev1_2018Q1.isnull().sum()/LoanStats_securev1_2018Q1.isnull().count()*100).sort_values(ascending = False)
熟悉熊猫的人请帮忙。
最佳答案
您可以将dropna与阈值一起使用
newdf=df.dropna(axis=1,thresh=len(df)*0.9)
axis = 1表示列,thresh是
所需的非NA值的最小数量。
关于python - pandas:删除丢失率超过90%的列,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/51149744/