如何将这条线组合到pandas数据框中以删除丢失率超过90%的列?

此行将显示所有列及其丢失率:

percentage = (LoanStats_securev1_2018Q1.isnull().sum()/LoanStats_securev1_2018Q1.isnull().count()*100).sort_values(ascending = False)


熟悉熊猫的人请帮忙。

最佳答案

您可以将dropna与阈值一起使用

    newdf=df.dropna(axis=1,thresh=len(df)*0.9)


axis = 1表示列,thresh是
所需的非NA值的最小数量。

关于python - pandas:删除丢失率超过90%的列,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/51149744/

10-12 16:50