我在python上有以下数据集

import pandas as pd
bcw = pd.read_csv('http://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/breast-cancer-wisconsin.data', header=None)

像24这样的行缺少值:
1057013,8,4,5,1,2,?,7,3,1,4

column 7上,有一个'?',我想删除这一行。我怎样才能做到这一点?

最佳答案

对于column: 7中的特定示例:

bcw = bcw[bcw[7] != '?']

但是,我实际上下载了数据集,并在column: 6中发现了相同的异常,因此此代码将查看'?'的所有列并删除行:
for col in bcw.columns:
    if bcw[col].dtype != 'int64':
        print "Removing possible '?' in column %s..." % col
        bcw = bcw[bcw[col] != '?']

>>> Removing possible '?' in column 6...

关于python - 如何在 Pandas data.frame中仅选择完整,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/30769953/

10-11 13:29