我在python上有以下数据集
import pandas as pd
bcw = pd.read_csv('http://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/breast-cancer-wisconsin.data', header=None)
像24这样的行缺少值:
1057013,8,4,5,1,2,?,7,3,1,4
在
column 7
上,有一个'?'
,我想删除这一行。我怎样才能做到这一点? 最佳答案
对于column: 7
中的特定示例:
bcw = bcw[bcw[7] != '?']
但是,我实际上下载了数据集,并在
column: 6
中发现了相同的异常,因此此代码将查看'?'
的所有列并删除行:for col in bcw.columns:
if bcw[col].dtype != 'int64':
print "Removing possible '?' in column %s..." % col
bcw = bcw[bcw[col] != '?']
>>> Removing possible '?' in column 6...
关于python - 如何在 Pandas data.frame中仅选择完整,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/30769953/