希望在“ ROE”列中用百分比大于100的“ NaN”替换值。读取csv文件。以下是代码,不确定如何在“缺失”数据框中分配值,请帮助
**数据集中的ROE列包含“ 25.00%”,“ 130.00%”,“ 50.00%”之类的值。因此在比较时,首先需要通过删除最后一个字符来转换浮点数中的值。
missing = pd.read_csv(local_path + "/Week4/Datasets_Week4/roemissing.csv")
print(missing)
for x in missing["ROE"]:
y = float(x[:-1])
if y>100:
print(x.index)
最佳答案
使用以下内容:
missing['ROE'] = missing['ROE'].str[:-1].astype(int)
missing.loc[missing.ROE > 100, 'ROE'] = np.nan
missing.ROE > 100
将选择ROE
值大于100
的行。 “ ROE”是您需要替换所选行的值的列名。选择所有
ROE
值大于100
的行,然后将NaN
值设置为列ROE
中的选定行。关于python - 使用Python替换数据框中的值,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/48848308/