希望在“ ROE”列中用百分比大于100的“ NaN”替换值。读取csv文件。以下是代码,不确定如何在“缺失”数据框中分配值,请帮助

**数据集中的ROE列包含“ 25.00%”,“ 130.00%”,“ 50.00%”之类的值。因此在比较时,首先需要通过删除最后一个字符来转换浮点数中的值。

missing = pd.read_csv(local_path + "/Week4/Datasets_Week4/roemissing.csv")
print(missing)

for x in missing["ROE"]:
    y = float(x[:-1])
    if y>100:
        print(x.index)

最佳答案

使用以下内容:

missing['ROE'] = missing['ROE'].str[:-1].astype(int)
missing.loc[missing.ROE > 100, 'ROE'] = np.nan


missing.ROE > 100将选择ROE值大于100的行。 “ ROE”是您需要替换所选行的值的列名。

选择所有ROE值大于100的行,然后将NaN值设置为列ROE中的选定行。

关于python - 使用Python替换数据框中的值,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/48848308/

10-12 02:54