我在stackoverflow上尝试了一些可用的解决方案,但仍然无法解决问题。因为我刚开始编程,这可能是一个简单的解决方案。
情况:
当前正在处理名为“dataset”的Pandas数据帧,该数据帧包含zscore列。我想确定高于3.00的单元格,以便将zscore的值设置为3.00。另一方面,我希望将-3.00以下zscore中的值更改为-3.00。
代码:

maxzscore = 3.00
minzscore = -3.00

print ('Set the max zscore:', maxzscore)
print ('Set the min zscore:', minzscore)

for value in dataset.zscore:
    # identify zscore above maxzscore
    if value > maxzscore:
        (dataset['zscore'].replace(3.00))
    # identify zscore below minzscore
    elif (dataset['zscore'] < minzscore):
        (dataset['zscore'].replace(-3.00))
    # do nothing
    else:
        pass

   dataset.to_excel('dataset.xls')

问题是:
代码在数据中循环了一段无休止的时间,这不是很有效。因此我想知道如何缩短处理时间和改进代码。
非常感谢你的帮助。

最佳答案

不需要循环。。只需使用clip()方法:

   dataset['zscore'] = dataset['zscore'].clip(-3.0, 3.0)

10-06 12:43