我在stackoverflow上尝试了一些可用的解决方案,但仍然无法解决问题。因为我刚开始编程,这可能是一个简单的解决方案。
情况:
当前正在处理名为“dataset”的Pandas数据帧,该数据帧包含zscore列。我想确定高于3.00的单元格,以便将zscore的值设置为3.00。另一方面,我希望将-3.00以下zscore中的值更改为-3.00。
代码:
maxzscore = 3.00
minzscore = -3.00
print ('Set the max zscore:', maxzscore)
print ('Set the min zscore:', minzscore)
for value in dataset.zscore:
# identify zscore above maxzscore
if value > maxzscore:
(dataset['zscore'].replace(3.00))
# identify zscore below minzscore
elif (dataset['zscore'] < minzscore):
(dataset['zscore'].replace(-3.00))
# do nothing
else:
pass
dataset.to_excel('dataset.xls')
问题是:
代码在数据中循环了一段无休止的时间,这不是很有效。因此我想知道如何缩短处理时间和改进代码。
非常感谢你的帮助。
最佳答案
不需要循环。。只需使用clip()
方法:
dataset['zscore'] = dataset['zscore'].clip(-3.0, 3.0)