我有一个看起来像这样的数据框:
df = pd.DataFrame({'A':[100,300,500,600],
'B':[100,200,300,400],
'C':[1000,2000,3000,4000],
'D':[1,4,5,6],
'E':[2,5,2,7]})
当将成对最大值应用于任意两列时,使用
maximum(df.A,df.B)
我说错了
NameError: global name 'maximum' is not defined
我的印象是,仅当使用尚未分配的变量时才会发生此错误。但是,最大功能应在numpy中工作。我知道我可以申请
df[['A','B']].apply(max)
但我担心该错误的原因。为什么抱怨没有定义保留的功能关键字?
最佳答案
您是否错过了“ np”。将numpy导入为np后,有任何机会。这是我的MacBook的输出:
>>> import numpy as np
>>> np.maximum(df.A,df.B)
0 100
1 300
2 500
3 600
Name: A, dtype: int64