我知道这可能是一个愚蠢的问题,但我被困住了:

df=[column names such as "Water", "Soil", "Fire"]
report=[]

def area():
   for i, col in enumerate(df.columns):
       max_col(i)= df[col].max()
       min_col(i)= df[col].min()
       balance(i)= max_col(i) + min_col(i)

       print(-------,col,------) # column name
       print(max_col(i))
       print(min_col(i))
       print(balance_col(i))

   return pd.DataFrame(report)


我收到此错误:SyntaxError: can't assign to function call
我想分别为每列display(print)计算值,并通过新的df返回结果。非常感谢

最佳答案

您可以使用字典存储min_colmax_colbalance的值,每个值都键入列名称。然后将结果合并到result数据框中。

def area(df):
    min_col = {}
    max_col = {}
    balance = {}
    for col in df:
        max_col[col]= df[col].max()
        min_col[col]= df[col].min()
        balance[col]= max_col[col] + min_col[col]

    result = pd.DataFrame([min_col, max_col, balance], index=['min', 'max', 'balance'])
    return result

np.random.seed(0)
df = pd.DataFrame(np.random.randn(5, 3), columns=list('ABC'))
>>> df
          A         B         C
0  1.764052  0.400157  0.978738
1  2.240893  1.867558 -0.977278
2  0.950088 -0.151357 -0.103219
3  0.410599  0.144044  1.454274
4  0.761038  0.121675  0.443863

>>> area(df)
                A         B         C
min      0.410599 -0.151357 -0.977278
max      2.240893  1.867558  1.454274
balance  2.651492  1.716201  0.476996


您可以通过以下方法获得相同的结果:

df.apply(lambda s: pd.Series([s.min(), s.max(), s.max() + s.min()],
                              index=['min', 'max', 'balance'])
)

10-06 13:07