我知道这可能是一个愚蠢的问题,但我被困住了:
df=[column names such as "Water", "Soil", "Fire"]
report=[]
def area():
for i, col in enumerate(df.columns):
max_col(i)= df[col].max()
min_col(i)= df[col].min()
balance(i)= max_col(i) + min_col(i)
print(-------,col,------) # column name
print(max_col(i))
print(min_col(i))
print(balance_col(i))
return pd.DataFrame(report)
我收到此错误:
SyntaxError: can't assign to function call
我想分别为每列
display(print)
计算值,并通过新的df返回结果。非常感谢 最佳答案
您可以使用字典存储min_col
,max_col
和balance
的值,每个值都键入列名称。然后将结果合并到result
数据框中。
def area(df):
min_col = {}
max_col = {}
balance = {}
for col in df:
max_col[col]= df[col].max()
min_col[col]= df[col].min()
balance[col]= max_col[col] + min_col[col]
result = pd.DataFrame([min_col, max_col, balance], index=['min', 'max', 'balance'])
return result
np.random.seed(0)
df = pd.DataFrame(np.random.randn(5, 3), columns=list('ABC'))
>>> df
A B C
0 1.764052 0.400157 0.978738
1 2.240893 1.867558 -0.977278
2 0.950088 -0.151357 -0.103219
3 0.410599 0.144044 1.454274
4 0.761038 0.121675 0.443863
>>> area(df)
A B C
min 0.410599 -0.151357 -0.977278
max 2.240893 1.867558 1.454274
balance 2.651492 1.716201 0.476996
您可以通过以下方法获得相同的结果:
df.apply(lambda s: pd.Series([s.min(), s.max(), s.max() + s.min()],
index=['min', 'max', 'balance'])
)