我有一个包含十列和一千多行数据的数据框。我正在遍历每个标头并计算两个标头之间的差。这将导致数据帧为一列N行。然后,我想根据某些条件运行统计信息。例如给我统计一组大于零的数据。
所以样本是这样的。
TempDF = df[Header] - df[SecondHeader]
if (TempDF.median()>TempDF.mean()):
print (df(TempDF[]>0).describe())
这将生成一个
Key Error : True
,并且不会显示任何内容。.请帮助。我想知道如何做到这一点。谢谢。
最佳答案
您没有正确过滤Series对象。这是一个如何做的例子:
from pandas import DataFrame
df = DataFrame([[1111,22,33],[140,25,36],[47,58,69]])
df.columns=['Header','SecondHeader','ThirdHeader']
TempDF = df['Header'] - df['SecondHeader']
if TempDF.median() < TempDF.mean():
print TempDF[TempDF>0].describe()