我有一个包含十列和一千多行数据的数据框。我正在遍历每个标头并计算两个标头之间的差。这将导致数据帧为一列N行。然后,我想根据某些条件运行统计信息。例如给我统计一组大于零的数据。
所以样本是这样的。

TempDF = df[Header] - df[SecondHeader]
    if (TempDF.median()>TempDF.mean()):
        print (df(TempDF[]>0).describe())


这将生成一个Key Error : True,并且不会显示任何内容。.请帮助。

我想知道如何做到这一点。谢谢。

最佳答案

您没有正确过滤Series对象。这是一个如何做的例子:

from pandas import DataFrame
df = DataFrame([[1111,22,33],[140,25,36],[47,58,69]])
df.columns=['Header','SecondHeader','ThirdHeader']

TempDF = df['Header'] - df['SecondHeader']

if TempDF.median() < TempDF.mean():
    print TempDF[TempDF>0].describe()

10-08 11:12