我有一个从数据透视表创建的数据框,看起来与此类似:
import pandas as pd
d = {('company1', 'False Negative'): {'April- 2012': 112.0, 'April- 2013': 370.0, 'April- 2014': 499.0, 'August- 2012': 431.0, 'August- 2013': 496.0, 'August- 2014': 221.0},
('company1', 'False Positive'): {'April- 2012': 0.0, 'April- 2013': 544.0, 'April- 2014': 50.0, 'August- 2012': 0.0, 'August- 2013': 0.0, 'August- 2014': 426.0},
('company1', 'True Positive'): {'April- 2012': 0.0, 'April- 2013': 140.0, 'April- 2014': 24.0, 'August- 2012': 0.0, 'August- 2013': 0.0,'August- 2014': 77.0},
('company2', 'False Negative'): {'April- 2012': 112.0, 'April- 2013': 370.0, 'April- 2014': 499.0, 'August- 2012': 431.0, 'August- 2013': 496.0, 'August- 2014': 221.0},
('company2', 'False Positive'): {'April- 2012': 0.0, 'April- 2013': 544.0, 'April- 2014': 50.0, 'August- 2012': 0.0, 'August- 2013': 0.0, 'August- 2014': 426.0},
('company2', 'True Positive'): {'April- 2012': 0.0, 'April- 2013': 140.0, 'April- 2014': 24.0, 'August- 2012': 0.0, 'August- 2013': 0.0,'August- 2014': 77.0},}
df = pd.DataFrame(d)
company1 company2
FN FP TP FN FP TP
April- 2012 112 0 0 112 0 0
April- 2013 370 544 140 370 544 140
April- 2014 499 50 24 499 50 24
August- 2012 431 0 0 431 0 0
August- 2013 496 0 0 496 0 0
August- 2014 221 426 77 221 426 77
我正在迭代遍历multiindex列的上层,以将每个公司除以总和来创建一个百分比:
company1 company2
FN FP TP FN FP TP
April- 2012 1 0 0 1 0 0
April- 2013 .35 .51 .13 .35 .51 .13
April- 2014 .87 .09 .03 .87 .09 .03
etc.
我事先不知道公司名称。这是昨天提出的一个问题的一种变体:Summing multiple columns with multiindex columns
最佳答案
您可以使用div
方法除以总和(可以指定要匹配的级别):
df.div(df.sum(axis=1, level=0), level=0)
关于python - 将多索引列按总和除以创建百分比,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/25530818/