这是我在数据帧“df”中的数据:

Document    Name    Time
SPS2315511  A   1 HOUR
SPS2315512  B   1 - 2 HOUR
SPS2315513  C   2 - 3 HOUR
SPS2315514  C   1 HOUR
SPS2315515  B   1 HOUR
SPS2315516  A   2 - 3 HOUR
SPS2315517  A   1 - 2 HOUR

我正在使用下面的代码,它为我提供了数据透视表中的计数摘要,
table = pivot_table(df, values=["Document"],
                    index=["Name"], columns=["Time"],
                    aggfunc=lambda x: len(x),
                    margins=True, dropna=True)

但我想要的是当您右键单击数据透视表并选择“将值显示为 -> 行总数的百分比”时,在 excel 数据透视表中的行计算百分比。由于我的 Document 是一个非数字值,我无法获得它。

预期结果 :
Count of Document   Column Labels

Name    1 HOUR  1 - 2 HOUR  2 - 3 HOUR  Grand Total
A   33.33%  33.33%  33.33%  100.00%
B   50.00%  50.00%  0.00%   100.00%
C   50.00%  0.00%   50.00%  100.00%
Grand Total 42.86%  28.57%  28.57%  100.00%

任何人都可以帮我找出一种方法来获得这个结果吗?

我正在尝试操纵数据透视数据,它会给我行总数,而不是来自数据帧的数据,我想要的是“行总数的百分比”。而且最重要的是我所有的数据都是非数字值......

最佳答案

@maxymoo指出的可能重复项非常接近解决方案,但是我会继续写它作为答案,因为存在一些并非完全简单的区别。

table = pd.pivot_table(df, values=["Document"],
                       index=["Name"], columns=["Time"],
                       aggfunc=len, margins=True,
                       dropna=True, fill_value=0)

       Document
Time 1 - 2 HOUR 1 HOUR 2 - 3 HOUR All
Name
A             1      1          1   3
B             1      1          0   2
C             0      1          1   2
All           2      3          2   7

那里的主要调整是添加 fill_value=0,因为您真正想要的是计数值为零,而不是 NaN。

然后您基本上可以使用链接到的解决方案@maxymoo,但是您需要使用 iloc 或类似的 b/c 表列现在有点复杂(作为数据透视表的多索引结果)。
table2 = table.div( table.iloc[:,-1], axis=0 )

       Document
Time 1 - 2 HOUR    1 HOUR 2 - 3 HOUR All
Name
A      0.333333  0.333333   0.333333   1
B      0.500000  0.500000   0.000000   1
C      0.000000  0.500000   0.500000   1
All    0.285714  0.428571   0.285714   1

您仍然需要执行一些次要的格式化工作(翻转第一列和第二列并转换为%),但这是您要查找的数字。

顺便说一句,这里没有必要,但您可能想考虑将“时间”转换为有序分类变量,这将是解决列排序问题的一种方法(我认为),但可能值得也可能不值得打扰关于您对数据的其他处理。

关于python - Pandas Pivot_Table : Percentage of row calculation for non-numeric values,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/31064752/

10-09 17:16