如何访问熊猫CategoricalIndex的类别代码?

pd.Series.cat.codes是我在系列中使用的,但是该方法不适用于Index对象。目前,我先转换为系列,但这很昂贵,而且似乎是反模式。

这是一个最小的示例:

values = list('abeadc')

s = pd.Series(pd.Categorical(values, categories=list('abcde')))

print(s.cat.codes.tolist())
# [0, 1, 4, 0, 3, 2]

i = pd.CategoricalIndex(pd.Categorical(values, categories=list('abcde')))

print(i.cat.codes.tolist())
# AttributeError: 'CategoricalIndex' object has no attribute 'cat'

print(i.to_series().cat.codes.tolist())
# [0, 1, 4, 0, 3, 2]

最佳答案

您可以直接从codes访问CategoricalIndex属性:

i.codes
# array([0, 1, 4, 0, 3, 2], dtype=int8)


而且,如您的示例所示,您可以将其转换为Python列表:

i.codes.tolist()
# [0, 1, 4, 0, 3, 2]

10-05 18:33