如何访问熊猫CategoricalIndex
的类别代码?pd.Series.cat.codes
是我在系列中使用的,但是该方法不适用于Index
对象。目前,我先转换为系列,但这很昂贵,而且似乎是反模式。
这是一个最小的示例:
values = list('abeadc')
s = pd.Series(pd.Categorical(values, categories=list('abcde')))
print(s.cat.codes.tolist())
# [0, 1, 4, 0, 3, 2]
i = pd.CategoricalIndex(pd.Categorical(values, categories=list('abcde')))
print(i.cat.codes.tolist())
# AttributeError: 'CategoricalIndex' object has no attribute 'cat'
print(i.to_series().cat.codes.tolist())
# [0, 1, 4, 0, 3, 2]
最佳答案
您可以直接从codes
访问CategoricalIndex
属性:
i.codes
# array([0, 1, 4, 0, 3, 2], dtype=int8)
而且,如您的示例所示,您可以将其转换为Python列表:
i.codes.tolist()
# [0, 1, 4, 0, 3, 2]