我需要按名为“Keyword”的列分组数据帧,其中:

grouped = df.groupby('Keyword')

然后我搜索每个组的大小:
a = grouped.size()

结果如下:
Keyword
ATTORNEY            48
Appraiser           94
Attorney          1437
BASEBOARD            2
BELL PEPPER          1
BULLETIN BOARD       1
Bell Pepper         36
Bell pepper         19
Bulletin Board      20
Bulletin board       3
CANDY              765
CANDy                2
CANdy                1
...                ...

我想避免区分大小写的问题,并得到一个独特的单词组,如“糖果,糖果,糖果”等,这只是不同的一些较低或较高的字符。在分组之前,我试图将此问题设置转义为df['Keyword'].str.lower(),但它不起作用。
任何帮助都将非常感谢,谢谢。

最佳答案

作为后续工作,在进行分组时实际上不需要覆盖关键字。相反,您可以在调用groupby

grouped = df.groupby(df['Keyword'].str.lower())

作为一个例子,你可以:
df = pandas.DataFrame({'Keyword': ['Attorney', 'ATTORNEY', 'foo'], 'x' : [1, 2, 42]})

df.groupby(df['Keyword'].str.lower()).sum()

哪些输出:
           x
Keyword
attorney   3
foo       42

如你所料

10-05 18:50
查看更多