我需要按名为“Keyword”的列分组数据帧,其中:
grouped = df.groupby('Keyword')
然后我搜索每个组的大小:
a = grouped.size()
结果如下:
Keyword
ATTORNEY 48
Appraiser 94
Attorney 1437
BASEBOARD 2
BELL PEPPER 1
BULLETIN BOARD 1
Bell Pepper 36
Bell pepper 19
Bulletin Board 20
Bulletin board 3
CANDY 765
CANDy 2
CANdy 1
... ...
我想避免区分大小写的问题,并得到一个独特的单词组,如“糖果,糖果,糖果”等,这只是不同的一些较低或较高的字符。在分组之前,我试图将此问题设置转义为
df['Keyword'].str.lower()
,但它不起作用。任何帮助都将非常感谢,谢谢。
最佳答案
作为后续工作,在进行分组时实际上不需要覆盖关键字。相反,您可以在调用groupby
grouped = df.groupby(df['Keyword'].str.lower())
作为一个例子,你可以:
df = pandas.DataFrame({'Keyword': ['Attorney', 'ATTORNEY', 'foo'], 'x' : [1, 2, 42]})
df.groupby(df['Keyword'].str.lower()).sum()
哪些输出:
x
Keyword
attorney 3
foo 42
如你所料