This question already has answers here:
When is it appropriate to use df.value_counts() vs df.groupby('…').count()?
                                
                                    (2个答案)
                                
                        
                                2年前关闭。
            
                    
这是我尝试使用group by和pandas来计算单个列的字数:

首先设置数据:

columns = ['col1','col2','col3']
data = np.array([['word1','word2','word3'] , ['word1','word5','word3'], ['word3','word7','word3']])
to_count = pd.DataFrame(data,columns=columns)


我正在尝试计算col1to_count中的单词。

to_count包含:

    col1   col2   col3
0  word1  word2  word3
1  word1  word5  word3
2  word3  word7  word3


为了计算我然后使用的单词:

print(to_count.groupby('col1').count())


显示:

col2  col3
col1
word1     2     2
word3     1     1


这似乎部分正确,因为返回了字数统计,但它们分布在多列中。如何访问单个列的字数?
我只能访问字数数据框中的单个列,但这似乎不正确。

最佳答案

如果我对您的理解正确,那么我认为这是您想要的:

print(to_count.groupby('col1')['col1'].count())


输出:

       col1
word1    2
word3    1

关于python - pandas数据帧中单列的字数,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/47597738/

10-12 20:22