This question already has answers here:
When is it appropriate to use df.value_counts() vs df.groupby('…').count()?
(2个答案)
2年前关闭。
这是我尝试使用
首先设置数据:
我正在尝试计算
为了计算我然后使用的单词:
显示:
这似乎部分正确,因为返回了字数统计,但它们分布在多列中。如何访问单个列的字数?
我只能访问字数数据框中的单个列,但这似乎不正确。
输出:
(2个答案)
2年前关闭。
这是我尝试使用
group by
和pandas来计算单个列的字数:首先设置数据:
columns = ['col1','col2','col3']
data = np.array([['word1','word2','word3'] , ['word1','word5','word3'], ['word3','word7','word3']])
to_count = pd.DataFrame(data,columns=columns)
我正在尝试计算
col1
中to_count
中的单词。to_count
包含: col1 col2 col3
0 word1 word2 word3
1 word1 word5 word3
2 word3 word7 word3
为了计算我然后使用的单词:
print(to_count.groupby('col1').count())
显示:
col2 col3
col1
word1 2 2
word3 1 1
这似乎部分正确,因为返回了字数统计,但它们分布在多列中。如何访问单个列的字数?
我只能访问字数数据框中的单个列,但这似乎不正确。
最佳答案
如果我对您的理解正确,那么我认为这是您想要的:
print(to_count.groupby('col1')['col1'].count())
输出:
col1
word1 2
word3 1
关于python - pandas数据帧中单列的字数,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/47597738/
10-12 20:22