jieba模块包的使用
import jieba
txt = '中国是世界四大文明古国之一,有着悠久的历史,距今约5000年前,以中原地区为中心开始出现聚落组织进而形成国家,后历经多次民族交融和朝代更迭,直至形成多民族国家的大一统局面。20世纪初辛亥革命后,君主政体退出历史舞台,共和政体建立。1949年中华人民共和国成立后,在中国大陆建立了人民代表大会制度的政体。'
# res = jieba.cut(txt)
# for i in res:
# print(i)
# 或者
# res = jieba.lcut(txt) # 精确模式
# print(res)
res = jieba.lcut(txt,cut_all = True) # 全模式
print(res)
res = jieba.lcut_for_search(txt) # 搜索模式
print(res)
例子:
import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt
from imageio import imread
f = open('十九大报告.txt',encoding='utf-8')
data = f.read()
res = jieba.lcut(data)
result = "".join(res)
color_mask = imread('车.jpg')
wc = WordCloud(font_path='C:\Windows\Fonts\方正粗黑宋简体.ttf',
width=1080,
height=960,
mask=color_mask,
background_color='red'
)
wc.generate(result)
wc.to_file('小康社会.png')
plt.imshow(wc)
plt.show()