NLPIR分词系统前身为2000年发布的ICTCLAS词法分析系统,从2009年开始,为了和以前工作进行大的区隔,并推广NLPIR自然语言处理与信息检索共享平台,调整命名为NLPIR分词系统。
其主要的功能有中文分词,标注词性和获取句中的关键词。
主要用到的函数有两个: pynlpir.segments], '\t', segment[1])
key_words = pynlpir.get_key_words(s, weighted=True)
for key_word in key_words:
print (key_word[0], '\t', key_word[1])
pynlpir.close()