为了在python中拆分单词,我使用了wordegment库,该库具有内置的词典,基于该词典可以拆分单词。有人可以让我知道如何在词典中添加更多单词吗?代码如下:
import wordsegment as ws
from wordsegment import load, segment
from wordsegment import segment
help(wordsegment)
load()
segment("rollersharp")
['roller', 'sharp']
该词典来自以下链接:
https://github.com/grantjenks/python-wordsegment/tree/master/wordsegment
最佳答案
official docs很好地涵盖了自定义词典的用法。
要扩展现有语料库,您需要更新wordsegment.UNIGRAMS
和wordsegment.BIGRAMS