为了在python中拆分单词,我使用了wordegment库,该库具有内置的词典,基于该词典可以拆分单词。有人可以让我知道如何在词典中添加更多单词吗?代码如下:

import wordsegment as ws
from wordsegment import load, segment
from wordsegment import segment
help(wordsegment)
load()
segment("rollersharp")
['roller', 'sharp']


该词典来自以下链接:
https://github.com/grantjenks/python-wordsegment/tree/master/wordsegment

最佳答案

official docs很好地涵盖了自定义词典的用法。

要扩展现有语料库,您需要更新wordsegment.UNIGRAMSwordsegment.BIGRAMS

09-27 10:11