我想从古腾堡(Gutenberg)在线获取英文文本中的难词,以便使用python或javascript构建词汇。我不会得到简单的单词,但会得到诸如regal,apcryphal..etc等独特的词汇。

如何确保在拆分文本时仅获得唯一的词汇而不是简单的单词。

最佳答案

正如@Hoog所建议的,这是伪代码:

simple_words = [...]
difficult_words = [word for word in english_vocabulary if word not in simple_words]

关于javascript - 使用python或javascript从文本中找出困难的英语单词以建立词汇,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/54710198/

10-12 05:44