我想从古腾堡(Gutenberg)在线获取英文文本中的难词,以便使用python或javascript构建词汇。我不会得到简单的单词,但会得到诸如regal,apcryphal..etc等独特的词汇。
如何确保在拆分文本时仅获得唯一的词汇而不是简单的单词。
最佳答案
正如@Hoog所建议的,这是伪代码:
simple_words = [...]
difficult_words = [word for word in english_vocabulary if word not in simple_words]
关于javascript - 使用python或javascript从文本中找出困难的英语单词以建立词汇,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/54710198/