我需要从给定的单词中分离出所有可能的后缀(大约 1000 个)。我正在考虑使用字典。
在这样做时,我会将后缀作为键(以及一些关于后缀的附加信息作为进一步过程中所需的值)。如果最长的后缀是 4 个字母,我会在 dict 中搜索所有可能的组合。
例如:
给定一个词:“abcdefg”,我会在字典中搜索“g”、“fg”、“efg”和“defg”。
我做了一些研究,但没有发现 dict 有很多类似的用法。这可能是一个可行的解决方案还是我在这里遗漏了什么?帮助很大。
最佳答案
如果后缀不太长,那么您的解决方案听起来不错——每个单词只需查找几次字典,而且字典查找速度很快。我认为这里没有任何更复杂的解决方案(例如使用特里树)值得。对于仅删除后缀,您也可以使用集合而不是字典,但由于您需要每个后缀的附加信息,字典似乎是自然的选择。
关于python - 使用字典分隔后缀,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/9806058/