我需要实现一个字符串匹配算法来确定哪些字符串最接近匹配。我认为当这个固定长度是可以得到的时候,汉明距离是一个很好的匹配算法。
如果我改用levenshtein距离公式,在匹配质量上有什么优势吗?我知道这种方法效率较低,因为它考虑了可变长度字符串,但我真正关心的是匹配的质量另外,有没有更好的算法我可能要考虑?如果这有什么区别的话,我在java工作。
http://en.wikipedia.org/wiki/Levenshtein_distance
http://en.wikipedia.org/wiki/Hamming_distance
非常感谢

最佳答案

考虑字符串:“abcdefg”和“bcdefgh”。
Levenshtein距离是2。汉明距离(操作字符而不是位)是7。
所以这真的取决于你是否想把这些字符串看作是相似的。哈明距离有其适当的用途,但“这些弦看起来像人类吗?”不是其中之一。

10-02 02:43
查看更多