本文介绍了Java中的模糊字符串搜索库的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我正在寻找一个用于模糊字符串搜索的高性能Java库。
I'm looking for a high performance Java library for fuzzy string search.
有许多算法可以找到相似的字符串,Levenshtein距离,Daitch-Mokotoff Soundex, n-gram等。
There are numerous algorithms to find similar strings, Levenshtein distance, Daitch-Mokotoff Soundex, n-grams etc.
存在哪些Java实现?他们的利弊?我知道Lucene,任何其他解决方案或Lucene最好吗?
What Java implementations exists? Pros and cons for them? I'm aware of Lucene, any other solution or Lucene is best?
我发现这些,有没有人有过这方面的经验?
I found these, does anyone have experience with them?
- SimMetrics
- NGramJ
推荐答案
Commons Lang实现了。
Commons Lang has an implementation of Levenshtein distance.
Commons Codec实现了和。
Commons Codec has an implementation of soundex and metaphone.
这篇关于Java中的模糊字符串搜索库的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!