本文介绍了Java中的模糊字符串搜索库的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我正在寻找一个用于模糊字符串搜索的高性能Java库。

I'm looking for a high performance Java library for fuzzy string search.

有许多算法可以找到相似的字符串,Levenshtein距离,Daitch-Mokotoff Soundex, n-gram等。

There are numerous algorithms to find similar strings, Levenshtein distance, Daitch-Mokotoff Soundex, n-grams etc.

存在哪些Java实现?他们的利弊?我知道Lucene,任何其他解决方案或Lucene最好吗?

What Java implementations exists? Pros and cons for them? I'm aware of Lucene, any other solution or Lucene is best?

我发现这些,有没有人有过这方面的经验?

I found these, does anyone have experience with them?




  • SimMetrics
  • NGramJ

推荐答案

Commons Lang实现了。

Commons Lang has an implementation of Levenshtein distance.

Commons Codec实现了和。

Commons Codec has an implementation of soundex and metaphone.

这篇关于Java中的模糊字符串搜索库的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!

08-21 05:36