我需要根据某些规则搜索泰米尔语文档,我才能使用LUcene搜索。它会支持泰米尔语吗?

最佳答案

虽然我对Tamil并不是很熟悉,但据我了解,StandardAnalyzer应该很好地支持它。它是多语言的,并且实现了UAX #29,它应该为所有印度语提供良好的文本分割和规范化。

尽管org.apache.lucene.analysis.in中可能包含一些有用的组件,但我不知道任何提供泰米尔语的特定分析软件包。

10-07 20:39