我需要获取Lucene中确切短语的索引。我使用这个单词的索引:

TermFreqVector termFreqVector = reader.getTermFreqVector(docId, "content");
TermPositionVector termPositionVector = (TermPositionVector) termFreqVector;
int termIndex = termFreqVector.indexOf(searcWord);


termFreqVector.indexOf(searcWord)返回一个搜索词的索引。

问题是我需要搜索一个短语,并需要获取它的索引。如果我将一个短语传递给termFreqVector,它将始终返回-1,但我100%确信该短语存在。有什么解决办法吗?

最佳答案

您需要手动进行。例如,如果您的短语是president obama,则需要找到i的所有位置president,其中偏移量i+1的术语是obama

10-02 21:50