我需要获取Lucene中确切短语的索引。我使用这个单词的索引:
TermFreqVector termFreqVector = reader.getTermFreqVector(docId, "content");
TermPositionVector termPositionVector = (TermPositionVector) termFreqVector;
int termIndex = termFreqVector.indexOf(searcWord);
该
termFreqVector.indexOf(searcWord)
返回一个搜索词的索引。问题是我需要搜索一个短语,并需要获取它的索引。如果我将一个短语传递给termFreqVector,它将始终返回
-1
,但我100%确信该短语存在。有什么解决办法吗? 最佳答案
您需要手动进行。例如,如果您的短语是president obama
,则需要找到i
的所有位置president
,其中偏移量i+1
的术语是obama
。