在lucene索引部分,我开始使用StoredField,在此我不需要索引字段(在我为相同字段使用StringField之前)。

这基本上是为了减少一些索引空间。

我正在处理具有100万条记录的文件,但是我看不到任何性能差异。但是很快我可能不得不处理超过1亿条记录。

因此,我想知道当我使用StoredField与StringField进行比较时,性能会受到影响吗?

谢谢
香卡

最佳答案

我的猜测是,您的任务是I / O绑定的,而不是CPU绑定的,因为大多数时间都花在文档合并而不是简化的索引上(对于StringField来说,这很便宜)。

分析可能有助于揭示此猜测是否正确。

07-26 05:01