在lucene索引部分,我开始使用StoredField,在此我不需要索引字段(在我为相同字段使用StringField之前)。
这基本上是为了减少一些索引空间。
我正在处理具有100万条记录的文件,但是我看不到任何性能差异。但是很快我可能不得不处理超过1亿条记录。
因此,我想知道当我使用StoredField与StringField进行比较时,性能会受到影响吗?
谢谢
香卡
最佳答案
我的猜测是,您的任务是I / O绑定的,而不是CPU绑定的,因为大多数时间都花在文档合并而不是简化的索引上(对于StringField
来说,这很便宜)。
分析可能有助于揭示此猜测是否正确。