Whoosh 是一个快速、功能强大的全文索引和搜索库,用纯 Python ( official website ) 实现。
但是我找不到与其他搜索引擎的速度/性能比较,尤其是基于 Lucene 的(pyLucene、Lupyne...)?
我习惯使用 pyLucene,它以快速但非常非 Pythonic 且不易处理(直接 java-Lucene 包装器)而著称。 pyLucene 有一个 pythonic 包装器;卢平。然而,当需要 Lucene 的核心特性时,这并不方便。
Whoosh 和其他人之间的任何性能提示将不胜感激。
最佳答案
{1} Whoosh vs Xappy/Xapian
Whoosh 和 Xappy/Xapian here 支持测试 Python 搜索的基准。
Whoosh 作者使用这些基准测试了 whoosh 与 Xappy/Xapian (ref) 的对比:
基准测试的工作原理
索引大小约 12MB
# Phenom II X4 840, 8GB RAM, HDD
# Python 2.7.2+ (default, Oct 4 2011, 20:06:09)
# [GCC 4.6.1] on linux2
Params:
DOC_COUNT: 3000 WORD_LEN: 10
EXTRA_FIELD_COUNT: 10 EXTRA_FIELD_LEN: 100
Benchmarking: xappy 0.5 / xapian 1.2.5
Indexing takes 2.8s (1068.9/s)
Searching takes 0.5s (6635.8/s)
Benchmarking: whoosh 2.3.2
Indexing takes 0.8s (3575.6/s)
Searching takes 0.8s (3714.8/s)
关于python - Whoosh 有多快?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/29102906/