我是一个非营利组织的志愿者,首席执行官想要一份存储大学教授简历的申请。简历是可以搜索的,以便可能的雇主可以找到他们。简历可以有多种格式,包括pdf或word。
该网站目前是基于joomla!,但可能会转到Drupal。无论哪种情况,开发人员都熟悉php。我熟悉php和java。
此应用程序的最佳体系结构是什么?我在考虑:
安装solr的java或php版本并链接到它
通过php,使用php solr扩展。
直接使用php版本的lucene并绕过solr。
使用search-lucene api-drupal扩展,它提供类似solr的功能。
如果我遗漏了任何可能性,请告诉我。
而且,我在亚马逊上找不到一本关于solr的好书。不过,在lucene上有一个很好的例子(in-action系列)。不幸的是,它只是简单地提到了索尔。为了更好地使用solr,读一本关于lucene的好书值得吗?还是我在浪费时间/金钱?我也找不到任何关于索尔的好书…但也许你可以推荐一本。

最佳答案

是的,索尔是个很好的搭档:
solr提供了一个名为ExtractingRequestHandler的特性,它可以让您轻松地索引word、pdf和其他专有格式。
solr是高度可配置的,当涉及到全文搜索时,您可能会得到比mysql全文搜索更好的结果。
Solr很快。mysql全文,not so much
solr启用faceted navigation
solr有两个joomla集成模块(JSolrTNR ESearch)和one for Drupal
选择solr不仅仅是为了它的性能,还在于它的特性和灵活性。
关于Solr Books,请参见:
https://stackoverflow.com/questions/343671/book-recomendation-for-solr
https://stackoverflow.com/questions/6821470/book-about-solr-for-version-3-x
关于lucene的书将帮助您理解文本是如何在引擎盖下处理的,如果您必须微调文本分析,这可能会很有用,但是我建议您从一本关于solr的书开始。

07-24 09:49
查看更多