有人能告诉我如何解决下面提到的问题吗?

我有大量存储在 HDFS 中的文本文件。我的客户端应用程序需要查找特定搜索词的相关文件。我想知道是否可以使用 Apache Solr。任何帮助是极大的赞赏。

谢谢,
阿伦

最佳答案

我认为您需要考虑的第一个问题是搜索是实时的(索引会经常更新)还是不那么频繁。如果是前者,那么我强烈建议您使用 Elastic Search。而且,不要仅仅依赖我的建议。这个问题对 Elastic Search vs Solr 辩论有一些很好的答案。

Solr vs. ElasticSearch

而且,至于您关于在 Apache Solr 中使用 hadoop 的问题,这里有一些我在互联网上找到的有用链接

http://www.likethecolor.com/2010/09/26/using-hadoop-to-create-solr-indexes

http://architects.dzone.com/articles/solr-hadoop-big-data-love

关于search - 在 hadoop 中索引和搜索,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/11954904/

10-17 03:09