我正在使用带有hadoopouchbase连接器的sqoop将一些数据从ouchbase导入到hdfs。

如中所述
http://docs.couchbase.com/hadoop-plugin-1.1/#limitations
沙发床不支持查询。

我想要一个使用hadoop连接器运行查询的解决方案。

例如:
我在db中有2个文档,如下所示:

{'doctype':'a'}



{'doctype':'b'}

我只需要获取属于docType = a的文档。

有没有办法做到这一点?

最佳答案

如果您想从Couchbase中选择数据,则不需要hadoop连接器...您可以只使用在doc.doctype =='a'上进行过滤的沙发床 View
参见couchbase views documentation

另一方面,我建议使用Couchbase的新N1QL query功能。它是一种非常灵活的查询语言(类似于SQL),请参见联机N1QL tutorial

注意:如果查看要运行的N1QL具有v2.2及更高版本的兼容性,请参阅N1QL Compatibility。您将需要部署Couchbase N1QL查询服务器,并指向现有的CB v2.2集群。请参阅:Couchbase N1QL queries on server

关于hadoop - 对使用sqoop和hadoop连接器导入的Couchbase数据运行查询,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/26755849/

10-13 02:50