我正在使用带有hadoopouchbase连接器的sqoop将一些数据从ouchbase导入到hdfs。
如中所述
http://docs.couchbase.com/hadoop-plugin-1.1/#limitations
沙发床不支持查询。
我想要一个使用hadoop连接器运行查询的解决方案。
例如:
我在db中有2个文档,如下所示:
{'doctype':'a'}
和
{'doctype':'b'}
我只需要获取属于docType = a的文档。
有没有办法做到这一点?
最佳答案
如果您想从Couchbase中选择数据,则不需要hadoop连接器...您可以只使用在doc.doctype =='a'上进行过滤的沙发床 View
参见couchbase views documentation
另一方面,我建议使用Couchbase的新N1QL query功能。它是一种非常灵活的查询语言(类似于SQL),请参见联机N1QL tutorial。
注意:如果查看要运行的N1QL具有v2.2及更高版本的兼容性,请参阅N1QL Compatibility。您将需要部署Couchbase N1QL查询服务器,并指向现有的CB v2.2集群。请参阅:Couchbase N1QL queries on server
关于hadoop - 对使用sqoop和hadoop连接器导入的Couchbase数据运行查询,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/26755849/