我有一个不稳定的客户,他希望在经过一些预处理后将数据从HAWQ推送到GREENPLUM。有什么办法吗?如果不是,是否可以在greenplum中创建一个外部表,以从运行HAWQ的HDFS读取该表?

任何帮助将不胜感激。

最佳答案

最简单的操作-使用外部可写表将数据从HAWQ推送到HDFS,然后使用外部可读表通过gphdfs协议(protocol)从Greenplum读取数据。我认为这将是最快的选择。

另一种选择是将数据存储在HDFS上的gzip压缩CSV文件中,并直接从HAWQ使用它们。这样,当您在Greenplum中需要此数据时,您可以用与外部表相同的方式查询它

关于hadoop - 如何将数据从HAWQ推送到GREENPLUM?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/24118174/

10-11 01:36
查看更多