我使用过pentaho数据集成4.4.0,并使用mongo hadoop连接器using this 成功创建了hadoop和mongo连接。然后,我安装了hive 0.11.0,并使用上述链接成功创建了hive和mongo连接。在我的mongo中包含一个数据库名称为pentaho,我以 hive 名称创建数据库为demo,并使用以下命令创建了新表名称为pentho

CREATE TABLE pentaho
(
  id INT,
  region STRING,
  year INT,
  q1 INT,
  q2 INT,
  q3 INT,
  q4 INT
)
STORED BY 'com.mongodb.hadoop.hive.MongoStorageHandler'
WITH SERDEPROPERTIES('mongo.columns.mapping'='{"id":"_id"}')
TBLPROPERTIES('mongo.uri'='mongodb://localhost:27017/pentaho.sales');

然后我在 hive 壳上写了select * from pentaho;命令,它显示了销售集合中的所有记录。
然后我在pentaho中创建了一个模型,使用hadoop hive数据源将host设置为localhost,将数据库名称设置为demo,将port设置为10000,然后单击test,然后显示弹出式连接成功。但是,当我单击“确定”时,新出现的弹出式窗口选项(例如“架构”,“表”,“ View ”,“同义词”)将在表中不包含我在 hive 中创建的任何表。那么如何在pentaho数据源中访问配置单元表呢?

最佳答案

在找到我想念的地方之后,我在本地hadoop conf / mapred-site.xml文件中设置了端口,将端口设置为localhost:9001,并且在启动双服务器时,将同一端口用于hsql。然后在更改除9001之外的mapred-site.xml端口后,它可以正常工作。 :)

关于mongodb - 如何在pentaho中访问配置单元表,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/22147282/

10-12 23:45