我在Hadoop(HDFS)中拥有大量数据。如何将SpagoBI与HDFS连接以配置数据源。在SpagoBI中,“添加数据源”页面上的“方言”下拉菜单中找不到HDFS存储的任何选项。
有没有办法在SpagoBI中使用HDFS数据?
最佳答案
您可以将SpagoBI连接到Hive表。
因此,如果您的数据是结构化的,则首先将所有数据传输到配置单元表中,或者只是在数据之上创建配置单元外部表。
然后通过HiveServer2驱动程序可以连接。
您必须手动将配置单元jdbc jar和其他常见的jar文件放在spagoBI lib目录中。
您的spagoBI连接属性应如下所示:
提供与以下配置单元连接的凭据:-
网址:jdbc:hive2:// localhost:10000 / xyz
驱动程序:org.apache.hive.jdbc.HiveDriver