我正在尝试探索Apache Drill。我不是数据分析师,而只是Infra支持人员。我看到有关Apache Drill的文档太有限

我需要有关可与Apache Drill一起使用的自定义数据存储的一些详细信息

  • 是否可以使用Apache Drill而不使用Hive来查询HDFS,就像dfs做
  • 是否可以查询旧的RDBMS,例如MySQL和Microsoft SQL

  • 提前致谢

    更新:

    我的HDFS存储防护显示错误(无效的JSON映射)
    {
      "type":"file",
      "enabled":true,
      "connection":"hdfs:///",
      "workspaces":{
        "root":{
          "location":"/",
          "writable":true,
          "storageformat":"null"
        }
      }
    }
    

    如果我将hdfs:///替换为file:///,似乎可以接受。

    我从该文件夹复制了所有库文件
    <drill-path>/jars/3rdparty to <drill-path>/jars/
    无法使其工作。请帮忙。我根本不是开发人员,我是Infra小伙。

    提前致谢

    最佳答案



    Drill根据元数据直接识别文件的架构。请参阅链接以获取更多信息-

    https://cwiki.apache.org/confluence/display/DRILL/Connecting+to+Data+Sources



    虽然有一个MapR驱动程序可让您实现相同的功能,但Drill现在本身不支持它。关于此的讨论已有很多,可能很快就会出现。

    10-08 20:20