德鲁伊用于实时和批处理。但是,它可以完全取代hadoop吗?
如果不是,为什么呢?就像hadoop相比druid有什么优势?
我读过德鲁伊与hadoop一起使用。那么可以避免使用Hadoop吗?

最佳答案

我们在这里谈论的是两种稍微相关但又非常不同的技术。

Druid是一个实时分析系统,非常适合时间序列和基于时间的事件聚合。

Hadoop是HDFS(分布式文件系统)+ Map Reduce(用于执行分布式过程的范例),它们共同创建了一个用于分布式处理的生态系统,并充当许多其他开源项目的基础/影响技术。

您可以将druid设置为使用Hadoop。这将触发MR作业以索引批处理数据并从HDFS读取其索引数据(当然,它将在本地磁盘上本地缓存它们)

如果您想忽略Hadoop,当然也可以从本地计算机上进行索引和加载,但是这样做的代价是仅限于一台计算机。

10-02 07:28
查看更多