我有一个奇怪的问题。

什么是hadoop 的一些分布式和可伸缩的替代方案。我正在寻找一些分布式文件系统,例如 HDFS ,它可以用作便宜有效的存储,并希望在其上具有数据处理引擎(批处理/实时)。我知道Spark可以是一个很好的选择。但是我想将此系统用作分布式,容错和可扩展的文件存档。是否有合适的解决方案?欢迎提出建议。谢谢 :)

最佳答案

这些是Hadoop和Apache Spark的其他替代方案。 Cluster Map Reduce,Hydra和结论,它们对于大数据项目都相对较好。在这里阅读更多
https://datafloq.com/read/Big-Data-Hadoop-Alternatives/1135

关于hadoop - Hadoop的分布式替代品,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/38988567/

10-14 19:06
查看更多