有人可以强调技术细节以及何时使用它。
最佳答案
在当前的HDFS(0.23.3)实现中,hflush
和hsync
是相同的。 hsync调用hflush
。 hflush
保证刷新的数据对新读者可见。不保证数据已刷新到datanode上的持久性存储。因此,如果datanode发生故障,使用hflush
可能会丢失一些数据。 hsync
旨在确保所有数据都写入磁盘设备,但现在尚未实现而不是。
在Alpha HDFS 2.0。*中,正确实现了hsync。
您可以在HBase, HDFS and durable sync中获得更多详细信息。
关于api - HDFS中的hflush和hsync API之间的差异,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/10121705/