我正在从cloudera经理那里收到这些警报。 Journal_NODE_FSYNC_LATENCY的运行状况测试结果已引起关注:前一分钟的第99个百分点的fsync延迟为2.3秒。警告阈值:1秒。

我检查了cloudera文档,发现1秒是警告,3秒是关键。此问题的原因是什么,如何解决呢?

最佳答案



这是一个JournalNode运行状况测试,用于检查JournalNode的fsync延迟。如果前一分钟的第99个百分点的fsync延迟高于配置的阈值,则此测试将返回“不良”运行状况。 fsync性能差可能表示磁盘损坏或过载(即JournalNode与NameNode和DataNode共享同一磁盘。)并且会对NameNode执行的HDFS元数据操作的性能产生负面影响。

关于hadoop - hdfs Journal节点提供警报 “fsync latency concerning”,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/35025934/

10-16 01:11