本文介绍了&是什么QUOT;阶段跳过" Apache中的星火web用户界面是什么意思?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
从我星火UI。这是什么被忽略呢?
From my Spark UI. What does it mean by skipped?
推荐答案
通常,它意味着数据已经从缓存中提取,没有必要再执行特定阶段。这是您的DAG一致表示,下一阶段需要改组( reduceByKey
)。每当有href=\"https://spark.apache.org/docs/1.5.0/programming-guide.html#performance-impact\">自动洗牌参与星火的:
Typically it means that data has been fetched from cache and there was no need to re-execute given stage. It is consistent with your DAG which shows that the next stage requires shuffling (reduceByKey
). Whenever there is shuffling involved Spark automatically caches generated data:
洗牌也产生了大量的磁盘上的中间文件。由于星火1.3,这些文件是preserved直到相应的RDDS不再使用,而且垃圾收集。这样做是为了洗牌文件不需要被重新创建如果谱系重新计算。
这篇关于&是什么QUOT;阶段跳过" Apache中的星火web用户界面是什么意思?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!