本文介绍了在pyspark中捕获explain()的结果的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

在pyspark中,运行:

In pyspark, running:

sdf = sqlContext.sql("""SELECT * FROM t1 JOIN t2 on t1.c1 = t2.c1 """)

然后:

sdf.explain(extended=True)

它打印查询执行的逻辑和物理计划.

it prints the logical and physical plans of the query execution.

我的问题是:如何捕获输出而不是打印输出?

v = sdf.explain(extended=True)自然是行不通的

推荐答案

如果您查看 explain ,您会看到:

If you take a look at the source code of explain, you see that :

def explain(self, extended=False):
    if extended:
        print(self._jdf.queryExecution().toString())
    else:
        print(self._jdf.queryExecution().simpleString())

因此,如果要直接检索解释计划,只需在数据框上使用方法_jdf.queryExecution():

Therefore, if you want to retrieve the explain plan directly, just use the method _jdf.queryExecution() on your dataframe :

v = sdf._jdf.queryExecution().toString()  # or .simpleString()

这篇关于在pyspark中捕获explain()的结果的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!

11-02 03:28