本文介绍了jupyter笔记本NameError:未定义名称'sc'的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我使用了jupyter笔记本pyspark,然后,我的第一个命令是:

I used the jupyter notebook, pyspark, then, my first command was:

rdd = sc.parallelize([2, 3, 4])

然后,它表明

NameError Traceback (most recent call last)
<ipython-input-1-c540c4a1d203> in <module>()
----> 1 rdd = sc.parallelize([2, 3, 4])

NameError: name 'sc' is not defined.

如何解决此错误'sc'未定义.

How to fix this error 'sc' is not defined.

推荐答案

您是否初始化了SparkContext?

您可以尝试以下方法:

#Initializing PySpark
from pyspark import SparkContext, SparkConf

# #Spark Config
conf = SparkConf().setAppName("sample_app")
sc = SparkContext(conf=conf)

这篇关于jupyter笔记本NameError:未定义名称'sc'的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!

10-12 16:26