在python 3.5jupyter环境中运行以下内容时,我得到了下面的错误。你知道是什么引起的吗?

import findspark
findspark.init()

错误:
IndexError                                Traceback (most recent call
last) <ipython-input-20-2ad2c7679ebc> in <module>()
      1 import findspark
----> 2 findspark.init()
      3
      4 import pyspark

/.../anaconda/envs/pyspark/lib/python3.5/site-packages/findspark.py in init(spark_home, python_path, edit_rc, edit_profile)
    132     # add pyspark to sys.path
    133     spark_python = os.path.join(spark_home, 'python')
--> 134     py4j = glob(os.path.join(spark_python, 'lib', 'py4j-*.zip'))[0]
    135     sys.path[:0] = [spark_python, py4j]
    136

IndexError: list index out of range

最佳答案

这很可能是由于系统上的SPARK_HOME环境变量设置不正确。或者,您也可以在初始化时指定它,如下所示:

import findspark
findspark.init('/path/to/spark/home')

之后,一切都会好起来的!

10-07 18:52