我正在遵循this安装指南,但在使用graphframes时遇到以下问题

from pyspark import SparkContext
sc =SparkContext()
!pyspark --packages graphframes:graphframes:0.5.0-spark2.1-s_2.11
from graphframes import *

——————————————————————————————————————————————————————————————————
最后)在()
--->1来自graphframes导入*
importorror:没有名为graphframes的模块
我不确定是否可以按以下方式安装软件包。
但我会感谢你的建议和帮助。

最佳答案

好问题!
打开bashrc文件,键入export SPARK_OPTS="--packages graphframes:graphframes:0.5.0-spark2.1-s_2.11"。保存bashrc文件后,关闭它并键入source .bashrc
最后,打开笔记本并键入:

from pyspark import SparkContext
sc = SparkContext()
sc.addPyFile('/home/username/spark-2.3.0-bin-hadoop2.7/jars/graphframes-0.5.0-spark2.1-s_2.11.jar')

在那之后,你可以运行它。

关于python - 没有名为graphframes的模块Jupyter Notebook,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/50286139/

10-12 18:16