我正在尝试编写一个简单的spark应用程序,当我在本地运行它时,可以将master设置为
.master("local[2]")
但是在AWS(EMR)上配置Spark集群后,我无法连接到主URL:
.master("spark://<master url>:7077")
这是这样做的方式吗?我在这里想念什么吗?
集群已启动并正在运行,当我尝试将我的应用程序添加为步骤jar时,它将直接在它正常工作的集群中运行。但我希望能够从远程计算机上运行它。
希望在这里有所帮助,
谢谢
最佳答案
要从远程计算机运行,您需要在分配给EMR主节点的安全组中打开相应的端口。您至少需要添加7077。
如果“远程”是指不在您的AWS环境中的那个,那么您还需要设置一种将流量从外部路由到它的方法。
关于java - 如何配置连接到AWS EMR Spark集群的Java客户端,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/40405282/