我正在尝试建立一个Apache Samza和Kafka环境。尝试运行模块时遇到一些问题。

我的Kafka工作正常,但无法使Samza工作。我已经安装了两个Debian Jeesy AMD64盒子,并按照Samza文档中的说明进行操作:

apt-get install openjdk-7-jdk openjdk-7-jre git maven
git clone http://git-wip-us.apache.org/repos/asf/samza.git
cd samza
./gradlew clean build


当我尝试启动应使用Samza随附的脚本启动Yarn AppMaster的脚本时:

/opt/samza/samza-shell/src/main/bash/run-am.sh


我收到此错误:

Error: Main class org.apache.samza.job.yarn.SamzaAppMaster has not been found or loaded


如果我尝试使用run-job.sh脚本运行测试作业

./run-job.sh --config-factory=org.apache.samza.config.factories.PropertiesConfigFactory --config-path=file://$PWD/deploy/samza/config/wikipedia-feed.properties


并且引用org.apache.samza.job.JobRunner类时遇到类似的错误。

我以为我有一个Java配置问题,但找不到太多帮助或参考。

有人知道我在做什么错吗?

最佳答案

仍然无法正常工作,但我已经前进了一步。从路径执行Samza提供的脚本时,它们期望位于/ bin /文件夹中,并且需要有一个/ lib /,所有samza .jar文件都应位于其中。

我仍然有一些依赖问题,但是不同。

07-24 21:11