背景与问题
在运行Fedora 23的计算机上运行Spark的MLLib中的示例时,我遇到了一些麻烦。我已经按照Spark文档中的以下选项构建了Spark 1.6.2:
build/mvn -Pnetlib-lgpl -Pyarn -Phadoop-2.4 \
-Dhadoop.version=2.4.0 -DskipTests clean package
在运行二进制分类示例时:
bin/spark-submit --class org.apache.spark.examples.mllib.BinaryClassification \
examples/target/scala-*/spark-examples-*.jar \
--algorithm LR --regType L2 --regParam 1.0 \
data/mllib/sample_binary_classification_data.txt
我收到以下错误:
/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.92-1.b14.fc23.x86_64/jre/bin/java: symbol lookup error: /tmp/jniloader5830472710956533873netlib-native_system-linux-x86_64.so: undefined symbol: cblas_dscal
这种形式的错误(netlib的符号查找错误)不限于此特定示例。另一方面,Elastic Net示例(
./bin/run-example ml.LinearRegressionWithElasticNetExample
)运行没有问题。尝试的解决方案
我已经尝试了许多解决方案,但均无济于事。例如,我在这里经过了一些建议https://datasciencemadesimpler.wordpress.com/tag/blas/,尽管我可以从
com.github.fommil.netlib.BLAS
和LAPACK
成功导入,但上述符号查找错误仍然存在。我已经阅读了位于fommil/netlib-java的netlib-java文档,并确保我的系统具有
libblas
和liblapack
共享对象文件: $ ls /usr/lib64 | grep libblas
libblas.so
libblas.so.3
libblas.so.3.5
libblas.so.3.5.0
$ ls /usr/lib64 | grep liblapack
liblapacke.so
liblapacke.so.3
liblapacke.so.3.5
liblapacke.so.3.5.0
liblapack.so
liblapack.so.3
liblapack.so.3.5
liblapack.so.3.5.0
我发现的最有希望的建议是http://fossdev.blogspot.com/2015/12/scala-breeze-blas-lapack-on-linux.html,它建议包括
JAVA_OPTS="- Dcom.github.fommil.netlib.BLAS=com.github.fommil.netlib.NativeRefBLAS"
在
sbt
脚本中。因此,我在_COMPILE_JVM_OPTS="..."
脚本中将这些选项附加到了build/mvn
上,这也不能解决问题。最后,我在网上发现的最后建议是建议将以下标志传递给
sbt
:sbt -Dcom.github.fommil.netlib.BLAS=com.github.fommil.netlib.F2jBLAS \
-Dcom.github.fommil.netlib.LAPACK=com.github.fommil.netlib.F2jLAPACK \
-Dcom.github.fommil.netlib.ARPACK=com.github.fommil.netlib.F2jARPACK
而且问题仍然存在。我的帖子仅限于两个链接,但建议可以在GitHub上找到lildata的“scaladatascience”存储库的README.md。
有人遇到过这个问题并成功解决了吗?任何帮助或建议,我们深表感谢。
最佳答案
已经过了几个月,但是我又回到了这个问题,并且能够得到一个可行的解决方法(如果有人遇到相同的问题,请在此处发布)。
它归结为图书馆的优先权;因此,请致电:
$ export LD_PRELOAD=/path/to/libopenblas.so
在启动Spark之前,一切都会按预期进行。
阅读后,我想出了解决方案: