背景与问题

在运行Fedora 23的计算机上运行Spark的MLLib中的示例时,我遇到了一些麻烦。我已经按照Spark文档中的以下选项构建了Spark 1.6.2:

build/mvn -Pnetlib-lgpl -Pyarn -Phadoop-2.4 \
  -Dhadoop.version=2.4.0 -DskipTests clean package

在运行二进制分类示例时:
bin/spark-submit --class org.apache.spark.examples.mllib.BinaryClassification \
  examples/target/scala-*/spark-examples-*.jar \
  --algorithm LR --regType L2 --regParam 1.0 \
  data/mllib/sample_binary_classification_data.txt

我收到以下错误:
/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.92-1.b14.fc23.x86_64/jre/bin/java: symbol lookup error: /tmp/jniloader5830472710956533873netlib-native_system-linux-x86_64.so: undefined symbol: cblas_dscal
这种形式的错误(netlib的符号查找错误)不限于此特定示例。另一方面,Elastic Net示例(./bin/run-example ml.LinearRegressionWithElasticNetExample)运行没有问题。

尝试的解决方案

我已经尝试了许多解决方案,但均无济于事。例如,我在这里经过了一些建议https://datasciencemadesimpler.wordpress.com/tag/blas/,尽管我可以从com.github.fommil.netlib.BLASLAPACK成功导入,但上述符号查找错误仍然存​​在。

我已经阅读了位于fommil/netlib-java的netlib-java文档,并确保我的系统具有libblasliblapack共享对象文件:
 $ ls /usr/lib64 | grep libblas
libblas.so
libblas.so.3
libblas.so.3.5
libblas.so.3.5.0

$ ls /usr/lib64 | grep liblapack
liblapacke.so
liblapacke.so.3
liblapacke.so.3.5
liblapacke.so.3.5.0
liblapack.so
liblapack.so.3
liblapack.so.3.5
liblapack.so.3.5.0

我发现的最有希望的建议是http://fossdev.blogspot.com/2015/12/scala-breeze-blas-lapack-on-linux.html,它建议包括
JAVA_OPTS="- Dcom.github.fommil.netlib.BLAS=com.github.fommil.netlib.NativeRefBLAS"
sbt脚本中。因此,我在_COMPILE_JVM_OPTS="..."脚本中将这些选项附加到了build/mvn上,这也不能解决问题。

最后,我在网上发现的最后建议是建议将以下标志传递给sbt:
sbt -Dcom.github.fommil.netlib.BLAS=com.github.fommil.netlib.F2jBLAS \
-Dcom.github.fommil.netlib.LAPACK=com.github.fommil.netlib.F2jLAPACK \
-Dcom.github.fommil.netlib.ARPACK=com.github.fommil.netlib.F2jARPACK

而且问题仍然存在。我的帖子仅限于两个链接,但建议可以在GitHub上找到lildata的“scaladatascience”存储库的README.md。

有人遇到过这个问题并成功解决了吗?任何帮助或建议,我们深表感谢。

最佳答案

已经过了几个月,但是我又回到了这个问题,并且能够得到一个可行的解决方法(如果有人遇到相同的问题,请在此处发布)。

它归结为图书馆的优先权;因此,请致电:

$ export LD_PRELOAD=/path/to/libopenblas.so

在启动Spark之前,一切都会按预期进行。

阅读后,我想出了解决方案:
  • https://github.com/fommil/netlib-java/issues/88(直接解决此问题)
  • JNI "symbol lookup error" in shared library on Linux(类似的链接问题,与Spark无关,但有关链接的信息是有益的)
  • 08-28 14:32