Weka可能是最流行的通用机器学习库。但在我的经验中,这可能相当缓慢。
我一直在寻找替代品。其中,shark和dlib看起来最有前途。
当涉及到这些库的性能测试时,有人有经验吗?
最佳答案
对我来说,最重要的是“这个工具箱是否有我想要尝试的算法或特性?”由于这些工具包提供了相当多样化的功能集,您应该首先尝试缩小您想要做的事情的范围。
因此,例如,如果你有一个强烈的愿望去尝试不同的进化优化算法,那么我会使用类似于Shark的方法。
另一方面,对于我的大部分工作,我更喜欢dlib,但这并不一定意味着很多,因为我写了它:)但是,如果你对二进制分类感兴趣,那么让我推荐我目前最喜欢的方法,即svm_c_ekm_trainer。我经常用它在数十万个点的数据集上训练非线性SVM。它通常在几分钟(有时甚至几秒钟)内运行,而用于此目的的经典SMO算法需要数小时或数天才能完成。
对于不久前提出的类似问题,也有一些很好的答案:Which machine learning library to use。
关于c++ - 最快的通用机器学习库? ,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/3167024/