我正在寻找一个Java库,它不仅可以使用ID3或C4.5算法构建决策树,而且可以以某种合适的格式存储新构建的树。问题是我打算将决策树引擎用作某种类型的用户需求推导系统,即,在使用训练数据生成决策树之后,我想为其提供输入(来自用户的数据)并将输出用作给用户的推荐。简而言之,我只是无法浏览生成的树并根据输入数据集获取结果。我还不仅要构建二进制决策树,还要构建每个父节点具有可变数量的子代的树(这意味着某些节点可能有两个子代,其中三个根据父节点中检查的属性值)。我刚刚开始使用决策树,在该领域没有太多经验。我使用Google搜索,开始查看WEKA,但是我不确定它是否满足我的要求。任何指导都会有很大帮助。提前致谢!
最佳答案
Weka是最先进的分类工具,包括C4.5。一定要试试看。
实际上,许多其他工具(KNIME,Rapidminer)通常只会包裹Weka,本质上是做一些数据预处理,用户界面,实验运行等工作,但是主要任务委托给Weka。
在我看来,Weka并不是为此而设计的,但是它是分类和预测时的参考实现。所以试试吧!当您在研究其他任务(例如聚类或异常检测)时,请使用其他工具(例如ELKI)。 Wekas聚类算法极少。