我有一个数据集,其中包含年龄,城市, child 年龄等信息,以及结果(确认,接受)。
为了帮助对“工作流”进行建模,我想基于先前的数据集自动创建决策树。
我看了一下http://en.wikipedia.org/wiki/Decision_tree_learning,我知道问题显然并不明显。
我只想就该主题的某些算法或库提供建议,这对帮助我构建基于样本的决策树有什么帮助。
最佳答案
您应该看一下Weka,这是一个免费的基于Java的监督学习套件。
将数据转换为Weka的简单的基于文本的.arff format之后,您应该能够使用GUI或命令行界面来训练和测试该数据的各种不同分类器,包括:
使用此界面进行试验应该可以让您轻松尝试不同的分类器和训练参数,以确定哪些分类器对数据的效果最佳。
您也可以use an API to integrate Weka into your own source code。