我正在网络入侵检测系统中做项目。 KDD CUP'99数据集是我的输入数据集。我在Java代码中使用了weka软件包。我使用“ NETBEANS”进行Java代码。KDDCUP'99数据集中的四种攻击类型,例如DOS,PROBE,U2R ,R2L和我正在研究这种攻击。 DOS,PROBE和R2L的使用随机森林算法的分类率非常好,但是我想提高U2R攻击的分类率,如何改进随机森林算法?为了提高U2R攻击的分类率,请给我一些想法。

最佳答案

不要使用此数据集。这是有缺陷的。 http://www.kdnuggets.com/news/2007/n18/4i.html


因此,我们强烈建议您

(1)所有研究人员都停止使用KDD Cup '99数据集,

(2)KDD Cup和UCI网站在KDD Cup '99上包含警告
数据集网页通知研究人员存在已知问题
与数据集,以及

(3)会议和期刊的同行评审员
顶纸(甚至完全拒绝它们,这在网络中很常见)
安全社区),其结果完全来自KDD Cup '99
数据集。


让我重复一遍,该数据集不得用于网络入侵检测。它不反映现实,而是模拟数据和旧数据。无论如何,它看起来都不像任何当前的攻击模式。

除此之外,文件应为ASCII文本文件。使用好的工具,您不需要提取它,因为它们可以即时解压缩(实际上,您的Web浏览器可能正在某些网络服务器上即时使用这种压缩方式)

除了运行时基准测试外,请勿使用它。

09-26 12:05