在WEKA-MICROARRAY DATA的数据挖掘软件中,如何从现有数据集中删除冗余元组?删除冗余的代码应在JAVA中。

即数据集包含诸如

H,A,X,1,3,1,1,1,1,1,0,0,0
D,R,O,1,3,1,1,2,1,1,0,0,0
H,A,X,1,3,1,1,1,1,1,0,0,0
C,S,O,1,3,1,1,2,1,1,0,0,0
H,A,X,1,3,1,1,1,1,1,0,0,0


这里的元组1,4,5是多余的。

该代码应返回以下REDUNDANCY REOVED数据集...

H,A,X,1,3,1,1,1,1,1,0,0,0
D,R,O,1,3,1,1,2,1,1,0,0,0
C,S,O,1,3,1,1,2,1,1,0,0,0

最佳答案

您可以使用实现Set的类之一,例如java.util.HashSet

您可以将数据集加载到Set中,然后通过Set.toArray()方法转换为数组或遍历该Set来提取它们。

Set<Tuple> tupleSet = new HashSet<Tuple>();

      
对于(Tuple tuple:tupleList){
    tupleSet.add(tuple);
}

//现在,您所有的元组都是唯一的
对于(Tuple tuple:tupleSet){
    System.out.println(“ tuple:” + tuple);
}

关于java - 如何使用Java编程删除微阵列数据中的冗余元组?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/2046745/

10-13 05:19