在WEKA-MICROARRAY DATA的数据挖掘软件中,如何从现有数据集中删除冗余元组?删除冗余的代码应在JAVA中。
即数据集包含诸如
H,A,X,1,3,1,1,1,1,1,0,0,0
D,R,O,1,3,1,1,2,1,1,0,0,0
H,A,X,1,3,1,1,1,1,1,0,0,0
C,S,O,1,3,1,1,2,1,1,0,0,0
H,A,X,1,3,1,1,1,1,1,0,0,0
这里的元组1,4,5是多余的。
该代码应返回以下REDUNDANCY REOVED数据集...
H,A,X,1,3,1,1,1,1,1,0,0,0
D,R,O,1,3,1,1,2,1,1,0,0,0
C,S,O,1,3,1,1,2,1,1,0,0,0
最佳答案
您可以使用实现Set的类之一,例如java.util.HashSet。
您可以将数据集加载到Set中,然后通过Set.toArray()方法转换为数组或遍历该Set来提取它们。Set<Tuple> tupleSet = new HashSet<Tuple>();
对于(Tuple tuple:tupleList){
tupleSet.add(tuple);
}
//现在,您所有的元组都是唯一的
对于(Tuple tuple:tupleSet){
System.out.println(“ tuple:” + tuple);
}
关于java - 如何使用Java编程删除微阵列数据中的冗余元组?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/2046745/