我对两个哈希集的交集有问题。我不知道为什么一直都是0,因此相似度值为0。

无论如何,我正在发布涉及Intersection的方法。与联合对应的部分工作正常。多谢您的协助。

public <T> double Similarity (Set<T> s1, Set<T> s2){

    if (s1.isEmpty() || s2.isEmpty()){
        return 0.0;
    }
    double similarity;
    int unionValue;
    int intersectionValue;

    intersectionValue=intersection(s1, s2);
    unionValue=union(s1, s2);
    similarity=(double)intersectionValue/(double)unionValue;

    System.out.println(unionValue+"    "+intersectionValue);
    System.out.println(similarity);

    return similarity;
}



public <T> int intersection (Set<T> s1, Set<T> s2){

    Set<T> intersection = new HashSet<T>(s1);
    intersection.retainAll(s2);
    return intersection.size();
}

public <T> int union (Set<T> s1, Set<T> s2){

    Set<T> union = new HashSet<T>(s1);
    union.addAll(s1);

    for (T apiSwRepo : s2){
        if (union.toString().contains(apiSwRepo.toString())){
        }
        else
            union.add(apiSwRepo);
    }
    return union.size();

}

最佳答案

您的问题在于您的比较。

if (union.toString().contains(apiSwRepo.toString())) {
} else
    union.add(apiSwRepo);


在上面的代码中,您将Set转换为String,然后调用contains()。相反,您应在联合本身上为.contains(),如下所示:

if (union.contains(apiSwRepo)) {
} else
    union.add(apiSwRepo);


我还建议简化如下:

union.retainAll(s2);


因为您有两个Set,所以将从该简单语句获得并集。

09-13 14:04