我有一个数据集,使用两个不同的聚类算法进行了聚类。结果大致相同,但是群集编号是置换的。
现在,为了显示颜色编码的标签,我希望相同集群的标签ID相同。
如何获得两个标签ID之间的正确排列?
我可以使用蛮力来做到这一点,但是也许有更好/更快的方法。我将不胜感激任何帮助或指针。如果可能的话,我正在寻找一个python函数。
最佳答案
寻找最佳匹配的最著名算法是匈牙利方法。
因为无法用几句话来解释它,所以我必须请您参阅您选择的书或Wikipedia article "Hungarian algorithm"。
您只需选择对应矩阵的最大值,然后删除该行和列,就可能获得良好的结果(即使差异确实很小,即使是完美的)。