并查集
借鉴百度百科的解释,并查集就是在一些有N个元素的集合问题中,开始的时候让每个元素成为自己的集合,然后按照一定的顺序将属于同一组的元素所在的集合进行合并(合并的是集合),在合并的期间需要方法查找元素所在的集合。并查集的原理比较简单,解决的问题的特点是看似并不复杂,但数据量极大。例如:图的连通子图问题,一个图里面有几个连通子图,判断这幅图是否连通等。若用正常的数据结构来描述,往往时空复杂度会过高。并查集是一种树形数据结构,用于处理一些不相交集合的合并和查询问题。并查集的原理就是朋友的朋友就是我的朋友。
基本
正如名字表达的那样,并查集需要合并和查询集合,所以并查集一般需要一个数组和两个函数:int[] parent, int find(int element)和void unionElements(int firstOne, int secondOne)。
parent数组用来记录每个元素的前导点,也就是确定该元素所在的集合id;find函数用来查找某元素所在的集合id;unionElements用来合并不同的集合。其基本过程如下图所示。
实现代码:
public class UnionFind1 {
private int[] id; //存储元素的root
private int size; //并查集大小
//构建新的并查集
public UnionFind1(int size) {
this.size = size;
id = new int[size];
for (int i=0; i<size; i++)
id[i] = i; //每个元素都指向自己
}
//查看元素所属的集合
public int find(int element) {
return id[element];
}
//判断是否属于同一集合
public boolean isConnected(int firElement, int secElement) {
return find(firElement) == find(secElement);
}
//合并两个集合
public void unionElements(int firElement, int secElement) {
int firUnion = find(firElement);
int secUnion = find(secElement);
if(firUnion != secUnion) {
//合并效率低下,合并一次是O(n)的复杂度
for(int i=0; i<this.size; i++) {
if(id[i] == firUnion) {
id[i] = secUnion;
}
}
}
}
//打印元素
private void printSet() {
for (int id : this.id)
System.out.print(id + " ");
System.out.println();
}
//入口
public static void main(String[] args) {
int n = 10;
UnionFind1 union = new UnionFind1(n);
System.out.println("初始化: ");
union.printSet();
System.out.println("连接5 6");
union.unionElements(5, 6);
System.out.println("连接1 2 ");
union.unionElements(1, 2);
System.out.println("连接2 3");
union.unionElements(2, 3);
System.out.println("连接1 4");
union.unionElements(1, 4);
System.out.println("连接1 5");
union.unionElements(1, 5);
System.out.println("最终结果: ");
union.printSet();
System.out.println("1 6 是否连接: " + union.isConnected(1, 6));
System.out.println("1 8 是否连接: " + union.isConnected(1, 8));
System.out.println("1 4 是否连接: " + union.isConnected(1, 4));
}
}
Output:
初始化:
0 1 2 3 4 5 6 7 8 9
连接5 6
连接1 2
连接2 3
连接1 4
连接1 5
最终结果:
0 6 6 6 6 6 6 7 8 9
1 6 是否连接: true
1 8 是否连接: false
1 4 是否连接: true
优化1
上述的并查集合并时候的复杂度是O(n)的,现在对其改进,在合并的时候,当前集合的爸爸去当别人的儿子,当前集合其他元素的爸爸(前导点)不变,这样的话,需要改变查找的方式,因为对某个集合来说,最终的爸爸只有一个。例如对于下面这个数组集合:
元素:0 1 2 3
爸爸:1 2 3 3
查找元素0和1的"爸爸",应该是3而不是1和2,所以find的寻找方式应该改变,应该找到最终的爸爸(元素和爸爸是同一个的点)。这种方式合并的复杂度下降了,但是find的复杂度增加了。
实现代码:
public class UnionFind2 {
private int[] id;
private int size;
public UnionFind2(int size) {
this.size = size;
id = new int[size];
for (int i=0; i<size; i++)
id[i] = i;
}
//找到最终的root
public int find(int element) {
while(element != id[element])
element = id[element];
return element;
}
public boolean isConnected(int firElement, int secElement)
{ return find(firElement) == find(secElement); }
public void unionElements(int firElement, int secElement) {
int firUion = find(firElement);
int secUion = find(secElement);
if (firUion == secUion)
return;
id[firUion] = secUion;
}
private void printSet() {
for (int id : this.id)
System.out.print(id + " ");
System.out.println();
}
public static void main(String[] args) {
int n = 10;
UnionFind2 union = new UnionFind2(n);
System.out.println("初始化: ");
union.printSet();
System.out.println("连接5 6");
union.unionElements(5, 6);
System.out.println("连接1 2 ");
union.unionElements(1, 2);
System.out.println("连接2 3");
union.unionElements(2, 3);
System.out.println("连接1 4");
union.unionElements(1, 4);
System.out.println("连接1 5");
union.unionElements(1, 5);
System.out.println("最终结果: ");
union.printSet();
System.out.println("1 6 是否连接: " + union.isConnected(1, 6));
System.out.println("1 8 是否连接: " + union.isConnected(1, 8));
System.out.println("1 4 是否连接: " + union.isConnected(1, 4));
}
}
Output:
初始化:
0 1 2 3 4 5 6 7 8 9
连接5 6
连接1 2
连接2 3
连接1 4
连接1 5
最终结果:
0 2 3 4 6 6 6 7 8 9
1 6 是否连接: true
1 8 是否连接: false
1 4 是否连接: true
优化2
优化1的修改方案,是牺牲查询函数的复杂度来换取合并函数复杂度的下降,并且还有引入一个新的问题,就是合并后的数组很可能会达到线性链表的状态,例如:
元素:0 1 2 3 4 5 6 7 8 9
爸爸:1 2 3 4 5 6 7 8 9 9
这样画出来的连通子图是一条链表来的,这种原因是合并方式不合理造成的。所以第二种优化的方式可从合并方式下手,引入一个权重来衡量到底谁应该当爸爸。有两种权重可供选择,一种是重量,一种是高度。
重量(数目):就是集合爸爸底下有多少数目的子孙;高度(代,箭头数):就是集合爸爸底下有多少代子孙。
基于重量,谁重谁当爸爸。
实现代码:
public class UnionFind3 {
private int[] id;
private int[] weight;
private int size;
public UnionFind3(int size) {
this.size = size;
this.id = new int[size];
this.weight = new int[size];
for (int i=0; i<size; i++) {
this.id[i] = i;
this.weight[i] = 1; //初始化为1个元素
}
}
public int find(int element) {
while(element != id[element]){
element = id[element];
}
return element;
}
public boolean isConnected(int firElement, int secElement) {
return find(firElement) == find(secElement);
}
public void unionElements(int firElement, int secElement) {
int firUion = find(firElement);
int secUion = find(secElement);
if(firUion == secUion)
return;
//减少find的查找时间,谁重谁是爸爸
if(weight[firUion] > weight[secUion]) {
id[secUion] = firUion;
weight[firUion] += weight[secUion];
}
else {
id[firUion] = secUion;
weight[secUion] += weight[firUion];
}
}
private void printSet() {
for (int id : this.id)
System.out.print(id + " ");
System.out.println();
}
public static void main(String[] args) {
int n = 10;
UnionFind3 union = new UnionFind3(n);
System.out.println("初始化: ");
union.printSet();
System.out.println("连接5 6");
union.unionElements(5, 6);
System.out.println("连接1 2 ");
union.unionElements(1, 2);
System.out.println("连接2 3");
union.unionElements(2, 3);
System.out.println("连接1 4");
union.unionElements(1, 4);
System.out.println("连接1 5");
union.unionElements(1, 5);
System.out.println("最终结果: ");
union.printSet();
System.out.println("1 6 是否连接: " + union.isConnected(1, 6));
System.out.println("1 8 是否连接: " + union.isConnected(1, 8));
System.out.println("1 4 是否连接: " + union.isConnected(1, 4));
}
}
Output:
初始化:
0 1 2 3 4 5 6 7 8 9
连接5 6
连接1 2
连接2 3
连接1 4
连接1 5
最终结果:
0 2 2 2 2 6 2 7 8 9
1 6 是否连接: true
1 8 是否连接: false
1 4 是否连接: true
基于高度,谁子孙代数多谁当爸爸。
实现代码:
public class UnionFind4 {
private int[] id;
private int[] height;
private int size;
public UnionFind4(int size) {
this.size = size;
this.id = new int[size];
this.height = new int[size];
for (int i=0; i<size; i++) {
id[i] = i;
height[i] = 1;
}
}
public int find(int element) {
while(element != id[element])
element = id[element];
return element;
}
public boolean isConnected(int fir, int sec) {
return find(fir) == find(sec);
}
public void unionElements(int fir, int sec) {
int firUion = find(fir);
int secUion = find(sec);
if(firUion == secUion)
return;
//使用高度决定谁被谁插入,减少find的时间
if(height[firUion] > height[secUion])
id[secUion] = firUion;
else if(height[firUion] < height[secUion])
id[firUion] = secUion;
else {
id[firUion] = secUion;
height[secUion]++;
}
}
private void printSet() {
for (int id : this.id)
System.out.print(id + " ");
System.out.println();
}
public static void main(String[] args) {
int n = 10;
UnionFind4 union = new UnionFind4(n);
System.out.println("初始化: ");
union.printSet();
System.out.println("连接5 6");
union.unionElements(5, 6);
System.out.println("连接1 2 ");
union.unionElements(1, 2);
System.out.println("连接2 3");
union.unionElements(2, 3);
System.out.println("连接1 4");
union.unionElements(1, 4);
System.out.println("连接1 5");
union.unionElements(1, 5);
System.out.println("最终结果: ");
union.printSet();
System.out.println("1 6 是否连接: " + union.isConnected(1, 6));
System.out.println("1 8 是否连接: " + union.isConnected(1, 8));
System.out.println("1 4 是否连接: " + union.isConnected(1, 4));
}
}
Output:
初始化:
0 1 2 3 4 5 6 7 8 9
连接5 6
连接1 2
连接2 3
连接1 4
连接1 5
最终结果:
0 2 6 2 2 6 6 7 8 9
1 6 是否连接: true
1 8 是否连接: false
1 4 是否连接: true
优化3
不管是基于重量还是高度,并查集还是有可能会出现深的节点,这时候可以进行干预,进行路径压缩,具体的方法就是在每一步的查询操作进行压缩,让当前元素的"爸爸"升级成"爷爷",这种路径压缩只能在基于重量的并查集实现,因为在压缩的时候,当前集合的重量是不会变的,但是高度很有可能改变。
实现代码:
public class UnionFind5 {
private int[] id;
private int[] weight;
private int size;
public UnionFind5(int size) {
this.size = size;
this.id = new int[size];
this.weight = new int[size];
for (int i=0; i<size; i++) {
id[i] = i;
weight[i] = 1;
}
}
//路径压缩,指向自己爸爸的爸爸,进一步压缩
public int find(int element) {
while(element != id[element]) {
id[element] = id[id[element]];
element = id[element];
}
return element;
}
public boolean isConnected(int fir, int sec) {
return find(fir) == find(sec);
}
public void unionElements(int fir, int sec) {
int firUion = find(fir);
int secUion = find(sec);
if (firUion == secUion)
return;
if (weight[firUion] > weight[secUion]) {
id[secUion] = firUion;
weight[firUion] += weight[secUion];
}
else {
id[firUion] = secUion;
weight[secUion] += weight[firUion];
}
}
private void printSet() {
for (int id : this.id)
System.out.print(id + " ");
System.out.println();
}
public static void main(String[] args) {
int n = 10;
UnionFind5 union = new UnionFind5(n);
System.out.println("初始化: ");
union.printSet();
System.out.println("连接5 6");
union.unionElements(5, 6);
System.out.println("连接1 2 ");
union.unionElements(1, 2);
System.out.println("连接2 3");
union.unionElements(2, 3);
System.out.println("连接1 4");
union.unionElements(1, 4);
System.out.println("连接1 5");
union.unionElements(1, 5);
System.out.println("最终结果: ");
union.printSet();
System.out.println("1 6 是否连接: " + union.isConnected(1, 6));
System.out.println("1 8 是否连接: " + union.isConnected(1, 8));
System.out.println("1 4 是否连接: " + union.isConnected(1, 4));
}
}
Output:
初始化:
0 1 2 3 4 5 6 7 8 9
连接5 6
连接1 2
连接2 3
连接1 4
连接1 5
最终结果:
0 2 2 2 2 6 2 7 8 9
1 6 是否连接: true
1 8 是否连接: false
1 4 是否连接: true
这篇博客主要是方便自己日后复习和查看使用,主要参考了下面这篇博客:
下面还有一篇关于并查集的概念解释得不错的概念分享给大家:
谢谢大家,这是本人的第一篇技术博客,欢迎大家批评指正,转载注明出处就行。