并查集(Disjoint Set)

简介: 并查集(Disjoint Set)

并查集(Disjoint Set),又称并查集数据结构或不相交集合数据结构,是一种用于处理不相交集合(即各集合之间没有交集)的数据结构。并查集主要支持两种操作:合并(Union)和查找(Find),它在许多算法中扮演着关键角色,特别是在图论中的连通性问题、网络连接问题等方面。

 

基本概念

 

并查集通过一棵棵树来表示集合,每棵树代表一个集合,树中的每个节点指向其父节点,根节点指向自身。每个元素都有一个与之对应的节点,这些节点通过指针连接形成树形结构。合并操作将两个不同集合合并为一个集合,而查找操作则查找元素所属的集合,即找到该元素所在树的根节点。

 

并查集的两大优化策略

 

为了提高并查集操作的效率,通常会采用两种优化策略:路径压缩(Path Compression)和按秩合并(Union by Rank)。

 

1. **路径压缩**:路径压缩是在执行查找操作时,通过改变树结构减少树的高度,使得后续查找操作更加高效。在执行查找操作时,将被访问到的节点直接连接到根节点上。这样做的结果是树的高度显著降低。

 

2. **按秩合并**:按秩合并是在执行合并操作时,将秩(即树的高度或者近似高度)较小的树合并到秩较大的树上,以防止树的高度过大。具体来说,当合并两个集合时,总是将秩较小的树的根指向秩较大的树的根。

 

这些优化策略使得并查集的时间复杂度接近于常数时间,具体为O(α(n)),其中α是反阿克曼函数,增长极其缓慢,可以认为在实际应用中几乎是常数时间。

 

并查集的操作

 

假设我们有一个大小为N的并查集,我们的目标是提供高效的合并和查找操作。以下是并查集的主要操作及其实现:

 

1. **初始化(MakeSet)**:将每个元素初始化为一个集合,即每个元素作为一个独立的树。

2. **查找(Find)**:查找元素所属的集合,返回该集合的代表元,即树的根节点。

3. **合并(Union)**:将两个不同的集合合并为一个集合。

 

并查集的实现

 

下面是基于数组实现的并查集的Java代码示例:

 

```java
class DisjointSet {
    private int[] parent;
    private int[] rank;
 
    public DisjointSet(int size) {
        parent = new int[size];
        rank = new int[size];
        for (int i = 0; i < size; i++) {
            parent[i] = i; // 每个元素的父节点初始化为自己
            rank[i] = 0;   // 初始秩都为0
        }
    }
 
    // 查找操作,带路径压缩
    public int find(int x) {
        if (parent[x] != x) {
            parent[x] = find(parent[x]); // 路径压缩
        }
        return parent[x];
    }
 
    // 合并操作,带按秩合并
    public void union(int x, int y) {
        int rootX = find(x);
        int rootY = find(y);
        if (rootX == rootY) {
            return;
        }
        if (rank[rootX] < rank[rootY]) {
            parent[rootX] = rootY;
        } else if (rank[rootX] > rank[rootY]) {
            parent[rootY] = rootX;
        } else {
            parent[rootY] = rootX;
            rank[rootX]++;
        }
    }
}
```

 

使用示例

 

假设我们有一组元素 {0, 1, 2, 3, 4},开始时它们各自属于不同的集合。接下来,我们执行以下操作:

 

1. 执行 `union(0, 1)`,将元素0和元素1所在的集合合并。

2. 执行 `union(2, 3)`,将元素2和元素3所在的集合合并。

3. 执行 `union(1, 3)`,将元素1和元素3所在的集合合并。

 

最终,元素0、1、2、3将属于同一个集合,而元素4仍然是一个独立的集合。

 

应用场景

 

并查集在许多场景中都有广泛应用:

 

1. **图的连通性判断**:判断图中的两个节点是否连通。

2. **最小生成树**:Kruskal算法利用并查集来检测环。

3. **动态连通性问题**:如网络连接问题,社交网络中的朋友关系等。

 

总结

 

并查集是一种高效的数据结构,通过路径压缩和按秩合并等优化方法,可以在接近常数时间内完成查找和合并操作。它在解决图论中的连通性问题、动态连通性问题等方面具有重要作用。掌握并查集对于算法设计和复杂问题的求解非常有帮助。

目录
相关文章
|
8月前
|
机器学习/深度学习 NoSQL 容器
并查集(Disjoint Set)
并查集(Disjoint Set)
|
8月前
|
算法 Python
Python高级数据结构——并查集(Disjoint Set)
Python高级数据结构——并查集(Disjoint Set)
358 2
|
算法 vr&ar
不相交集(The Disjoint Set ADT)
0)引论 不相交集是解决等价问题的一种有效的数据结构,之所以称之为有效是因为,这个数据结构简单(几行代码,一个简单数组就可以搞定),快速(每个操作基本上可以在常数平均时间内搞定)。 首先我们要明白什么叫做等价关系,而在这个之前要先有一个关系(relation)的定义 Relation:定义在数据集S上的关系R是指,对于属于数据集S中的每一对元素(a,b),a R b要么是真要么是假。
1098 0
|
1月前
|
算法
你对Collection中Set、List、Map理解?
你对Collection中Set、List、Map理解?
71 18
你对Collection中Set、List、Map理解?
|
1月前
|
存储 缓存 安全
只会“有序无序”?面试官嫌弃的List、Set、Map回答!
小米,一位热衷于技术分享的程序员,通过与朋友小林的对话,详细解析了Java面试中常见的List、Set、Map三者之间的区别,不仅涵盖了它们的基本特性,还深入探讨了各自的实现原理及应用场景,帮助面试者更好地准备相关问题。
63 20
|
2月前
|
存储 C++ 容器
【C++】map、set基本用法
本文介绍了C++ STL中的`map`和`set`两种关联容器。`map`用于存储键值对,每个键唯一;而`set`存储唯一元素,不包含值。两者均基于红黑树实现,支持高效的查找、插入和删除操作。文中详细列举了它们的构造方法、迭代器、容量检查、元素修改等常用接口,并简要对比了`map`与`set`的主要差异。此外,还介绍了允许重复元素的`multiset`和`multimap`。
43 3
【C++】map、set基本用法
|
2月前
|
存储 算法 C++
【C++】unordered_map(set)
C++中的`unordered`容器(如`std::unordered_set`、`std::unordered_map`)基于哈希表实现,提供高效的查找、插入和删除操作。哈希表通过哈希函数将元素映射到特定的“桶”中,每个桶可存储一个或多个元素,以处理哈希冲突。主要组成部分包括哈希表、哈希函数、冲突处理机制、负载因子和再散列,以及迭代器。哈希函数用于计算元素的哈希值,冲突通过开链法解决,负载因子控制哈希表的扩展。迭代器支持遍历容器中的元素。`unordered_map`和`unordered_set`的插入、查找和删除操作在理想情况下时间复杂度为O(1),但在冲突较多时可能退化为O(n)。
31 5
|
4月前
|
存储 Java API
【数据结构】map&set详解
本文详细介绍了Java集合框架中的Set系列和Map系列集合。Set系列包括HashSet(哈希表实现,无序且元素唯一)、LinkedHashSet(保持插入顺序的HashSet)、TreeSet(红黑树实现,自动排序)。Map系列为双列集合,键值一一对应,键不可重复,值可重复。文章还介绍了HashMap、LinkedHashMap、TreeMap的具体实现与应用场景,并提供了面试题示例,如随机链表复制、宝石与石头、前K个高频单词等问题的解决方案。
56 6
【数据结构】map&set详解
|
3月前
|
存储 JavaScript 前端开发
Set、Map、WeakSet 和 WeakMap 的区别
在 JavaScript 中,Set 和 Map 用于存储唯一值和键值对,支持多种操作方法,如添加、删除和检查元素。WeakSet 和 WeakMap 则存储弱引用的对象,有助于防止内存泄漏,适合特定场景使用。