Java TreeSet:基于红黑树的排序集合解析

本文涉及的产品
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介: Java TreeSet:基于红黑树的排序集合解析

Java集合框架中,TreeSet是一个有序的、不允许元素重复的集合。它基于红黑树(Red-Black Tree)数据结构实现,这种数据结构能够确保元素在插入、删除后仍然保持有序状态。红黑树是一种自平衡的二叉查找树,它通过一系列的旋转和颜色调整来保证树的高度相对较低,从而保证了操作的效率。


一、TreeSet的特点


  1. 有序性TreeSet中的元素按照升序排列。默认情况下,元素按照自然顺序(即Comparable接口定义的顺序)进行排序,也可以通过构造函数提供一个自定义的Comparator来决定元素的排序方式。
  2. 不允许重复:如果试图向TreeSet中添加一个已经存在的元素(根据比较规则判断为相等),则这个操作不会有任何效果,集合保持不变。
  3. 非线程安全TreeSet是非线程安全的,如果多个线程同时修改一个TreeSet实例,并且至少有一个线程修改了该实例的结构,那么它必须保持外部同步。这通常是通过在某个自然封装了该集合的对象上进行同步来完成的。
  4. 性能:由于TreeSet基于红黑树实现,因此它的添加、删除、查找等操作的时间复杂度都接近O(log n)。这比基于哈希表的集合(如HashSet)要慢一些,但是TreeSet提供了有序的特性。


二、使用示例


下面是一个简单的TreeSet使用示例,展示了如何创建一个TreeSet、向其中添加元素以及遍历元素:

import java.util.TreeSet;
import java.util.Set;
public class TreeSetExample {
    public static void main(String[] args) {
        // 创建一个空的TreeSet实例,元素按照自然顺序排序
        Set<Integer> treeSet = new TreeSet<>();
        
        // 向TreeSet中添加元素
        treeSet.add(5);
        treeSet.add(2);
        treeSet.add(8);
        treeSet.add(1);
        treeSet.add(4);
        
        // 试图添加一个已存在的元素,不会有任何效果
        treeSet.add(5); // 重复元素不会被添加
        
        // 遍历TreeSet中的元素(有序)
        for (Integer number : treeSet) {
            System.out.println(number); // 输出顺序:1, 2, 4, 5, 8
        }
        
        // 创建一个自定义排序的TreeSet实例
        Set<String> customSortedSet = new TreeSet<>(String.CASE_INSENSITIVE_ORDER);
        customSortedSet.add("Apple");
        customSortedSet.add("banana");
        customSortedSet.add("Orange");
        customSortedSet.add("pear");
        customSortedSet.add("apple"); // 重复元素(不区分大小写)不会被添加
        
        // 遍历自定义排序的TreeSet中的元素(有序且不区分大小写)
        for (String fruit : customSortedSet) {
            System.out.println(fruit); // 输出顺序可能是:Apple, banana, Orange, pear(顺序可能因JVM实现而异)
        }
    }
}

在这个示例中,我们首先创建了一个空的TreeSet实例,并向其中添加了一些整数。由于TreeSet会自动对元素进行排序,因此遍历集合时输出的是有序的元素列表。然后,我们创建了一个自定义排序的TreeSet实例,使用了一个不区分大小写的比较器(String.CASE_INSENSITIVE_ORDER),并向其中添加了一些字符串。同样地,遍历集合时输出的是有序且不区分大小写的元素列表。需要注意的是,由于红黑树的特性,相同元素的添加操作会被忽略。


三、TreeSet的内部实现


TreeSet的内部实现基于红黑树,这是一种自平衡的二叉查找树。在二叉查找树中,每个节点都有一个键(以及相关联的值),任何节点的键都大于其左子树中的所有节点的键,而小于其右子树中的所有节点的键。然而,普通的二叉查找树在最坏的情况下可能会退化成链表(例如,当元素按升序或降序插入时),导致操作的时间复杂度增加到O(n)。

为了解决这个问题,红黑树引入了一些额外的属性来保持树的平衡:

  1. 每个节点要么是红色,要么是黑色。
  2. 根节点是黑色。
  3. 所有叶子节点(NIL或空节点)是黑色。
  4. 如果一个节点是红色的,则它的两个子节点都是黑色的(从每个叶子到根的所有路径上不能有两个连续的红色节点)。
  5. 对于每个节点,从该节点到其所有后代叶子节点的简单路径上,均包含相同数量的黑色节点(称为黑高度)。

这些属性确保了从根到叶子的最长可能路径不会超过最短可能路径的两倍长。由于操作最坏的情况就是找到位于树的最深层的节点,因此这种保证使得在红黑树上进行插入、删除和查找操作的时间复杂度为O(log n)。


四、自定义排序


除了使用元素的自然顺序外,TreeSet还允许通过构造函数提供一个Comparator来定义元素的排序方式。Comparator是一个接口,它定义了一个compare方法,该方法用于比较两个对象并确定它们的顺序。

下面是一个使用自定义Comparator的示例:

import java.util.Comparator;
import java.util.TreeSet;
import java.util.Set;
public class CustomSortedSetExample {
    public static void main(String[] args) {
        // 创建一个自定义排序的TreeSet实例,使用自定义的Comparator
        Set<String> customSortedSet = new TreeSet<>(new CustomComparator());
        
        // 向TreeSet中添加元素,它们将按照自定义Comparator定义的顺序排序
        customSortedSet.add("Apple");
        customSortedSet.add("banana");
        customSortedSet.add("Orange");
        customSortedSet.add("pear");
        
        // 遍历TreeSet中的元素(按照自定义的顺序)
        for (String fruit : customSortedSet) {
            System.out.println(fruit); // 输出顺序取决于CustomComparator的实现
        }
    }
    
    // 自定义Comparator实现类
    static class CustomComparator implements Comparator<String> {
        @Override
        public int compare(String s1, String s2) {
            // 这里可以根据需要定义比较逻辑,例如按照字符串长度排序
            return Integer.compare(s1.length(), s2.length());
        }
    }
}

在这个示例中,我们创建了一个自定义的Comparator实现类CustomComparator,它按照字符串的长度来比较元素。然后,我们使用这个比较器创建了一个TreeSet实例,并向其中添加了一些字符串。遍历集合时,元素将按照字符串长度的升序排列。

相关文章
|
20天前
|
存储 安全 Java
Java 集合框架中的老炮与新秀:HashTable 和 HashMap 谁更胜一筹?
嗨,大家好,我是技术伙伴小米。今天通过讲故事的方式,详细介绍 Java 中 HashMap 和 HashTable 的区别。从版本、线程安全、null 值支持、性能及迭代器行为等方面对比,帮助你轻松应对面试中的经典问题。HashMap 更高效灵活,适合单线程或需手动处理线程安全的场景;HashTable 较古老,线程安全但性能不佳。现代项目推荐使用 ConcurrentHashMap。关注我的公众号“软件求生”,获取更多技术干货!
39 3
|
20天前
|
人工智能 自然语言处理 Java
FastExcel:开源的 JAVA 解析 Excel 工具,集成 AI 通过自然语言处理 Excel 文件,完全兼容 EasyExcel
FastExcel 是一款基于 Java 的高性能 Excel 处理工具,专注于优化大规模数据处理,提供简洁易用的 API 和流式操作能力,支持从 EasyExcel 无缝迁移。
89 9
FastExcel:开源的 JAVA 解析 Excel 工具,集成 AI 通过自然语言处理 Excel 文件,完全兼容 EasyExcel
|
6天前
|
SQL Java 数据库连接
如何在 Java 代码中使用 JSqlParser 解析复杂的 SQL 语句?
大家好,我是 V 哥。JSqlParser 是一个用于解析 SQL 语句的 Java 库,可将 SQL 解析为 Java 对象树,支持多种 SQL 类型(如 `SELECT`、`INSERT` 等)。它适用于 SQL 分析、修改、生成和验证等场景。通过 Maven 或 Gradle 安装后,可以方便地在 Java 代码中使用。
94 11
|
5天前
|
存储 分布式计算 Hadoop
基于Java的Hadoop文件处理系统:高效分布式数据解析与存储
本文介绍了如何借鉴Hadoop的设计思想,使用Java实现其核心功能MapReduce,解决海量数据处理问题。通过类比图书馆管理系统,详细解释了Hadoop的两大组件:HDFS(分布式文件系统)和MapReduce(分布式计算模型)。具体实现了单词统计任务,并扩展支持CSV和JSON格式的数据解析。为了提升性能,引入了Combiner减少中间数据传输,以及自定义Partitioner解决数据倾斜问题。最后总结了Hadoop在大数据处理中的重要性,鼓励Java开发者学习Hadoop以拓展技术边界。
28 7
|
27天前
|
存储 缓存 Java
Java 并发编程——volatile 关键字解析
本文介绍了Java线程中的`volatile`关键字及其与`synchronized`锁的区别。`volatile`保证了变量的可见性和一定的有序性,但不能保证原子性。它通过内存屏障实现,避免指令重排序,确保线程间数据一致。相比`synchronized`,`volatile`性能更优,适用于简单状态标记和某些特定场景,如单例模式中的双重检查锁定。文中还解释了Java内存模型的基本概念,包括主内存、工作内存及并发编程中的原子性、可见性和有序性。
Java 并发编程——volatile 关键字解析
|
19天前
|
存储 算法 安全
基于红黑树的局域网上网行为控制C++ 算法解析
在当今网络环境中,局域网上网行为控制对企业和学校至关重要。本文探讨了一种基于红黑树数据结构的高效算法,用于管理用户的上网行为,如IP地址、上网时长、访问网站类别和流量使用情况。通过红黑树的自平衡特性,确保了高效的查找、插入和删除操作。文中提供了C++代码示例,展示了如何实现该算法,并强调其在网络管理中的应用价值。
|
25天前
|
Java 数据库连接 Spring
反射-----浅解析(Java)
在java中,我们可以通过反射机制,知道任何一个类的成员变量(成员属性)和成员方法,也可以堆任何一个对象,调用这个对象的任何属性和方法,更进一步我们还可以修改部分信息和。
|
1月前
|
存储 缓存 安全
Java 集合江湖:底层数据结构的大揭秘!
小米是一位热爱技术分享的程序员,本文详细解析了Java面试中常见的List、Set、Map的区别。不仅介绍了它们的基本特性和实现类,还深入探讨了各自的使用场景和面试技巧,帮助读者更好地理解和应对相关问题。
49 5
|
2月前
|
监控 Java 应用服务中间件
高级java面试---spring.factories文件的解析源码API机制
【11月更文挑战第20天】Spring Boot是一个用于快速构建基于Spring框架的应用程序的开源框架。它通过自动配置、起步依赖和内嵌服务器等特性,极大地简化了Spring应用的开发和部署过程。本文将深入探讨Spring Boot的背景历史、业务场景、功能点以及底层原理,并通过Java代码手写模拟Spring Boot的启动过程,特别是spring.factories文件的解析源码API机制。
108 2
|
26天前
|
存储 设计模式 算法
【23种设计模式·全精解析 | 行为型模式篇】11种行为型模式的结构概述、案例实现、优缺点、扩展对比、使用场景、源码解析
行为型模式用于描述程序在运行时复杂的流程控制,即描述多个类或对象之间怎样相互协作共同完成单个对象都无法单独完成的任务,它涉及算法与对象间职责的分配。行为型模式分为类行为模式和对象行为模式,前者采用继承机制来在类间分派行为,后者采用组合或聚合在对象间分配行为。由于组合关系或聚合关系比继承关系耦合度低,满足“合成复用原则”,所以对象行为模式比类行为模式具有更大的灵活性。 行为型模式分为: • 模板方法模式 • 策略模式 • 命令模式 • 职责链模式 • 状态模式 • 观察者模式 • 中介者模式 • 迭代器模式 • 访问者模式 • 备忘录模式 • 解释器模式
【23种设计模式·全精解析 | 行为型模式篇】11种行为型模式的结构概述、案例实现、优缺点、扩展对比、使用场景、源码解析

热门文章

最新文章

推荐镜像

更多