【Java数据结构】Map&Set的理解与应用(附面试题加深理解)

简介: 搜索、Map的使用、Set的说明、面试题练习

搜索

概念及场景

Map和set是一种专门用来进行搜索的容器或者数据结构,其搜索的效率与其具体的实例化子类有关。


以前常见的搜索方式有:

直接遍历,时间复杂度为O(N),元素如果比较多效率会非常慢

二分查找,时间复杂度为O(log2 N) ,但搜索前必须要求序列是有序的

上述排序比较适合静态类型的查找,即一般不会对区间进行插入和删除操作了,而现实中的查找比如:

根据姓名查询考试成绩

通讯录,即根据姓名查询联系方式

不重复集合,即需要先搜索关键字是否已经在集合中

可能在查找时进行一些插入和删除的操作,即动态查找,那上述两种方式就不太适合了,本文介绍的Map和Set是一种适合动态查找的集合容器。


模型

一般把搜索的数据称为关键字(Key),和关键字对应的称为值(Value),将其称之为Key-value的键值对,所以模型会有两种:


纯 key 模型,比如:

有一个英文词典,快速查找一个单词是否在词典中

快速查找某个名字在不在通讯录中

Key-Value 模型,比如:

统计文件中每个单词出现的次数,统计结果是每个单词都有与其对应的次数:<单词,单词出现的次数>

梁山好汉的江湖绰号:每个好汉都有自己的江湖绰号

而Map中存储的就是key-value的键值对,Set中只存储了Key。

Map的使用

b1.png


关于Map的说明

Map是一个接口类,该类没有继承自Collection,该类中存储的是<K,V>结构的键值对,并且K一定是唯一的,不能重复。


Map 的常用方法说明

b2.png


注意:


Map是一个接口,不能直接实例化对象,如果要实例化对象只能实例化其实现类TreeMap或者HashMap

Map中存放键值对的Key是唯一的,value是可以重复的

在Map中插入键值对时,key可以为空,value可以为空

Map中的Key可以全部分离出来,存储到Set中来进行访问(因为Key不能重复)。

Map中的value可以全部分离出来,存储在Collection的任何一个子集合中(value可能有重复)。

Map中键值对的Key不能直接修改,value可以修改,如果要修改key,只能先将该key删除掉,然后再来进行重新插入。

TreeMap和HashMap的区别


b3.png


关于Map.Entry<K, V>的说明

Map.Entry<K, V> 是Map内部实现的用来存放<key, value>键值对映射关系的内部类,该内部类中主要提供了<key, value>的获取,value的设置以及Key的比较方式。

b4.png


注意:Map.Entry<K,V>并没有提供设置Key的方法


Set的说明

Set与Map主要的不同有两点:

  • Set是继承自Collection的接口类
  • Set中只存储了Key。


Set常见方法说明

image.png


注意:


1.Map是一个接口,不能直接实例化对象,如果要实例化对象只能实例化其实现类TreeMap或者HashMap

2.Map中存放键值对的Key是唯一的,value是可以重复的

3.在Map中插入键值对时,key可以为空,value可以为空

4.Map中的Key可以全部分离出来,存储到Set中来进行访问(因为Key不能重复)。

5.Map中的value可以全部分离出来,存储在Collection的任何一个子集合中(value可能有重复)。

6.Map中键值对的Key不能直接修改,value可以修改,如果要修改key,只能先将该key删除掉,然后再来进行重新插入。

7.TreeMap和HashMap的区别

b6.png

关于Map.Entry<K, V>的说明

Map.Entry<K, V> 是Map内部实现的用来存放<key, value>键值对映射关系的内部类,该内部类中主要提供了<key, value>的获取,value的设置以及Key的比较方式。


image.png


注意:Map.Entry<K,V>并没有提供设置Key的方法


Set的说明

Set与Map主要的不同有两点:

  • Set是继承自Collection的接口类
  • Set中只存储了Key。


Set常见方法说明

image.png


注意:


1.Set是继承自Collection的一个接口类

2.Set中只存储了key,并且要求key一定要唯一

3.Set的底层是使用Map来实现的,其使用key与Object的一个默认对象作为键值对插入到Map中的

4.Set最大的功能就是对集合中的元素进行去重

5.实现Set接口的常用类有TreeSet和HashSet,还有一个LinkedHashSet,LinkedHashSet是在HashSet的基础上维护了一个双向链表来记录元素的插入次序。

6.Set中的Key不能修改,如果要修改,先将原来的删除掉,然后再重新插入

7.TreeSet和HashSet的区别

b7.png


面试题练习

只出现一次的数字

b8.png


思路:

我们知道Set的特点就是key不会重复,所以这题第一时间想到的就是用HashSet,每读取一个数据,就将其存入我们的set里,如果set已经有这个数据了,说明这是第二次出现了,就把原来存在set里的这个数据给删除掉,遍历完全部数据后,还存在于set里的就是只出现一次的数据了


代码:

class Solution {

   public int singleNumber(int[] nums) {

       HashSet<Integer> set = new HashSet<Integer>();


       for(int i = 0 ; i < nums.length ; i++){

           if(set.contains(nums[i])){

               set.remove(nums[i]);

           }else{

               set.add(nums[i]);

           }

       }


       for(int key:set){

           return key;

       }

       return -1;

   }

}


复制带随机指针的链表

b9.png


思路:

题目要求进行深拷贝,所以就是说,我们要返回一个新的链表,新链表和原链表里的东西是一模一样的,但是互不相干,由于存在一 一对应的关系,首先想到的就是用Map,原链表的节点就是key–value里的key,而新链表的节点就是value,两者形成了一 一对应的关系,然后再利用map将原节点对应的next和random依次复制给新节点,具体看代码注释


代码:

/*

// Definition for a Node.

class Node {

   int val;

   Node next;

   Node random;


   public Node(int val) {

       this.val = val;

       this.next = null;

       this.random = null;

   }

}

*/


class Solution {

   public Node copyRandomList(Node head) {

           if(head==null) return null;

           Node cur = head;//创建一个cur节点遍历原链表

           HashMap<Node,Node> map = new HashMap<>();//建一个HashMap

           while(cur!=null){//依次遍历原链表

               Node copyNode = new Node(cur.val);//创建新节点,值和原链表中节点值一样

               map.put(cur,copyNode);//将原链表的节点和新创建的值一样的节点放入Map中

               cur = cur.next;

           }

           //已经将复制好的新节点和原节点按对应方式存入了map中

           //最后需要利用map处理新节点的next和random

           cur = head;

           while(cur!=null){

               //关键代码如下

               map.get(cur).next = map.get(cur.next);

               map.get(cur).random = map.get(cur.random);

               cur = cur.next;

           }

           return map.get(head);

     

   }

}


宝石与石头

b10.png


思路:

遍历字符串 jewels,使用HashSet存储其中的字符,然后遍历字符串 stones,对于其中的每个字符,如果其在哈希集合(HashSet)中,则是宝石。

代码:

class Solution {

   public int numJewelsInStones(String jewels, String stones) {

       HashSet<Character> set = new HashSet<>();

       for(int i = 0; i < jewels.length() ; i++){

           set.add(jewels.charAt(i));

       }


       int count = 0;

       for(int i = 0; i < stones.length() ; i++){

           if(set.contains(stones.charAt(i)))

           count++;

       }

       return count;

   }

}


坏键盘打字

b11.png


思路:


将实际输入的字符存入一个Set里,Set里的值不会重复,也就是说这个Set(setActul)里代表的就是好的键

遍历期望输入的字符串,如果setActual里边没有期望字符串里的字符,说明这个键是坏的,因为题目要求只输出一次坏的键,所以还需要用一个setBroken来记录坏的键,这样就不会重复输出坏的键了

代码:

import java.util.*;

public class 坏键盘 {

   public static void main(String[] args) {

       Scanner scan = new Scanner(System.in);

       String str1 = scan.nextLine();//期望的

       String str2 = scan.nextLine();//实际的


       HashSet<Character> setActual = new HashSet<>();

       for(char ch : str2.toUpperCase().toCharArray()) {

           setActual.add(ch);//把实际的字符串放到一个set里

       }


       HashSet<Character> setBroken = new HashSet<>();

       //再把坏了的键放到一个set里

       for(char ch : str1.toUpperCase().toCharArray()) {//遍历期望的字符串

           if(!setActual.contains(ch) && !setBroken.contains(ch)) {//在对比已经存在setActul里实际输入的字符串

               setBroken.add(ch);

               //这个ch就是坏了的

               //setBroken里只存一次这个坏了的键,存的时候同时打印一次

               System.out.print(ch);

           }

       }

   }

}



10w个数据去除重复数据

思路:

  • 原理就是利用Set的性质,set里的值不会重复,只要去重就想到用Set
  • 遍历生成的10w个随机数,这里假设随机数是1~100之间的,每遍历一个数据就判断一下set里是否已经存有,若没有则存入set,若有则进行下一个数据的检查

代码:

import java.util.ArrayList;

import java.util.HashSet;

import java.util.Random;


public class 去除10w个数据中的重复数据 {

   public static void main(String[] args) {

       Random random = new Random();

       ArrayList<Integer> list = new ArrayList<Integer>();//将随机生成的10w个数据存到顺序表中

       for (int i = 0; i < 100000; i++) {

           list.add(random.nextInt(100));//生成0~100之间的随机数

       }


       HashSet<Integer> set = new HashSet();//创建一个HashSet容器,存放数据

       //由于Set的性质,里面的元素不会重复,将顺序表里的数据存进这个容器就可以达到去除重复数据的目的了

       for (int i = 0 ; i< list.size(); i++){

           set.add(list.get(i));

       }

       System.out.println("不重复的数据有:"+set.size()+"个");

       System.out.println(set);

   }

}



运行结果:

b12.png


在10w个数据中找到第一个重复的数据

思路:

  • 和去重方法一样,用set,每遍历一个数据就检查set里是否已经存在这个数据,若不存在,则存入set,若已经存在,则说明已经找到第一次出现重复的数据了

代码:import java.util.ArrayList;

import java.util.HashSet;

import java.util.Random;


public class 在10w个数据中找到第一个重复的数据 {

   public static void main(String[] args) {

       Random random = new Random();

       ArrayList<Integer> list = new ArrayList<Integer>();//将随机生成的10w个数据存到顺序表中

       for (int i = 0; i < 100000; i++) {

           list.add(random.nextInt(100));//生成0~100之间的随机数

       }


       HashSet<Integer> set = new HashSet<Integer>();//还是用set


       for (int i = 0; i < list.size(); i++) {

           if (set.contains(list.get(i))) {//如果set里已经有此数据

               System.out.println(list.get(i));//输出,这就是第一个重复的数据

               break;//找到第一个从重复数据就可以退出了

           }else {

               set.add(list.get(i));//否则把新数据加入到set里

           }

       }

   }

}


运行结果:

b13.png


统计10w个数据重复出现的次数

思路:


统计重复次数的题,首先想到就是map,利用map的性质,键值对,一 一对应的关系

遍历数据,若map里没有这个数据,则加入到map里,并给 key–value里 的value初始化为1,代表出现了1次

后续再次遍历到这个数据的时候,value值+1,表示重复次数+1

代码:

import java.util.ArrayList;

import java.util.HashMap;

import java.util.Map;

import java.util.Random;


public class 统计10w个数据重复出现的次数 {

   public static void main(String[] args) {

       Random random = new Random();

       ArrayList<Integer> list = new ArrayList<Integer>();//将随机生成的10w个数据存到顺序表中

       for (int i = 0; i < 10; i++) {

           list.add(random.nextInt(10));//生成0~100之间的随机数

       }


       //        数据    出现次数

       HashMap<Integer, Integer> map = new HashMap<Integer, Integer>();

       for (Integer key : list) {//循环遍历list

           if (map.get(key)==null){//如果map里找不到key(数据)对应的值(次数)

               map.put(key, 1);

           }else{//说明之前存过一次了

               int count = map.get(key);//count记录原来出现的次数

               map.put(key, count+1);//更新key出现的次数

           }

       }


       //输出每个数据的重复次数

       System.out.println(map.entrySet());//entrySet()返回的是一个set,里面存放的是键值对(key和value的映射关系)


       //  Map.Entry<Integer, Integer>是一个内部类    map.entrySet()返回的是一个set集合

       for (Map.Entry<Integer, Integer> entry : map.entrySet()){

           System.out.println("数据:"+entry.getKey()+"   "+"出现次数:"+entry.getValue());

       }


   }

}


运行结果:

数据已经简化,方便观看

b14.png



相关文章
|
1天前
|
Java 编译器 开发者
Java中的this关键字详解:深入理解与应用
本文深入解析了Java中`this`关键字的多种用法
26 9
|
1天前
|
Java 应用服务中间件 API
【潜意识Java】javaee中的SpringBoot在Java 开发中的应用与详细分析
本文介绍了 Spring Boot 的核心概念和使用场景,并通过一个实战项目演示了如何构建一个简单的 RESTful API。
19 5
|
1天前
|
人工智能 自然语言处理 搜索推荐
【潜意识Java】了解并详细分析Java与AIGC的结合应用和使用方式
本文介绍了如何将Java与AIGC(人工智能生成内容)技术结合,实现智能文本生成。
19 5
|
1天前
|
SQL Java 数据库连接
【潜意识Java】深入理解MyBatis,从基础到高级的深度细节应用
本文详细介绍了MyBatis,一个轻量级的Java持久化框架。内容涵盖MyBatis的基本概念、配置与环境搭建、基础操作(如创建实体类、Mapper接口及映射文件)以及CRUD操作的实现。此外,还深入探讨了高级特性,包括动态SQL和缓存机制。通过代码示例,帮助开发者更好地掌握MyBatis的使用技巧,提升数据库操作效率。总结部分强调了MyBatis的优势及其在实际开发中的应用价值。
10 1
|
28天前
|
安全 算法 Java
Java CAS原理和应用场景大揭秘:你掌握了吗?
CAS(Compare and Swap)是一种乐观锁机制,通过硬件指令实现原子操作,确保多线程环境下对共享变量的安全访问。它避免了传统互斥锁的性能开销和线程阻塞问题。CAS操作包含三个步骤:获取期望值、比较当前值与期望值是否相等、若相等则更新为新值。CAS广泛应用于高并发场景,如数据库事务、分布式锁、无锁数据结构等,但需注意ABA问题。Java中常用`java.util.concurrent.atomic`包下的类支持CAS操作。
64 2
|
1月前
|
存储 缓存 安全
Java 集合江湖:底层数据结构的大揭秘!
小米是一位热爱技术分享的程序员,本文详细解析了Java面试中常见的List、Set、Map的区别。不仅介绍了它们的基本特性和实现类,还深入探讨了各自的使用场景和面试技巧,帮助读者更好地理解和应对相关问题。
49 5
|
1月前
|
监控 Java 数据库连接
Java线程管理:守护线程与用户线程的区分与应用
在Java多线程编程中,线程可以分为守护线程(Daemon Thread)和用户线程(User Thread)。这两种线程在行为和用途上有着明显的区别,了解它们的差异对于编写高效、稳定的并发程序至关重要。
48 2
|
1月前
|
算法
你对Collection中Set、List、Map理解?
你对Collection中Set、List、Map理解?
72 18
你对Collection中Set、List、Map理解?
|
1月前
|
存储 缓存 安全
只会“有序无序”?面试官嫌弃的List、Set、Map回答!
小米,一位热衷于技术分享的程序员,通过与朋友小林的对话,详细解析了Java面试中常见的List、Set、Map三者之间的区别,不仅涵盖了它们的基本特性,还深入探讨了各自的实现原理及应用场景,帮助面试者更好地准备相关问题。
63 20
|
2月前
|
存储 C++ 容器
【C++】map、set基本用法
本文介绍了C++ STL中的`map`和`set`两种关联容器。`map`用于存储键值对,每个键唯一;而`set`存储唯一元素,不包含值。两者均基于红黑树实现,支持高效的查找、插入和删除操作。文中详细列举了它们的构造方法、迭代器、容量检查、元素修改等常用接口,并简要对比了`map`与`set`的主要差异。此外,还介绍了允许重复元素的`multiset`和`multimap`。
45 3
【C++】map、set基本用法