【Java数据结构】Map&Set的理解与应用（附面试题加深理解）-阿里云开发者社区

搜索

概念及场景

Map和set是一种专门用来进行搜索的容器或者数据结构，其搜索的效率与其具体的实例化子类有关。

以前常见的搜索方式有：

直接遍历，时间复杂度为O(N)，元素如果比较多效率会非常慢

二分查找，时间复杂度为O(log2 N) ,但搜索前必须要求序列是有序的

上述排序比较适合静态类型的查找，即一般不会对区间进行插入和删除操作了，而现实中的查找比如：

根据姓名查询考试成绩

通讯录，即根据姓名查询联系方式

不重复集合，即需要先搜索关键字是否已经在集合中

可能在查找时进行一些插入和删除的操作，即动态查找，那上述两种方式就不太适合了，本文介绍的Map和Set是一种适合动态查找的集合容器。

模型

一般把搜索的数据称为关键字（Key），和关键字对应的称为值（Value），将其称之为Key-value的键值对，所以模型会有两种：

纯 key 模型，比如：

有一个英文词典，快速查找一个单词是否在词典中

快速查找某个名字在不在通讯录中

Key-Value 模型，比如：

统计文件中每个单词出现的次数，统计结果是每个单词都有与其对应的次数：<单词，单词出现的次数>

梁山好汉的江湖绰号：每个好汉都有自己的江湖绰号

而Map中存储的就是key-value的键值对，Set中只存储了Key。

Map的使用

关于Map的说明

Map是一个接口类，该类没有继承自Collection，该类中存储的是<K,V>结构的键值对，并且K一定是唯一的，不能重复。

Map 的常用方法说明

注意：

Map是一个接口，不能直接实例化对象，如果要实例化对象只能实例化其实现类TreeMap或者HashMap

Map中存放键值对的Key是唯一的，value是可以重复的

在Map中插入键值对时，key可以为空，value可以为空

Map中的Key可以全部分离出来，存储到Set中来进行访问(因为Key不能重复)。

Map中的value可以全部分离出来，存储在Collection的任何一个子集合中(value可能有重复)。

Map中键值对的Key不能直接修改，value可以修改，如果要修改key，只能先将该key删除掉，然后再来进行重新插入。

TreeMap和HashMap的区别

关于Map.Entry<K, V>的说明

Map.Entry<K, V> 是Map内部实现的用来存放<key, value>键值对映射关系的内部类，该内部类中主要提供了<key, value>的获取，value的设置以及Key的比较方式。

注意：Map.Entry<K,V>并没有提供设置Key的方法

Set的说明

Set与Map主要的不同有两点：

Set是继承自Collection的接口类
Set中只存储了Key。

Set常见方法说明

注意：

1.Map是一个接口，不能直接实例化对象，如果要实例化对象只能实例化其实现类TreeMap或者HashMap

2.Map中存放键值对的Key是唯一的，value是可以重复的

3.在Map中插入键值对时，key可以为空，value可以为空

4.Map中的Key可以全部分离出来，存储到Set中来进行访问(因为Key不能重复)。

5.Map中的value可以全部分离出来，存储在Collection的任何一个子集合中(value可能有重复)。

6.Map中键值对的Key不能直接修改，value可以修改，如果要修改key，只能先将该key删除掉，然后再来进行重新插入。

7.TreeMap和HashMap的区别

关于Map.Entry<K, V>的说明

Map.Entry<K, V> 是Map内部实现的用来存放<key, value>键值对映射关系的内部类，该内部类中主要提供了<key, value>的获取，value的设置以及Key的比较方式。

注意：Map.Entry<K,V>并没有提供设置Key的方法

Set的说明

Set与Map主要的不同有两点：

Set是继承自Collection的接口类
Set中只存储了Key。

Set常见方法说明

注意：

1.Set是继承自Collection的一个接口类

2.Set中只存储了key，并且要求key一定要唯一

3.Set的底层是使用Map来实现的，其使用key与Object的一个默认对象作为键值对插入到Map中的

4.Set最大的功能就是对集合中的元素进行去重

5.实现Set接口的常用类有TreeSet和HashSet，还有一个LinkedHashSet,LinkedHashSet是在HashSet的基础上维护了一个双向链表来记录元素的插入次序。

6.Set中的Key不能修改，如果要修改，先将原来的删除掉，然后再重新插入

7.TreeSet和HashSet的区别

面试题练习

只出现一次的数字

思路：

我们知道Set的特点就是key不会重复，所以这题第一时间想到的就是用HashSet，每读取一个数据，就将其存入我们的set里，如果set已经有这个数据了，说明这是第二次出现了，就把原来存在set里的这个数据给删除掉，遍历完全部数据后，还存在于set里的就是只出现一次的数据了

代码:

class Solution {

public int singleNumber(int[] nums) {

HashSet<Integer> set = new HashSet<Integer>();

for(int i = 0 ; i < nums.length ; i++){

if(set.contains(nums[i])){

set.remove(nums[i]);

}else{

set.add(nums[i]);

}

for(int key:set){

return key;

}

return -1;

}

复制带随机指针的链表

思路：

题目要求进行深拷贝，所以就是说，我们要返回一个新的链表，新链表和原链表里的东西是一模一样的，但是互不相干，由于存在一一对应的关系，首先想到的就是用Map，原链表的节点就是key–value里的key，而新链表的节点就是value，两者形成了一一对应的关系，然后再利用map将原节点对应的next和random依次复制给新节点，具体看代码注释

代码：

// Definition for a Node.

class Node {

int val;

Node next;

Node random;

public Node(int val) {

this.val = val;

this.next = null;

this.random = null;

}

class Solution {

public Node copyRandomList(Node head) {

if(head==null) return null;

Node cur = head;//创建一个cur节点遍历原链表

HashMap<Node,Node> map = new HashMap<>();//建一个HashMap

while(cur!=null){//依次遍历原链表

Node copyNode = new Node(cur.val);//创建新节点，值和原链表中节点值一样

map.put(cur,copyNode);//将原链表的节点和新创建的值一样的节点放入Map中

cur = cur.next;

}

//已经将复制好的新节点和原节点按对应方式存入了map中

//最后需要利用map处理新节点的next和random

cur = head;

while(cur!=null){

//关键代码如下

map.get(cur).next = map.get(cur.next);

map.get(cur).random = map.get(cur.random);

cur = cur.next;

}

return map.get(head);

}

宝石与石头

思路：

遍历字符串 jewels，使用HashSet存储其中的字符，然后遍历字符串 stones，对于其中的每个字符，如果其在哈希集合（HashSet）中，则是宝石。

代码：

class Solution {

public int numJewelsInStones(String jewels, String stones) {

HashSet<Character> set = new HashSet<>();

for(int i = 0; i < jewels.length() ; i++){

set.add(jewels.charAt(i));

}

int count = 0;

for(int i = 0; i < stones.length() ; i++){

if(set.contains(stones.charAt(i)))

count++;

}

return count;

}

坏键盘打字

思路：

将实际输入的字符存入一个Set里，Set里的值不会重复，也就是说这个Set（setActul）里代表的就是好的键

遍历期望输入的字符串，如果setActual里边没有期望字符串里的字符，说明这个键是坏的，因为题目要求只输出一次坏的键，所以还需要用一个setBroken来记录坏的键，这样就不会重复输出坏的键了

代码：

import java.util.*;

public class 坏键盘 {

public static void main(String[] args) {

Scanner scan = new Scanner(System.in);

String str1 = scan.nextLine();//期望的

String str2 = scan.nextLine();//实际的

HashSet<Character> setActual = new HashSet<>();

for(char ch : str2.toUpperCase().toCharArray()) {

setActual.add(ch);//把实际的字符串放到一个set里

}

HashSet<Character> setBroken = new HashSet<>();

//再把坏了的键放到一个set里

for(char ch : str1.toUpperCase().toCharArray()) {//遍历期望的字符串

if(!setActual.contains(ch) && !setBroken.contains(ch)) {//在对比已经存在setActul里实际输入的字符串

setBroken.add(ch);

//这个ch就是坏了的

//setBroken里只存一次这个坏了的键，存的时候同时打印一次

System.out.print(ch);

}

10w个数据去除重复数据

思路：

原理就是利用Set的性质，set里的值不会重复，只要去重就想到用Set
遍历生成的10w个随机数，这里假设随机数是1~100之间的，每遍历一个数据就判断一下set里是否已经存有，若没有则存入set，若有则进行下一个数据的检查

代码：

import java.util.ArrayList;

import java.util.HashSet;

import java.util.Random;

public class 去除10w个数据中的重复数据 {

public static void main(String[] args) {

Random random = new Random();

ArrayList<Integer> list = new ArrayList<Integer>();//将随机生成的10w个数据存到顺序表中

for (int i = 0; i < 100000; i++) {

list.add(random.nextInt(100));//生成0~100之间的随机数

}

HashSet<Integer> set = new HashSet();//创建一个HashSet容器，存放数据

//由于Set的性质，里面的元素不会重复，将顺序表里的数据存进这个容器就可以达到去除重复数据的目的了

for (int i = 0 ; i< list.size(); i++){

set.add(list.get(i));

}

System.out.println("不重复的数据有："+set.size()+"个");

System.out.println(set);

}

运行结果：

在10w个数据中找到第一个重复的数据

思路：

和去重方法一样，用set，每遍历一个数据就检查set里是否已经存在这个数据，若不存在，则存入set，若已经存在，则说明已经找到第一次出现重复的数据了

代码：import java.util.ArrayList;

import java.util.HashSet;

import java.util.Random;

public class 在10w个数据中找到第一个重复的数据 {

public static void main(String[] args) {

Random random = new Random();

ArrayList<Integer> list = new ArrayList<Integer>();//将随机生成的10w个数据存到顺序表中

for (int i = 0; i < 100000; i++) {

list.add(random.nextInt(100));//生成0~100之间的随机数

}

HashSet<Integer> set = new HashSet<Integer>();//还是用set

for (int i = 0; i < list.size(); i++) {

if (set.contains(list.get(i))) {//如果set里已经有此数据

System.out.println(list.get(i));//输出，这就是第一个重复的数据

break;//找到第一个从重复数据就可以退出了

}else {

set.add(list.get(i));//否则把新数据加入到set里

}

运行结果：

统计10w个数据重复出现的次数

思路：

统计重复次数的题，首先想到就是map，利用map的性质，键值对，一一对应的关系

遍历数据，若map里没有这个数据，则加入到map里，并给 key–value里的value初始化为1，代表出现了1次

后续再次遍历到这个数据的时候，value值+1，表示重复次数+1

代码：

import java.util.ArrayList;

import java.util.HashMap;

import java.util.Map;

import java.util.Random;

public class 统计10w个数据重复出现的次数 {

public static void main(String[] args) {

Random random = new Random();

ArrayList<Integer> list = new ArrayList<Integer>();//将随机生成的10w个数据存到顺序表中

for (int i = 0; i < 10; i++) {

list.add(random.nextInt(10));//生成0~100之间的随机数

}

// 数据出现次数

HashMap<Integer, Integer> map = new HashMap<Integer, Integer>();

for (Integer key : list) {//循环遍历list

if (map.get(key)==null){//如果map里找不到key（数据）对应的值（次数）

map.put(key, 1);

}else{//说明之前存过一次了

int count = map.get(key);//count记录原来出现的次数

map.put(key, count+1);//更新key出现的次数

}

//输出每个数据的重复次数

System.out.println(map.entrySet());//entrySet()返回的是一个set，里面存放的是键值对（key和value的映射关系）

// Map.Entry<Integer, Integer>是一个内部类 map.entrySet()返回的是一个set集合

for (Map.Entry<Integer, Integer> entry : map.entrySet()){

System.out.println("数据："+entry.getKey()+" "+"出现次数:"+entry.getValue());

}

运行结果：

数据已经简化，方便观看

【Java数据结构】Map&Set的理解与应用（附面试题加深理解）

搜索

概念及场景

模型

Map的使用

关于Map的说明

Map 的常用方法说明

TreeMap和HashMap的区别

关于Map.Entry<K, V>的说明

Set的说明

Set常见方法说明

关于Map.Entry<K, V>的说明

Set的说明

Set常见方法说明

面试题练习

复制带随机指针的链表

宝石与石头

坏键盘打字

10w个数据去除重复数据

在10w个数据中找到第一个重复的数据

统计10w个数据重复出现的次数

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

【Java数据结构】Map&Set的理解与应用（附面试题加深理解）

搜索

概念及场景

模型

Map的使用

关于Map的说明

Map 的常用方法说明

TreeMap和HashMap的区别

关于Map.Entry<K, V>的说明

Set的说明

Set常见方法说明

关于Map.Entry<K, V>的说明

Set的说明

Set常见方法说明

面试题练习

复制带随机指针的链表

宝石与石头

坏键盘打字

10w个数据去除重复数据

在10w个数据中找到第一个重复的数据

统计10w个数据重复出现的次数

热门文章

最新文章

相关课程

相关电子书