Python 集合

简介: 到目前为止, 我们已经学习了 Python 中常见的几种组合数据类型:字符串、列表、 元组、字典和集合,如表所示。集合类型与数学中集合的概念是一致的。它是由 0 个或多个唯一的、不可变的元素构成的无序组合。虽然集合中的元素必须是不可变类型,但是集合本身是可变的,可以添加、删除和清空集合元素。与列表、字典一样, 集合是可变类型。函数创建一个集合, 或者用花括号将一系列以逗号隔开的元素包裹起来创建。集合中的元素是不可重复的, 常常用于检查某个元素是否存在。集合的元素不能是可变类型,例如列表、字典或者集合本身。
✅作者简介:人工智能专业本科在读,喜欢计算机与编程,写博客记录自己的学习历程。
🍎个人主页: 小嗷犬的博客
🍊个人信条:为天地立心,为生民立命,为往圣继绝学,为万世开太平。
🥭本文内容:Python 集合

1.集合及基本操作

集合类型与数学中集合的概念是一致的。它是由 0 个或多个唯一的、不可变的元素构成的无序组合。和字典一样,集合也是通过一对花括号 {}来标识的。

集合中的元素是不可重复的, 常常用于检查某个元素是否存在。

集合的元素不能是可变类型,例如列表、字典或者集合本身。

虽然集合中的元素必须是不可变类型,但是集合本身是可变的,可以添加、删除和清空集合元素。

1.1 创建集合

可以使用 set()函数创建一个集合, 或者用花括号将一系列以逗号隔开的元素包裹起来创建。
language = set(['C', 'C++', 'Java', 'Python'])
print(language)
在 Python 中使用 {}创建的是空字典, 而不是空集合。 创建空集合应该使用 set()函数。
print(type({}))

1.2 利用集合去重

集合的重要特征之一就是元素不重复。 因此, 当使用 set()函数将其他可迭代对象转换为集合时,该函数会自动过滤掉重复元素。
print(set('我是小嗷犬,喜欢嗷嗷嗷'))

1.3 交集、并集、差集和补集

除了判断成员资格和去重外,集合还有四个常用的操作:交集( &)、并集( |)、差集 ( )、补集( ^), 操作逻辑与数学定义相同。A、B 两个集合的运算示意图如图所示, 阴影部分是运算结果。
集合运算
language1 = {'C', 'C++', 'Java', 'Python'}
language2 = {'C', 'C++', 'C#', 'Golang'}
print(language1 | language2)
print(language1 - language2)
print(language1 & language2)
print(language1 ^ language2)

2.集合的常用方法

集合也可以通过内置函数 len()得到元素个数, 通过 in检查某个元素是否存在, 通过 copy()方法复制集合。除此之外,还有一些特有的方法,如表所示。
函数或方法 描述
S.add(x) 如果数据项x不在集合S中,将x增加到s
S.clear() 移除S中所有数据项
S.copy() 返回集合S的一个拷贝
S.pop() 随机返回集合S中的一个元素,如果S为空,产生KeyError异常
S.discard(x) 如果x在集合S中,移除该元素;如果x不在,不报错
S.remove(x) 如果x在集合S中,移除该元素;不在,产生KeyError异常
S.isdisjoint(T) 如果集合S与T没有相同元素,返回True
len(S) 返回集合S元素个数
x in S 如果x是S的元素,返回True,否则返回False
x not in S 如果x不是S的元素,返回True,否则返回False

2.1 添加元素

与列表、字典一样, 集合是可变类型。 可以往集合中添加元素。 通过集合的 add()方法来实现。如果元素本身在集合中,则不添加。
language = {'C', 'C++', 'Java', 'Python'}
language.add('C')
print(language)
language.add('C#')
print(language)

2.2 删除元素

集合中有 pop()discard()remove()多个删除元素的方法。
language = {'C', 'C++', 'Java', 'Python'}
language.pop()
print(language)
language.discard('C#')
print(language)
language.remove('C++')
print(language)
language.remove('C#')

2.3 集合推导式

与字典推导式类似, 集合推导式使用的也是花括号 {}。 不同的是, 集合推导式在 for关键字前的表达式结果是一个元素,而不是键值对。语法形式如下:
{expression for item in iterable if condition}
l = ['C', 'C++', 'Java', 'Python']
language = {i for i in l if len(i) > 2}
print(language)

3.组合数据类型比较

到目前为止, 我们已经学习了 Python 中常见的几种组合数据类型:字符串、列表、 元组、字典和集合,如表所示。它们之间有许多的相同点和不同点。
类型 标识符 可变 有序 元素
字符串 ''或"" $×$ $\checkmark$ 字符
列表 [ ] $\checkmark$ $\checkmark$ 任意类型
元组 () $×$ $\checkmark$ 任意类型
字典 {} $\checkmark$ $×$ 键值对,键为不可变类型且不重复
集合 {} $\checkmark$ $×$ 任意不可变类型,不重复
目录
相关文章
|
3月前
|
数据处理 Python
彻底掌握Python集合:无序性、去重神器与高效集合运算指南
彻底掌握Python集合:无序性、去重神器与高效集合运算指南
101 1
|
24天前
|
数据采集 编解码 算法
Github | 推荐一个Python脚本集合项目
Github | 推荐一个Python脚本集合项目
|
23天前
|
索引 Python 容器
为什么Python中会有集合set类型?
为什么Python中会有集合set类型?
|
1月前
|
存储 索引 Python
五:《Python基础语法汇总》— 列表&元组&集合
本篇文章讲解了关于列表;元组和集合这三个基本数据类型的常用方法与函数。及同一性操作符;成员判断符;浅拷贝与深拷贝等多方面的知识点
24 4
|
1月前
|
算法 数据处理 Python
Python中的集合的运算
Python中的集合的运算
|
1月前
|
Python
python集合类型 (Set Types)
【8月更文挑战第3天】
53 9
|
1月前
|
Python
【Leetcode刷题Python】剑指 Offer II 082. 含有重复元素集合的组合
解决LeetCode平台《剑指 Offer II 082. 含有重复元素集合的组合》题目的Python代码实现,通过深度优先搜索算法找出所有和为特定目标值的数字组合,并在搜索过程中通过排序和跳过重复元素来避免解集中出现重复组合。
30 2
|
23天前
|
Python
python在列表、元素、字典、集合和numpy的数组前加上星号 * 是什么含义,以及*args和**kwargs的使用
python在列表、元素、字典、集合和numpy的数组前加上星号 * 是什么含义,以及*args和**kwargs的使用
24 0
|
30天前
|
数据挖掘 数据处理 Python
数据处理新纪元:Python集合内置方法让你告别繁琐,轻松驾驭海量数据!
【8月更文挑战第22天】本文通过电商用户购买数据案例,展示了Python集合在高效数据处理中的应用。首先,利用Pandas读取`purchase_data.csv`文件,并通过内置方法快速概览数据。接着,创建商品ID集合进行数据分析,运用集合的并集、交集及差集等运算揭示用户购买行为模式。最后,借助集合推导式精简创建用户购买商品集合的过程,全方位呈现集合的强大功能。
20 0
|
1月前
|
存储 数据挖掘 程序员
深入理解Python中的集合
【8月更文挑战第20天】
32 0