1  集合(Set)的基本概念和特性

集合是一个无序的、不重复的元素序列。集合中的元素是唯一的,即集合中不会出现重复的元素。集合的主要作用是进行成员关系测试和消除重复元素。

集合的特性:

  • 无序:序列是有序的,但集合是无序的。
  • 唯一:集合中的元素是唯一的,即集合中不会出现重复的元素。

2  集合的创建

在Python中,可以使用大括号 {}set() 函数来创建集合。

# 使用大括号创建集合  
s1 = {1, 2, 3, 4, 5}  
print(s1)  # 输出:{1, 2, 3, 4, 5}  
  

# 使用set()函数创建集合  
s2 = set([1, 2, 2, 3, 4, 4, 5])  
print(s2)  # 输出:{1, 2, 3, 4, 5},注意重复元素被自动去除

在上面的代码中,我们展示了如何使用大括号和 set() 函数来创建集合。

首先,大括号 {} 可以直接用来创建集合,并将多个元素放入集合中。

其次,set() 函数也可以用来创建集合,它可以接收一个可迭代对象(比如列表、元组等),并返回一个新集合。值得注意的是,集合会自动去除其中的重复元素,所以即使我们向 set() 函数传入了一个包含重复元素的列表,返回的集合中也只会包含不重复的元素。 

3  集合的基本操作

集合提供了一系列操作,比如添加元素、删除元素、交集、并集、差集等。这些操作使得集合在处理一些特定问题时非常有用,比如去重、成员检测等。

3.1  添加元素

在Python中,add() 方法用于向集合中添加一个元素。如果元素已经存在于集合中,add() 方法不会抛出错误,也不会改变集合,因为集合中的元素是唯一的。

下面是一个使用 add() 方法向集合中添加元素的例子:

# 创建一个空集合  
s = set()  
  
# 使用 add() 方法添加元素  
s.add(1)  
s.add(2)  
s.add(3)  
  
# 打印集合  
print(s)  # 输出:{1, 2, 3}  
  
# 尝试添加已存在的元素  
s.add(2)  # 这个操作不会改变集合,因为2已经存在于集合中  
  
# 再次打印集合  
print(s)  # 输出仍然是:{1, 2, 3}

在上面的代码中,我们首先创建了一个空集合 s。然后,我们使用 add() 方法向集合中添加了三个元素:1、2 和 3。当我们尝试再次添加已经存在于集合中的元素(比如2)时,add() 方法不会改变集合的内容。最后,我们打印集合以验证元素已经被成功添加。

需要注意的是,由于集合是无序的,所以每次打印集合时元素的顺序可能会有所不同,但这并不影响集合中元素的唯一性和存在性。

3.2  删除元素

在Python中,remove() 方法用于从集合中删除指定的元素。如果元素不存在于集合中,remove() 方法会抛出一个 KeyError 异常。因此,在使用 remove() 方法之前,通常需要先检查元素是否存在于集合中,或者使用 discard() 方法来安全地删除元素,discard() 方法在元素不存在时不会抛出异常。

下面是使用 remove() 方法从集合中删除元素的例子:

# 创建一个集合  
s = {1, 2, 3, 4}  
  
# 使用 remove() 方法删除元素  
s.remove(3)  
  
# 打印集合  
print(s)  # 输出:{1, 2, 4},元素3已被删除  
  
# 尝试删除不存在的元素(这会抛出 KeyError)  
# s.remove(5)  # 这行代码会抛出 KeyError,因为5不在集合中  
  
# 更安全的做法是使用 discard() 方法  
# 它不会在元素不存在时抛出异常  
s.discard(5)  # 没有任何输出,因为5不在集合中,但也不会抛出异常  
  
# 再次打印集合以确认状态  
print(s)  # 输出仍然是:{1, 2, 4}

在上面的代码中,我们首先创建了一个包含四个元素的集合 s。然后,我们使用 remove() 方法删除了元素 3。之后,我们尝试删除一个不存在的元素(比如 5),这会抛出一个 KeyError 异常。为了避免这种异常,我们可以使用 discard() 方法,它会在元素不存在时安全地什么都不做。最后,我们打印集合以确认元素已经被成功删除,并且没有因为尝试删除不存在的元素而引发异常。

3.3  交集

在Python中,可以使用 & 运算符或 intersection() 方法来计算两个集合的交集,即同时存在于两个集合中的元素。

以下是使用&运算符和intersection()方法计算两个集合交集的示例:

# 创建两个集合  
set1 = {1, 2, 3, 4, 5}  
set2 = {4, 5, 6, 7, 8}  
  
# 使用 & 运算符计算交集  
intersection_using_and = set1 & set2  
print("使用 & 运算符计算的交集:", intersection_using_and)  # 输出:{4, 5}  
  
# 使用 intersection() 方法计算交集  
intersection_using_method = set1.intersection(set2)  
print("使用 intersection() 方法计算的交集:", intersection_using_method)  # 输出:{4, 5}

3.4  并集

使用 | 运算符或 union() 方法计算两个集合的并集。

s1 = {1, 2, 3, 4}  
s2 = {3, 4, 5, 6}  
print(s1 | s2)  # 输出:{1, 2, 3, 4, 5, 6}  
print(s1.union(s2))  # 输出:{1, 2, 3, 4, 5, 6}

3.5  差集

使用 - 运算符或 difference() 方法计算两个集合的差集(属于第一个集合但不属于第二个集合的元素)。

s1 = {1, 2, 3, 4}  
s2 = {3, 4, 5, 6}  
print(s1 - s2)  # 输出:{1, 2}  
print(s1.difference(s2))  # 输出:{1, 2}

3.6  对称差集

使用 ^ 运算符或 symmetric_difference() 方法计算两个集合的对称差集(属于第一个集合或属于第二个集合,但不同时属于两者的元素)。

s1 = {1, 2, 3, 4}  
s2 = {3, 4, 5, 6}  
print(s1 ^ s2)  # 输出:{1, 2, 5, 6}  
print(s1.symmetric_difference(s2))  # 输出:{1, 2, 5, 6}

4  集合的常用方法

Python的集合(set)数据类型提供了很多有用的方法来执行各种操作。除了之前提到的add(), remove(), 交集运算等,isdisjoint()issubset() 也是集合中常用的方法。

isdisjoint() 方法用于判断两个集合是否无交集,即它们没有共同的元素。如果两个集合没有交集,则返回 True,否则返回 False

issubset() 方法(或 <= 运算符)用于判断一个集合是否是另一个集合的子集。如果是,则返回 True,否则返回 False

# 创建两个集合  
set1 = {1, 2, 3}  
set2 = {3, 4, 5}  
set3 = {1, 2, 3, 4, 5}  
  
# 使用 isdisjoint() 方法判断集合是否无交集  
no_intersection = set1.isdisjoint(set2)  
print("set1 和 set2 是否无交集:", no_intersection)  # 输出:False,因为它们有共同的元素 3  
  
# 使用 issubset() 方法判断集合是否是子集  
is_subset = set1.issubset(set3)  
print("set1 是否是 set3 的子集:", is_subset)  # 输出:True,因为 set1 中的所有元素都在 set3 中  
  
# 也可以使用 <= 运算符来判断子集关系  
is_subset_operator = set1 <= set3  
print("使用 <= 运算符判断 set1 是否是 set3 的子集:", is_subset_operator)  # 输出:True

在这个例子中,set1set2 有一个共同的元素 3,所以它们不是无交集的,isdisjoint() 返回 False。而 set1 的所有元素都包含在 set3 中,所以 set1set3 的子集,issubset()<= 运算符都返回 True

这些方法在处理集合数据时非常有用,可以帮助我们快速判断集合之间的关系,从而进行进一步的操作或逻辑判断。

集合与其他数据类型的转换

集合还可以与其他数据类型进行转换。比如,我们可以使用 list() 函数将集合转换为列表,或者使用 tuple() 函数将集合转换为元组。这种转换在需要改变数据结构以适应不同场景时非常有用。

5.1  集合转列表

s = {1, 2, 3, 4}  
list_s = list(s)  
print(list_s)  # 输出:[1, 2, 3, 4]

5.2  集合转元组

s = {1, 2, 3, 4}  
tuple_s = tuple(s)  
print(tuple_s)  # 输出:(1, 2, 3, 4)

同样地,列表和元组也可以转换为集合,但需要注意的是,集合是无序的,所以转换后的集合元素的顺序可能与原列表或元组不同。

5.3  列表转集合

list_s = [1, 2, 2, 3, 4, 4]  
set_s = set(list_s)  
print(set_s)  # 输出:{1, 2, 3, 4},注意重复元素被去除

5.4  元组转集合

tuple_s = (1, 2, 3, 4)  
set_s = set(tuple_s)  
print(set_s)  # 输出:{1, 2, 3, 4}

集合在Python中是一个非常有用的数据类型,它提供了快速的成员检测功能,并且能自动去除重复元素。在处理一些需要快速判断元素是否存在的场景,或者需要去除重复元素的场景时,集合是一个非常好的选择。

03-13 11:31