Python 中列表的交集、并集、差集可以有两种方式,列表解析和 set 的函数



直接上代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
#!/usr/bin/env python
# -*- coding:utf-8 -*-
# Author: wxnacy([email protected])
# Description: 列表的交集、并集、差集

import random

def rand_int_arr(length):
arr = []
for i in range(length):
r = random.randrange(19)
arr.append(r)
return arr

def intersection1(a, b):
'''交集:使用列表解析'''
return list(set([i for i in a if i in b]))

def intersection2(a, b):
'''交集:使用自带函数'''
return list(set(a).intersection(set(b)))

def union1(a, b):
'''并集:使用列表相加'''
return list(set(a + b))

def union2(a, b):
'''并集:使用自带函数'''
return list(set(a).union(set(b)))

def difference1(a, b):
'''差集:使用列表解析'''
return list(set([i for i in a if i not in b]))

def difference2(a, b):
'''差集:使用自带函数'''
return list(set(a).difference(set(b)))


if __name__ == "__main__":
a = rand_int_arr(10)
b = rand_int_arr(10)
print(a)
print(b)
r1 = intersection1(a, b)
print('交集:使用列表解析', r1)
r2 = intersection2(a, b)
print('交集:使用自带函数', r2)
r3 = union1(a, b)
print('并集:使用列表相加', r3)
r4 = union2(a, b)
print('并集:使用自带函数', r4)
r5 = difference1(a, b)
print('差集:使用列表解析', r5)
r6 = difference2(a, b)
print('差集:使用自带函数', r6)

# [5, 8, 13, 0, 7, 16, 13, 2, 2, 7]
# [11, 10, 6, 17, 7, 13, 2, 16, 10, 13]
# 交集:使用列表解析 [16, 2, 13, 7]
# 交集:使用自带函数 [16, 2, 13, 7]
# 并集:使用列表相加 [0, 2, 5, 6, 7, 8, 10, 11, 13, 16, 17]
# 并集:使用自带函数 [0, 2, 5, 6, 7, 8, 10, 11, 13, 16, 17]
# 差集:使用列表解析 [8, 0, 5]
# 差集:使用自带函数 [0, 8, 5]

除了并集可以通过列表相加实现,其他的如果不用函数就需要用到列表解析,下面我们来对比下速度

将 a 和 b 的长度改为 10000,将随机数的幅度也改了 10000,运行以下程序

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
#!/usr/bin/env python
# -*- coding:utf-8 -*-
# Author: wxnacy([email protected])
# Description: 列表的交集、并集、差集

import random
import time

def rand_int_arr(length):
arr = []
for i in range(length):
r = random.randrange(10000)
arr.append(r)
return arr

def intersection1(a, b):
'''交集:使用列表解析'''
return list(set([i for i in a if i in b]))

def intersection2(a, b):
'''交集:使用自带函数'''
return list(set(a).intersection(set(b)))

def union1(a, b):
'''并集:使用列表相加'''
return list(set(a + b))

def union2(a, b):
'''并集:使用自带函数'''
return list(set(a).union(set(b)))

def difference1(a, b):
'''差集:使用列表解析'''
return list(set([i for i in a if i not in b]))

def difference2(a, b):
'''差集:使用自带函数'''
return list(set(a).difference(set(b)))


if __name__ == "__main__":
a = rand_int_arr(10000)
b = rand_int_arr(10000)
begin = time.clock()
r1 = intersection1(a, b)
print('交集:使用列表解析', time.clock() - begin)
begin = time.clock()
r2 = intersection2(a, b)
print('交集:使用自带函数', time.clock() - begin)
begin = time.clock()
r3 = union1(a, b)
print('并集:使用列表相加', time.clock() - begin)
begin = time.clock()
r4 = union2(a, b)
print('并集:使用自带函数', time.clock() - begin)
begin = time.clock()
r5 = difference1(a, b)
print('差集:使用列表解析', time.clock() - begin)
begin = time.clock()
r6 = difference2(a, b)
print('差集:使用自带函数', time.clock() - begin)

# 交集:使用列表解析 0.9532590000000001
# 交集:使用自带函数 0.002062999999999926
# 并集:使用列表相加 0.0010879999999999779
# 并集:使用自带函数 0.0022370000000000445
# 差集:使用列表解析 0.9966799999999998
# 差集:使用自带函数 0.0014449999999999186

通过这个结果看,列表解析和函数相比,还是函数的速度快很多,并且不是一个量级的,而在并集中列表相加则比函数要快一些,但是幅度并不大。

03-16 19:53