Python 的列表解析式,集合解析式,字典解析式

这三种都是 python 里面的语法糖。

语法糖,Syntactic Sugar,就是为了写程序时候少出错,发明的一些简便的方法,但不影响这个语法的功能。

(我第一反应是 HP 里面的 chocolate frog,哈哈哈)

1. 列表解析式 list comprehension

通常我们定义有内容 list 时,想对内容进行一些计算再放进去,除了使用 for 循环迭代出列表内的元素,进行计算再放进去,还可以在列表内直接写解析式计算。

1.1 普通版:[expression for i in iterable]

比如,要求 1-10 的每个数字的算术平方根组成的集合。

用 for 循环的话:

lst = []
for i in range(1, 11):
i = i ** 0.5 #不用pow()是因为这样计算比较快
lst.append(i)

这样看起来就比较繁琐。

用列表解析式的话,就相当于把上面的内容都浓缩起来:

lst = [ i**0.5 for i in range(1,11) ]

这样看起来就很清爽,前面是要对 i 做的处理,后面是 i 从哪里迭代,这些都用中括号 [ ] 括起来,是生成一个列表。

1.2 进阶版 [expression for i in iterable if… for j in iterable if… …]

前面还是表达式,但是后面写的是双循环,还有判断条件,就是符合条件的再进前面的表达式。

比如,我想要 5 以内的单数,和 5 以内双数组成的所有二元组,然后把这些元组放在一个列表里。

用 for 循环的话:

lst = []
for i in range(1,6):
if i % 2 == 0:
continue
for j in range(1,6):
if j % 2 == 0:
lst.append((i,j)) lst
[(1, 2), (1, 4), (3, 2), (3, 4), (5, 2), (5, 4)]

巨繁琐,但是如果用列表解析式的话:

[(i,j) for i in range(1,6) if i % 2 for j in range(1,6) if not j % 2]
[(1, 2), (1, 4), (3, 2), (3, 4), (5, 2), (5, 4)]
#减量不减价,你值得拥有。

但是要注意,列表解析式里不能有 elif 等比较复杂的语法结构,如果实在不行,还是用 for 循环吧。

而且一定要注意效率,怎么用 if 来筛选数据。比如:

[(i,j) for i in range(1,6) if i % 2 for j in range(1,6) if not j % 2]

[(i,j) for i in range(1,6) for j in range(1,6) if i % 2 if not j % 2]
[(i,j) for i in range(1,6) for j in range(1,6) if i % 2 == 0 and j % 2 != 0]
#前者的效率要略高,因为前者在第一个循环时就做了判断,不符合的话,就不用迭代第二个循环。
#第二个和第三个是一个类型,两个if就是嵌套解构
#而且一定要注意逻辑,看自己想要的到底是什么

还有列表解析式前面的 expression 得是有输出的,这个输出的结果才能放进列表里。

[print(i) for i in range(3)]
0
1
2
[None, None, None]
#i倒是会出现,但这是print的功能,print没有返回值,所以列表里面全都是None。

2. 集合解析式

普通版:{expression for i in iterable}

进阶版 {expression for i in iterable if… for j in iterable if… …}

用法和列表解析式是一样的,就是把中括号 [] 换成大括号 {}

需要注意得是,集合解析式,最终生成的也是集合,集合里面的元素必须是 hashable。所以这样是不行的:

{ [i] for i in range(5) }
#这样生成的元素都是list,不可hash,会报错

集合解析式也能自动去重(不能就怪了):

{i for i in [1,1,1,1,1,1]}
{1}

3. 字典解析式

用法还是和前两者一样,区别就是:用 { } 包起来,而且前面的 expression 得是 key:value 的形式。

{i:[j] for i in range(3) for j in 'abc'}
{0: ['c'], 1: ['c'], 2: ['c']} #注意key是去重的,所以第一个循环的元素带入第二个循环时,会与第二个循环的最后一个元素组成key:value #key必须可hash,但是value不需要hashable,所以value可以用可变的数据结构
04-16 22:36