Python切片详解
一、 Python可切片对象的索引方式
包括:正索引和负索引两部分,如下图所示,以list对象a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]为例:
二、 Python切片操作的一般方式
1 切片操作基本表达式:object[start_index:end_index:step]
step:正负数均可,其绝对值大小决定了切取数据时的‘‘步长”,而正负号决定了“切取方向”,正表示“从左往右”取值,负表示“从右往左”取值。当step省略时,默认为1,即从左往右以步长1取值。“切取方向非常重要!”“切取方向非常重要!”“切取方向非常重要!”,重要的事情说三遍!
start_index:表示起始索引(包含该索引对应值);该参数省略时,表示从对象“端点”开始取值,至于是从“起点”还是从“终点”开始,则由step参数的正负决定,step为正从“起点”开始,为负从“终点”开始。
end_index:表示终止索引(不包含该索引对应值);该参数省略时,表示一直取到数据“端点”,至于是到“起点”还是到“终点”,同样由step参数的正负决定,step为正时直到“终点”,为负时直到“起点”
三、 Python切片操作详细例子
以下示例均以list对象a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]为例:
1 >>>a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
1. 切取单个元素
1 >>>a[0] 2 >>>0 3 >>>a[-4] 4 >>>6 5 当索引只有一个数时,表示切取某一个元素。
2. 切取完整对象
1 >>>a[:] #从左往右 2 >>> [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 3 >>>a[::]#从左往右 4 >>> [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 5 >>>a[::-1]#从右往左 6 >>> [9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
3. start_index和end_index全为正(+)索引的情况
1 >>>a[1:6] 2 >>> [1, 2, 3, 4, 5] 3 step=1,从左往右取值,start_index=1到end_index=6同样表示从左往右取值。
1 >>>a[1:6:-1] 2 >>> [] 3 输出为空列表,说明没取到数据。 4 step=-1,决定了从右往左取值,而start_index=1到end_index=6决定了从左往右取值,两者矛盾,所以为空。
1 >>>a[6:2] 2 >>> [] 3 同样输出为空列表。 4 step=1,决定了从左往右取值,而start_index=6到end_index=2决定了从右往左取值,两者矛盾,所以为空。
1 >>>a[:6] 2 >>> [0, 1, 2, 3, 4, 5] 3 step=1,表示从左往右取值,而start_index省略时,表示从端点开始,因此这里的端点是“起点”,即从“起点”值0开始一直取到end_index=6(该点不包括)。
1 >>>a[:6:-1] 2 >>> [9, 8, 7] 3 step=-1,从右往左取值,而start_index省略时,表示从端点开始,因此这里的端点是“终点”,即从“终点”值9开始一直取到end_index=6(该点不包括)。
1 >>>a[6:] 2 >>> [6, 7, 8, 9] 3 step=1,从左往右取值,从start_index=6开始,一直取到“终点”值9。
1 >>>a[6::-1] 2 >>> [6, 5, 4, 3, 2, 1, 0] 3 step=-1,从右往左取值,从start_index=6开始,一直取到“起点”0。
4. start_index和end_index全为负(-)索引的情况
1 >>>a[-1:-6] 2 >>> [] 3 step=1,从左往右取值,而start_index=-1到end_index=-6决定了从右往左取值,两者矛盾,所以为空。 4 索引-1在-6的右边(如上图)
1 >>>a[-1:-6:-1] 2 >>> [9, 8, 7, 6, 5] 3 step=-1,从右往左取值,start_index=-1到end_index=-6同样是从右往左取值。 4 索引-1在6的右边(如上图)
1 >>>a[-6:-1] 2 >>> [4, 5, 6, 7, 8] 3 step=1,从左往右取值,而start_index=-6到end_index=-1同样是从左往右取值。 4 索引-6在-1的左边(如上图)
1 >>>a[:-6] 2 >>> [0, 1, 2, 3] 3 step=1,从左往右取值,从“起点”开始一直取到end_index=-6(该点不包括)。
1 >>>a[:-6:-1] 2 >>> [9, 8, 7, 6, 5] 3 step=-1,从右往左取值,从“终点”开始一直取到end_index=-6(该点不包括)。
1 >>>a[-6:] 2 >>> [4, 5, 6, 7, 8, 9] 3 step=1,从左往右取值,从start_index=-6开始,一直取到“终点”。
1 >>>a[-6::-1] 2 >>> [4, 3, 2, 1, 0] 3 step=-1,从右往左取值,从start_index=-6开始,一直取到“起点”。
5. start_index和end_index正(+)负(-)混合索引的情况
1 >>>a[1:-6] 2 >>> [1, 2, 3] 3 start_index=1在end_index=-6的左边,因此从左往右取值,而step=1同样决定了从左往右取值,因此结果正确
1 >>>a[1:-6:-1] 2 >>> [] 3 start_index=1在end_index=-6的左边,因此从左往右取值,但step=-则决定了从右往左取值,两者矛盾,因此为空。
1 >>>a[-1:6] 2 >>> [] 3 start_index=-1在end_index=6的右边,因此从右往左取值,但step=1则决定了从左往右取值,两者矛盾,因此为空。
1 >>>a[-1:6:-1] 2 >>> [9, 8, 7] 3 start_index=-1在end_index=6的右边,因此从右往左取值,而step=-1同样决定了从右往左取值,因此结果正确。
6. 多层切片操作
1 >>>a[:8][2:5][-1:] 2 >>> [4] 3 相当于: 4 a[:8]=[0, 1, 2, 3, 4, 5, 6, 7] 5 a[:8][2:5]= [2, 3, 4] 6 a[:8][2:5][-1:] = [4] 7 理论上可无限次多层切片操作,只要上一次返回的是非空可切片对象即可。
7. 切片操作的三个参数可以用表达式
1 >>>a[2+1:3*2:7%3] 2 >>> [3, 4, 5] 3 即:a[2+1:3*2:7%3] = a[3:6:1]
8. 其他对象的切片操作
前面的切片操作以list对象为例进行说明,但实际上可进行切片操作的数据类型还有很多,包括元组、字符串等等。
1 >>> (0, 1, 2, 3, 4, 5)[:3] 2 >>> (0, 1, 2) 3 元组的切片操作
1 >>>'ABCDEFG'[::2] 2 >>>'ACEG' 3 字符串的切片操作
1 >>>for i in range(1,100)[2::3][-5:]: 2 print(i) 3 >>>87 4 90 5 93 6 96 7 99 8 就是利用range()函数生成1-99的整数,然后从start_index=2(即3)开始以step=3取值,直到终点,再在新序列中取最后五个数。
四、 常用切片操作
1.取偶数位置
1 >>>b = a[::2] 2 [0, 2, 4, 6, 8]
2.取奇数位置
1 >>>b = a[1::2] 2 [1, 3, 5, 7, 9]
3.拷贝整个对象
1 >>>b = a[:] # 2 >>>print(b) #[0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 3 >>>print(id(a)) #41946376 4 >>>print(id(b)) #41921864 5 或 6 >>>b = a.copy() 7 >>>print(b) #[0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 8 >>>print(id(a)) #39783752 9 >>>print(id(b)) #39759176
需要注意的是:[:]和.copy()都属于“浅拷贝”,只拷贝最外层元素,内层嵌套元素则通过引用方式共享,而非独立分配内存,如果需要彻底拷贝则需采用“深拷贝”方式,如下例所示:
1 >>>a = [1,2,['A','B']] 2 >>>print('a={}'.format(a)) 3 >>>b = a[:] 4 >>>b[0] = 9 #修改b的最外层元素,将1变成9 5 >>>b[2][0] = 'D' #修改b的内嵌层元素 6 >>>print('a={}'.format(a)) 7 >>>print('b={}'.format(b)) 8 >>>print('id(a)={}'.format(id(a))) 9 >>>print('id(b)={}'.format(id(b))) 10 a=[1, 2, ['A', 'B']] #原始a 11 a=[1, 2, ['D', 'B']] #b修改内部元素A为D后,a中的A也变成了D,说明共享内部嵌套元素,但外部元素1没变。 12 b=[9, 2, ['D', 'B']] #修改后的b 13 id(a)=38669128 14 id(b)=38669192
4.修改单个元素
1 >>>a[3] = ['A','B'] 2 [0, 1, 2, ['A', 'B'], 4, 5, 6, 7, 8, 9]
5.在某个位置插入元素
1 >>>a[3:3] = ['A','B','C'] 2 [0, 1, 2, 'A', 'B', 'C', 3, 4, 5, 6, 7, 8, 9] 3 >>>a[0:0] = ['A','B'] 4 ['A', 'B', 0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
6.替换一部分元素
1 >>>a[3:6] = ['A','B'] 2 [0, 1, 2, 'A', 'B', 6, 7, 8, 9]
五、 总结
(一)start_index、end_index、step三者可同为正、同为负,或正负混合。但必须遵循一个原则,即:当start_index表示的实际位置在end_index的左边时,从左往右取值,此时step必须是正数(同样表示从左往右);当start_index表示的实际位置在end_index的右边时,表示从右往左取值,此时step必须是负数(同样表示从右往左),即两者的取值顺序必须相同。
(二)当start_index或end_index省略时,取值的起始索引和终止索引由step的正负来决定,这种情况不会有取值方向矛盾(即不会返回空列表[]),但正和负取到的结果顺序是相反的,因为一个向左一个向右。
(三)step的正负是必须要考虑的,尤其是当step省略时。比如a[-1:],很容易就误认为是从“终点”开始一直取到“起点”,即a[-1:]= [9, 8, 7, 6, 5, 4, 3, 2, 1, 0],但实际上a[-1:]=[9](注意不是9),原因在于step省略时step=1表示从左往右取值,而起始索引start_index=-1本身就是对象的最右边元素了,再往右已经没数据了,因此结果只含有9一个元素。
(四)需要注意:“取单个元素(不带“:”)”时,返回的是对象的某个元素,其类型由元素本身的类型决定,而与母对象无关,如上面的a[0]=0、a[-4]=6,元素0和6都是“数值型”,而母对象a却是“list”型;“取连续切片(带“:”)”时,返回结果的类型与母对象相同,哪怕切取的连续切片只包含一个元素,如上面的a[-1:]=[9],返回的是一个只包含元素“9”的list,而非数值型“9”
作者:马尔代夫Maldives
链接:https://www.jianshu.com/p/15715d6f4dad