文章目录
本篇为指针系列的最后一篇,我们将在该篇 vlog 对指针的常见表达形式的概念及技巧进行深入的解析,通过该篇 vlog 可以让你以后在遇到指针时基本都能将代码转化为自己的语言去理解,建议先思考后再看解析,更有助于加深理解,希望能够为广大读者们在初学指针时排忧解惑 😃
1. sizeof 和 strlen
1.1 sizeof
在初学C语言时就提到过 sizeof 的概念,这也是个常用的关键字,想必已经大家已经烂熟于心
回顾提示:sizeof(类型)、sizeof 表达式
这里不做过多赘述,忘记的可以去看我往期的文章回顾:
1.2 strlen
前面在举指针的例子的时候,提到过 strlen ,是用来计算字符串长度的
头文件为 #include <string.h> , strlen 是专门用于计算字符串长度的,strlen 从 str 这个参数的地址开始向后,统计 \0 之前的字符串个数,只要没遇到 \0 就不会停止,直到找到为止,所以可能存在越界查找的情况
通过一个例子就能明白:
#include <stdio.h>
int main()
{
char arr1[3] = {'a', 'b', 'c'};
char arr2[] = "abc";
printf("%d\n", strlen(arr1));
printf("%d\n", strlen(arr2));
printf("%d\n", sizeof(arr1));
printf("%d\n", sizeof(arr2));
return 0;
}
运行代码后可以发现结果为 35,3,3,4
字符没有 \0 ,所以 strlen 找不到停止的标志,就会产生一个随机值
可以总结出以下几点:
2. 数组和指针结合的试题深入解析
以下代码均在 x64 环境下运行,地址大小为 8 ,地址保持不变
2.1 一维数组
int a[] = {1,2,3,4};
1.printf("%zd\n",sizeof(a));
2.printf("%zd\n",sizeof(a+0));
3.printf("%zd\n",sizeof(*a));
4.printf("%zd\n",sizeof(a+1));
5.printf("%zd\n",sizeof(a[1]));
6.printf("%zd\n",sizeof(&a));
7.printf("%zd\n",sizeof(*&a));
8.printf("%zd\n",sizeof(&a+1));
9.printf("%zd\n",sizeof(&a[0]));
10.printf("%zd\n",sizeof(&a[0]+1));
解析:
2.2 字符数组
代码1
char arr[] = {'a','b','c','d','e','f'};
1.printf("%zd\n", sizeof(arr));
2.printf("%zd\n", sizeof(arr+0));
3.printf("%zd\n", sizeof(*arr));
4.printf("%zd\n", sizeof(arr[1]));
5.printf("%zd\n", sizeof(&arr));
6.printf("%zd\n", sizeof(&arr+1));
7.printf("%zd\n", sizeof(&arr[0]+1));
解析:
代码2
char arr[] = {'a','b','c','d','e','f'};
1.printf("%d\n", strlen(arr));
2.printf("%d\n", strlen(arr+0));
3.printf("%d\n", strlen(*arr));
4.printf("%d\n", strlen(arr[1]));
5.printf("%d\n", strlen(&arr));
6.printf("%d\n", strlen(&arr+1));
7.printf("%d\n", strlen(&arr[0]+1));
解析:
代码3
char arr[] = "abcdef";
1.printf("%zd\n", sizeof(arr));
2.printf("%zd\n", sizeof(arr+0));
3.printf("%zd\n", sizeof(*arr));
4.printf("%zd\n", sizeof(arr[1]));
5.printf("%zd\n", sizeof(&arr));
6.printf("%zd\n", sizeof(&arr+1));
7.printf("%zd\n", sizeof(&arr[0]+1));
解析:
代码4
char arr[] = "abcdef";
1.printf("%d\n", strlen(arr));
2.printf("%d\n", strlen(arr+0));
3.printf("%d\n", strlen(*arr));
4.printf("%d\n", strlen(arr[1]));
5.printf("%d\n", strlen(&arr));
6.printf("%d\n", strlen(&arr+1));
7.printf("%d\n", strlen(&arr[0]+1));
解析:
代码5
char *p = "abcdef";
1.printf("%zd\n", sizeof(p));
2.printf("%zd\n", sizeof(p+1));
3.printf("%zd\n", sizeof(*p));
4.printf("%zd\n", sizeof(p[0]));
5.printf("%zd\n", sizeof(&p));
6.printf("%zd\n", sizeof(&p+1));
7.printf("%zd\n", sizeof(&p[0]+1));
解析:
代码6
char *p = "abcdef";
1.printf("%d\n", strlen(p));
2.printf("%d\n", strlen(p+1));
3.printf("%d\n", strlen(*p));
4.printf("%d\n", strlen(p[0]));
5.printf("%d\n", strlen(&p));
6.printf("%d\n", strlen(&p+1));
7.printf("%d\n", strlen(&p[0]+1));
解析:
2.3 二维数组
int a[3][4] = {0};
1.printf("%zd\n",sizeof(a));
2.printf("%zd\n",sizeof(a[0][0]));
3.printf("%zd\n",sizeof(a[0]));
4.printf("%zd\n",sizeof(a[0]+1));
5.printf("%zd\n",sizeof(*(a[0]+1)));
6.printf("%zd\n",sizeof(a+1));
7.printf("%zd\n",sizeof(*(a+1)));
8.printf("%zd\n",sizeof(&a[0]+1));
9.printf("%zd\n",sizeof(*(&a[0]+1)));
10.printf("%zd\n",sizeof(*a));
11.printf("%zd\n",sizeof(a[3]));
解析:
3.指针运算的试题深入解析
题1
#include <stdio.h>
int main()
{
int a[5] = { 1, 2, 3, 4, 5 };
int *ptr = (int *)(&a + 1);
printf( "%d,%d", *(a + 1), *(ptr - 1));
return 0;
}
//程序的结果是什么?
解析:
*对于 (a + 1):
数组名a在大多数情况下会被隐式转换为指向数组首元素的指针,所以 a + 1 就是将指向首元素的指针向后移动一个元素的位置,*(a + 1) 则是获取这个移动后指针所指向的元素,也就是数组a的第二个元素,其值为 2
*对于 (ptr - 1):
ptr 是指向数组a所占内存空间之后的下一个位置,那么 ptr - 1 就是将这个指针向前移动一个元素的位置,*(ptr - 1) 就是获取这个移动后指针所指向的元素,也就是数组a的最后一个元素,其值为 5
题2
//在X86环境下
//假设结构体的⼤⼩是20个字节
//程序输出的结果是啥?
struct Test
{
int Num;
char *pcName;
short sDate;
char cha[2];
short sBa[4];
}*p = (struct Test*)0x100000;
//定义了一个指向 Test 结构体的指针 p,并将其初始化为内存地址 0x100000
int main()
{
printf("%p\n", p + 0x1);
printf("%p\n", (unsigned long)p + 0x1);
printf("%p\n", (unsigned int*)p + 0x1);
return 0;
}
第一次输出:
将各成员所占字节数相加:4 + 4 + 2 + 2 + 8 = 20 字节
所以当 p + 0x1 时,指针会按照结构体大小移动,即从初始地址 0x100000 移动到 0x100000 + 20×1 = 0x100014,这里输出的结果应该是 0x100014
第二次输出:
这里将结构体指针 p 强制转换为 unsigned long 类型,然后进行加法运算,当把指针转换无符号长整型后,就不再按照结构体的大小进行指针移动的运算了,而是单纯的数值加法,因为 p 被初始化为 0x100000,将其视为无符号长整型并加上 0x1,得到的结果就0x100001,这里输出的结果应该是 0x100001
第三次输出:
这里将结构体指针 p 强制转换为 unsigned int* 类型的指针,然后进行加法运算,当 unsigned int* 类型的指针进行算术运算时,指针移动的步长是根据 unsigned int 类型的大小来确定的,在一般情况下,unsigned int 类型占 4 个字节,所以当 (unsigned int*)p + 0x1 时,指针会从初始地址 0x100000 移动到 0x100000 + 4×1 = 0x100004,这里输出的结果应该是 0x100004
题3
#include <stdio.h>
int main()
{
int a[3][2] = { (0, 1), (2, 3), (4, 5) };
int *p;
p = a[0];
printf( "%d", p[0]);
return 0;
}
解析:
题4
//假设环境是x86环境,程序输出的结果是啥?
#include <stdio.h>
int main()
{
int a[5][5];
int(*p)[4];
p = a;
printf( "%p,%d\n", &p[4][2] - &a[4][2], &p[4][2] - &a[4][2]);
return 0;
}
解析:
int(*p)[4], p = a 的图示
题5
#include <stdio.h>
int main()
{
int aa[2][5] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 };
int *ptr1 = (int *)(&aa + 1);
int *ptr2 = (int *)(*(aa + 1));
printf( "%d,%d", *(ptr1 - 1), *(ptr2 - 1));
return 0;
}
解析:
int *ptr1 = (int *)(&aa + 1), int *ptr2 = (int )((aa + 1)) 如图所示
*对于 (ptr1 - 1):
ptr1 是指向数组 aa 所占内存空间之后的下一个位置,那么 ptr1 - 1 就是将这个指针向左移动一个元素的位置,*(ptr1 - 1) 就是获取这个移动后指针所指向的元素,也就是数组 aa 的最后一个元素,其值为 10
*对于 (ptr2 - 1):
ptr2 是指向二维数组 aa 的第二行,那么 ptr2 - 1 就是将这个指针向左移动一个元素的位置,*(ptr2 - 1) 就是获取这个移动后指针所指向的元素,也就是二维数组 aa 的第一行的第五个元素,其值为 5
题6
#include <stdio.h>
int main()
{
char *a[] = {"work","at","alibaba"};
char**pa = a;
pa++;
printf("%s\n", *pa);
return 0;
}
解析:
char *a[ ] = {“work”,“at”,“alibaba”}, char**pa = a 如图所示
题7
#include <stdio.h>
int main()
{
char *c[] = {"ENTER","NEW","POINT","FIRST"};
char**cp[] = {c+3,c+2,c+1,c};
char***cpp = cp;
printf("%s\n", **++cpp);
printf("%s\n", *--*++cpp+3);
printf("%s\n", *cpp[-2]+3);
printf("%s\n", cpp[-1][-1]+1);
return 0;
}
解析:
如图所示
第一次输出:
- 首先,++cpp 会使 cpp 指针自增,它现在指向 cp 数组中的第二个元素(也就是原来 cp[1] 的地址)。
- 然后,*cpp 会取出 cpp 所指向的元素,即 cp[1],它是指向 c + 2 的指针(也就是指向字符串 “POINT” 的指针)。
- 最后,**cpp 再次间接访问,得到的就是字符串 “POINT”,所以这个 printf 语句会输出 “POINT”
第二次输出:
- 先看 ++cpp,这会使 cpp 再次自增,现在它指向 cp 数组中的第三个元素(原来 cp[2] 的地址)
- 然后 *++cpp 取出 cpp 所指向的元素,即 cp[2],它是指向 c + 1 的指针(指向字符串 “NEW” 的指针)
- 接着 --*++cpp 会对 cp[2] 所指向的指针(也就是指向字符串 “NEW” 的指针)进行自减操作,此时它指向了字符串 “NEW” 中的倒数第二个字符(假设字符串以 \0 结尾,那么就是指向 ‘W’ 的指针)
- 最后 –++cpp + 3 会先取出这个新指向的字符(‘W’),然后再往后偏移 3 个字符,此时就指向了字符串 “NEW” 中的倒数第一个字符(‘W’ 往后 3 个字符,也就是 ‘W’ 本身,因为字符串 “NEW” 较短),所以这个 printf 语句会输出 “EW”
第三次输出:
- cpp[-2] 相当于 *(cpp - 2),因为前面 cpp 经过两次自增,现在要往回找两个位置,所以 cpp[-2] 指向的是原来 cp[0] 的地址
- *cpp[-2] 取出 cpp[-2] 所指向的元素,即 cp[0],它是指向 c + 3 的指针(指向字符串 “FIRST” 的指针)
- *cpp[-2] + 3 会在指向字符串 “FIRST” 的指针基础上往后偏移 3 个字符,所以会指向字符串 “FIRST” 中的第 4 个字符,因此这个 printf 语句会输出 “ST”
第四次输出:
- cpp[-1] 相当于 *(cpp - 1),因为前面 cpp 经过两次自增,现在往回找一个位置,所以 cpp[-1] 指向的是原来 cp[1] 的地址
- cpp[-1][-1] 相当于 ((cpp - 1) - 1),也就是先找到 cp[1](指向 c + 2 的指针,指向字符串 “POINT” 的指针),然后再对这个指针进行自减操作,此时它指向了字符串 “POINT” 中的倒数第二个字符
- cpp[-1][-1] + 1 会在指向 ‘N’ 的指针基础上往后偏移 1 个字符,所以会指向字符串 “POINT” 中的倒数第一个字符(‘N’ 往后 1 个字符,也就是 ‘T’ 的指针),因此这个 printf 语句会输出 “NT”