基于Linux 2.6.32内核进行分析,看本篇文章前,建议先看看percpu变量这篇文章
smp_processor_id()用来获取当前cpu的id,首先来看smp_processor_id的定义:
# define smp_processor_id() raw_smp_processor_id()
接下来:
#define raw_smp_processor_id() (percpu_read(cpu_number))
有必要解释一下这里的cpu_number的由来:
DEFINE_PER_CPU(int, cpu_number);//每个CPU的cpuid是放置在cpu_number这个percpu变量中
后面最终调用了:
percpu_from_op("mov", per_cpu__##var, "m" (per_cpu__##var)) // 这里的var为cpu_number
这个宏展开后,实质上等价于:
#define percpu_from_op(op, var, constraint) ({ typeof(per_cpu_cpu_number) ret__; switch (sizeof(per_cpu_cpu_number)) { case 4: asm(“movl %%fs:%P1, %0" //在64位体系结构下为 movl %%gs:%P1, %0 : "=r" (ret__) : "m" (per_cpu_cpu_number)); break; ... })
这里fs寄存器里面是什么东西?为什么这里就可以获取到cpu的id?请看完后文后到这里进行回答:
smp_processor_id实际要去读取的是cpu_number这个percpu变量,因为在系统初始化的时候,把每个cpu的id都设置到了cpu_number这个percpu变量中,请看代码:
setup_per_cpu_areas() { for_each_possible_cpu(cpu) { ..... per_cpu(cpu_number, cpu) = cpu;//看到没,在这里设置进去了,等下我们就要去取里面的内容 setup_percpu_segment(cpu); ..... } }
至于per_cpu的实现,请参考文章开头给出的那篇文章。总之这里就是把各个CPU的cpuid设置到了cpu_number这个percpu变量中。这里是为了给大家说明:我们不是要去cpu_number里面取cpuid吗?那什么时候放进去的呢。现在大家明白了吧。
接下来正真看fs寄存器里有什么东西:
//在/arch/x86/kernel/head_32.S中 movl $(__KERNEL_PERCPU), %eax movl %eax,%fs //fs段寄存器指向GDT的27偏移项
那GDT的27偏移项描述符是谁呢?
static inline void setup_percpu_segment(int cpu) { #ifdef CONFIG_X86_32 struct desc_struct gdt; pack_descriptor(&gdt, per_cpu_offset(cpu), 0xFFFFF, 0x2 | DESCTYPE_S, 0x; gdt.s = 1; write_gdt_entry(get_cpu_gdt_table(cpu), GDT_ENTRY_PERCPU, &gdt, DESCTYPE_S); #endif }
这里设置的在 GDT 表中的偏移 GDT_ENTRY_PERCPU 与 前面fs的__KERNEL_PERCPU一样都为27,所以fs段选择子对应的GDT描述符项基地址为per_cpu_offset(cpu)。也就是说每个CPU的fs段选择子都是一样的27,但是设置的段描述符的基地址每个CPU都是不一样的(因为base指定为per_cpu_offset(cpu))。
再回到最开始的嵌入式汇编:
asm("movb %%fs:%P1, %0" :"=q"(ret__) :"m"(per_cpu__cpu_number));
不难看出:per_cpu_offset[cpu] + &per_cpu__cpu_number 便得到了相应 cpu 的每 per_cpu__cpu_number变量的地址,与正常percpu变量存取方式不同,cpu_number的offset是通过GDT表项得到的。关于 per_cpu_offset数组的由来 请参考 setup_per_cpu_areas 函数。
整个smp_processor_id()取CPUid的示意图:
FQA:
这是因为此时的fs引用的GDT描述符的base为0(此时GDT的GDT_ENTRY_PERCPU描述符base为0,参考arch/x86/kernel/cpu/common.c:DEFINE_PER_CPU_PAGE_ALIGNED),smp_processor_id()直接引用cpu_number的地址来获取cpuid,cpu_number在编译时分配到.data.percpu段,所以此时smp_processor_id返回为0。且此时 AP (应用处理器)还没有启动,BP(引导处理器)完成启动,所以就是 cpu 0。
/* Initialize the CPU's GDT. This is either the boot CPU doing itself (still using the master per-cpu area), or a CPU doing it for a secondary which will soon come up. */ __cpuinit void init_gdt(int cpu) { struct desc_struct *gdt = get_cpu_gdt_table(cpu); pack_descriptor((u32 *)&gdt[GDT_ENTRY_PERCPU].a,//依然在27(GDT_ENTRY_PERCPU)偏移项 (u32 *)&gdt[GDT_ENTRY_PERCPU].b, __per_cpu_offset[cpu], 0xFFFFF, 0x80 | DESCTYPE_S | 0x2, 0x8); per_cpu(this_cpu_off, cpu) = __per_cpu_offset[cpu]; per_cpu(cpu_number, cpu) = cpu; }
参考整个系统GDT:
- ——- start of kernel segments: *
- 12 - kernel code segment <==== new cacheline
- 13 - kernel data segment
- 14 - default user CS
- 15 - default user DS
- 16 - TSS
- 17 - LDT
- 18 - PNPBIOS support (16->32 gate)
- 19 - PNPBIOS support
- 20 - PNPBIOS support
- 21 - PNPBIOS support
- 22 - PNPBIOS support
- 23 - APM BIOS support
- 24 - APM BIOS support
- 25 - APM BIOS support *
- 26 - ESPFIX small SS
- 27 - per-cpu [ offset to per-cpu data area ]
- 28 - stack_canary-20 [ for stack protector ]
- 29 - unused
- 30 - unused
- 31 - TSS for double fault handler