基于Linux 2.6.32内核进行分析,看本篇文章前,建议先看看percpu变量这篇文章

smp_processor_id()用来获取当前cpu的id,首先来看smp_processor_id的定义:

# define smp_processor_id() raw_smp_processor_id()

接下来:

#define raw_smp_processor_id() (percpu_read(cpu_number))

有必要解释一下这里的cpu_number的由来:

DEFINE_PER_CPU(int, cpu_number);//每个CPU的cpuid是放置在cpu_number这个percpu变量中

后面最终调用了:

percpu_from_op("mov", per_cpu__##var, "m" (per_cpu__##var))
// 这里的var为cpu_number

这个宏展开后,实质上等价于:

#define percpu_from_op(op, var, constraint)
({
    typeof(per_cpu_cpu_number) ret__;
    switch (sizeof(per_cpu_cpu_number)) {
    case 4:
        asm(“movl  %%fs:%P1, %0" //在64位体系结构下为 movl  %%gs:%P1, %0
            : "=r" (ret__)
            : "m" (per_cpu_cpu_number));
        break;
        ...
})

这里fs寄存器里面是什么东西?为什么这里就可以获取到cpu的id?请看完后文后到这里进行回答:

smp_processor_id实际要去读取的是cpu_number这个percpu变量,因为在系统初始化的时候,把每个cpu的id都设置到了cpu_number这个percpu变量中,请看代码:

setup_per_cpu_areas()
{
    for_each_possible_cpu(cpu) {
        .....
    	per_cpu(cpu_number, cpu) = cpu;//看到没,在这里设置进去了,等下我们就要去取里面的内容
        setup_percpu_segment(cpu);
        .....
    }
} 

至于per_cpu的实现,请参考文章开头给出的那篇文章。总之这里就是把各个CPU的cpuid设置到了cpu_number这个percpu变量中。这里是为了给大家说明:我们不是要去cpu_number里面取cpuid吗?那什么时候放进去的呢。现在大家明白了吧。

接下来正真看fs寄存器里有什么东西:

//在/arch/x86/kernel/head_32.S中
movl $(__KERNEL_PERCPU), %eax
movl %eax,%fs //fs段寄存器指向GDT的27偏移项

那GDT的27偏移项描述符是谁呢?

static inline void setup_percpu_segment(int cpu)
{
#ifdef CONFIG_X86_32
        struct desc_struct gdt;

        pack_descriptor(&gdt, per_cpu_offset(cpu), 0xFFFFF,
                        0x2 | DESCTYPE_S, 0x;
        gdt.s = 1;
        write_gdt_entry(get_cpu_gdt_table(cpu),
                        GDT_ENTRY_PERCPU, &gdt, DESCTYPE_S);
#endif
}

这里设置的在 GDT 表中的偏移 GDT_ENTRY_PERCPU 与 前面fs的__KERNEL_PERCPU一样都为27,所以fs段选择子对应的GDT描述符项基地址为per_cpu_offset(cpu)。也就是说每个CPU的fs段选择子都是一样的27,但是设置的段描述符的基地址每个CPU都是不一样的(因为base指定为per_cpu_offset(cpu))。

再回到最开始的嵌入式汇编:

asm("movb %%fs:%P1, %0"
        :"=q"(ret__)
        :"m"(per_cpu__cpu_number));

不难看出:per_cpu_offset[cpu] + &per_cpu__cpu_number 便得到了相应 cpu 的每 per_cpu__cpu_number变量的地址,与正常percpu变量存取方式不同,cpu_number的offset是通过GDT表项得到的。关于 per_cpu_offset数组的由来 请参考 setup_per_cpu_areas 函数。

整个smp_processor_id()取CPUid的示意图:

FQA:

这是因为此时的fs引用的GDT描述符的base为0(此时GDT的GDT_ENTRY_PERCPU描述符base为0,参考arch/x86/kernel/cpu/common.c:DEFINE_PER_CPU_PAGE_ALIGNED),smp_processor_id()直接引用cpu_number的地址来获取cpuid,cpu_number在编译时分配到.data.percpu段,所以此时smp_processor_id返回为0。且此时 AP (应用处理器)还没有启动,BP(引导处理器)完成启动,所以就是 cpu 0。

/* Initialize the CPU's GDT.  This is either the boot CPU doing itself
   (still using the master per-cpu area), or a CPU doing it for a
   secondary which will soon come up. */
__cpuinit void init_gdt(int cpu)
{
	struct desc_struct *gdt = get_cpu_gdt_table(cpu);

	pack_descriptor((u32 *)&gdt[GDT_ENTRY_PERCPU].a,//依然在27(GDT_ENTRY_PERCPU)偏移项
			(u32 *)&gdt[GDT_ENTRY_PERCPU].b,
			__per_cpu_offset[cpu], 0xFFFFF,
			0x80 | DESCTYPE_S | 0x2, 0x8);

	per_cpu(this_cpu_off, cpu) = __per_cpu_offset[cpu];
	per_cpu(cpu_number, cpu) = cpu;
}

参考整个系统GDT:

  • ——- start of kernel segments: *
  • 12 - kernel code segment <==== new cacheline
  • 13 - kernel data segment
  • 14 - default user CS
  • 15 - default user DS
  • 16 - TSS
  • 17 - LDT
  • 18 - PNPBIOS support (16->32 gate)
  • 19 - PNPBIOS support
  • 20 - PNPBIOS support
  • 21 - PNPBIOS support
  • 22 - PNPBIOS support
  • 23 - APM BIOS support
  • 24 - APM BIOS support
  • 25 - APM BIOS support *
  • 26 - ESPFIX small SS
  • 27 - per-cpu [ offset to per-cpu data area ]
  • 28 - stack_canary-20 [ for stack protector ]
  • 29 - unused
  • 30 - unused
  • 31 - TSS for double fault handler
02-12 15:43