系列目录

扩展并重载 GDT

本篇我们将在 kernel 中重新定义并扩展全局描述符表 GDT,并再次加载它。本篇的内容也会比较简单,更多的是对 x86 相关手册文档的查阅和熟悉。

GDT 在 loader 阶段我们已经初步定义并加载过一次,在那里我们只定义了 kernel 的 codedata 段,因为到目前为止,以及在后面相当长的一段时间里,我们始终处于 kernel 空间中,以 CPU 特权级 0 进行运行。但是作为一个 OS,最终是要运行并管理用户程序的,因此 GDT 中还需要加入用户态的 codedata 段。

另外我们也希望对前面的 GDT 重新整理一下,毕竟在汇编下比较混乱,很多数据结构管理起来不清晰。

创建 GDT

GDT 以及 segment 相关的知识,是 x86 体系架构的历史遗留产物,非常令人讨厌。但是 Intel 为了历史兼容,又不得不始终保留这些历史包袱。我们也不必花太多心思和脑筋在这上面,只要按照文档规范,把该填都填了,该写的都写了,轻轻带过就可以了。它并不是我们项目的核心部分。

按惯例,先给出代码链接,主要源文件是 src/mem/gdt.c

关于 GDT 的文档,你可以参考这里

首先我们需要定义 GDT entry 的数据结构:

struct gdt_entry {
  uint16 limit_low;
  uint16 base_low;
  uint8  base_middle;
  uint8  access;
  uint8  attributes;
  uint8  base_high;
} __attribute__((packed));
typedef struct gdt_entry gdt_entry_t;

它对应的是这样一个 64 bit 的结构:

其中 base 是指 segment 的内存基址,limit 则是长度,它可以有 1 或者 4KB 两种单位。

其余部分则是图二中展示的一些标志比特位,这里就不多费笔墨了,还是要对着文档仔细校对。

然后我们定义 GDT 表:

static gdt_entry_t gdt_entries[7];

我们这里分配了 7 个 entry:

  • 第 0 项保留;
  • 第一个是 kernelcode segment
  • 第二个是 kerneldata segment
  • 第三个是 video segment,这个不是必须的,可以无视;
  • 第四个是 usercode segment
  • 第五个是 userdata segment
  • 第六个是 tss

从第四个开始,都是用户态需要用到的。其中第六个 tss 目前不必深究,后面进入用户态时我们会回过来再细看这部分。

然后我们定义设置 GDT entry 的函数:

static void gdt_set_gate(
    int32 num, uint32 base, uint32 limit, uint8 access, uint8 flags) {
  gdt_entries[num].limit_low = (limit & 0xFFFF);
  gdt_entries[num].base_low = (base & 0xFFFF);
  gdt_entries[num].base_middle = (base >> 16) & 0xFF;
  gdt_entries[num].access = access;
  gdt_entries[num].attributes = (limit >> 16) & 0x0F;
  gdt_entries[num].attributes |= ((flags << 4) & 0xF0);
  gdt_entries[num].base_high = (base >> 24) & 0xFF;
}

对照着上面那幅图看就可以了。

将 GDT 表中的这些 entry 都设置上:

  // kernel code
  gdt_set_gate(1, 0, 0xFFFFF, DESC_P | DESC_DPL_0 | DESC_S_CODE | DESC_TYPE_CODE, FLAG_G_4K | FLAG_D_32);
  // kernel data
  gdt_set_gate(2, 0, 0xFFFFF, DESC_P | DESC_DPL_0 | DESC_S_DATA | DESC_TYPE_DATA, FLAG_G_4K | FLAG_D_32);
  // video: only 8 pages
  gdt_set_gate(3, 0, 7, DESC_P | DESC_DPL_0 | DESC_S_DATA | DESC_TYPE_DATA, FLAG_G_4K | FLAG_D_32);

  // user code
  gdt_set_gate(4, 0, 0xBFFFF, DESC_P | DESC_DPL_3 | DESC_S_CODE | DESC_TYPE_CODE, FLAG_G_4K | FLAG_D_32);
  // user data
  gdt_set_gate(5, 0, 0xBFFFF, DESC_P | DESC_DPL_3 | DESC_S_DATA | DESC_TYPE_DATA, FLAG_G_4K | FLAG_D_32);

对比 kerneluser 部分的差别,主要是两点:

  • Access Byte 中的 Privl:一共两个 bit 位,对 kernel 来说它是 00,而对 user 则是 11,它的含义是 DPL (Descriptor Privilege Level),代表的是访问这个 segment 需要的最小 CPU 特权级。

  • Limit:因为用户空间限制在了 3GB 以下,所以它的 Limit0xBFFFF,注意 FlagsGr (Granularity) 位是 1,所以 Limit 的 单位是 4KB,可以计算得到 (0xBFFFF + 1) * 4KB = 3GB

有了这两点限制,当 CPU 处于用户态时,它就无法访问 3GB 以上的 kernel 空间,这样 segment 机制的作用就发挥出来了。

重新加载 GDT

新的 GDT 准备就绪,接下来就是重新加载它,代码在 src/mem/gdt_load.S

load_gdt:
  mov eax, [esp + 4]
  lgdt [eax]

  mov ax, 0x10
  mov ds, ax
  mov es, ax
  mov fs, ax
  mov ss, ax

  mov ax, 0x18
  mov gs, ax

  jmp 0x08:.flush
.flush:
   ret

其中 load_gdt 在 C 源文件中声明如下:

extern void load_gdt(gdt_ptr_t*);

参数为 GDT 指针:

struct gdt_ptr {
  uint16 limit;
  uint32 base;
} __attribute__((packed));
typedef struct gdt_ptr gdt_ptr_t;

用指令 lgdt 加载 GDT 表,然后给各个 data 段寄存器,指向了 kernel data 段,偏移量为 0x10,因为它是 GDT 表中的第二项。

接着用一条 far jmp 指令 jmp 0x08:.flush,刷新了 cs 寄存器,使之指向 kernel code 段。注意 0x08 是因为 kernel code 段是 GDT 表中的第一项。

OK,至此新的 GDT 就加载完毕了。

03-05 23:58