复合页(Compound Page)就是将物理上连续的两个或多个页看成一个

     独立的大页,它能够用来创建hugetlbfs中使用的大页(hugepage)。

     也能够用来创建透明大页(transparent huge page)子系统。可是

     它不能用在页缓存(page cache)中,这是由于页缓存中管理的都是

     单个页。





     分配一个复合页的方式是:使用alloc_pages函数,參数order至少为1,

     且设置__GFP_COMP标记。由于依据复合页的定义,它通常包含2个或多

     个连续的物理内存页,这是由它的实现决定的,因而order參数不可能

     为0。





     通常调用alloc_pages的内存分配方式例如以下:

     p = alloc_pages(GFP_KERNEL, 2);

可是这样的方式和创建一个复合页有什么不同呢?不同点就是在创建复合

     页的时候会创建与这个复合页相关的元数据(metadata)。

表示复合页的元数据都存在于Page结构体中,Page页中的flag标记用来

     识别复合页。

在复合页中,打头的第一个普通页成为“head page”,用

     PG_head标记,而后面的全部页被称为“tail pages”,用PG_tail标记。

     在64位系统中,能够有多余的标记来表示复合页的页头和页尾;可是在

     32位系统中却没有那么多的标记,因此採用了一种复用其它标记的方案,

     即将复合页中的全部页都用PG_compound标记,然后,对于尾页同一时候也

     使用PG_reclaim标记。这是由于PG_reclaim仅仅有在页缓存中会用到,而

复合页根本就不会在页缓存中使用。

能够使用PageCompound函数来检測一个页是否是复合页,另外函数PageHead

     和函数PageTail用来检測一个页是否是页头或者页尾。

在每一个尾页的page

     结构体中都包括一个指向头页的指针 - first_page,能够使用compound_head

     函数获得。





     那么当一个复合页不再被系统使用时,我们怎样知道该复合页包括多少

     个普通页。又怎样知道该复合页的析构函数(destructor)存在哪里呢?

     首先,人们可能会觉得这些信息存在于头页的page结构体中,可是非常不

     幸,在这个结构体中已经没有可用的空间了。

因此,这些信息所有存储

     在第一个尾页的lru字段中,将该复合页的大小(order)首先强制转换

     为指针类型,然后存储在lru.prev中,将析构函数存储在lru.next中。

这里就解释了为什么复合页必须至少是两个页。





     在内核中生命了两个复合页的析构函数。默认情况下会调用free_compound_page

     来将全部的页返回给系统的页框分配器。而hugetlbfs子系统会调用free_huge_page

     来做一些统计并释放。





     使用复合页的最经典的一个样例就是THP(transparent huge page)。

     另外一些驱动使用复合页来方便缓存的管理。





ref

===

1. https://lwn.net/Articles/619514/

05-12 05:33