1.标准I/O缓冲区

要理解标准I/O,就要先知道文件I/O的业务逻辑。

下面图示为文件I/O

对文件 I/O,标准 I/O 的缓冲的理解-LMLPHP

如执行下面的代码:

write(fd, buf2, sizeof(buf2));

图中

buf:就是buf2。

缓冲区:是文件系统的页缓存。

当执行写操作时,buf中的数据会被复制到内核空间的页缓冲区,如果使用的是同步写,那么数据会从页缓冲写到磁盘,如果使用的是延迟写,那么数据不会立即写入磁盘,只有当页缓冲区满了,或者页缓冲区被其他I/O使用时,才会写入磁盘。

当执行读操作时,磁盘数据先被复制到页缓冲,进程再从页缓冲中取数据,当页缓冲空间大小大于用户要求读取的数据量时,文件系统会假设用户紧接着会读取后面连续的数据,所以会将随后的数据预先载入页缓冲,这样用户下次读时,就可以直接从页缓冲中读取。

标准I/O的不足就是 buf 的大小不一定等于页缓冲区的大小,当 buf 的大小小于页缓冲区的大小时,一次写后页缓冲区并没有被填满,便进行了一次磁盘访问。文件I/O对此进行了改进。

2.文件I/O缓冲区

文件I/O的图示如下:

对文件 I/O,标准 I/O 的缓冲的理解-LMLPHP

我们知道文件I/O是对文件流对象进行操作的,FILE 中重要的数据结构就是:文件描述符、指向缓冲区的指针。

文件I/O多了一个缓冲区,该缓冲区由 malloc分配,在用户空间,并且它的大小和内核页缓冲区的大小匹配。

当执行全缓冲的写操作时,buf中的数据先复制到流缓冲区中,当流缓冲区填充满后,再复制到内核页缓冲区,然后访问磁盘,写入数据。

当执行读操作时,第一次读操作:数据从磁盘复制到页缓冲,再从页缓冲复制到流缓冲,进程从流缓冲中复制需要的数据,由于每个流都有自己的流缓冲,那么当页缓冲中数据被刷掉后,进程不需要调用read函数,而只需要读自己的流缓冲区中预先读取的数据。

文件I/O提高速率的方法就是:尽量让流缓冲区填满后,再将数据传送给内核的页缓冲区,这样每次访问磁盘,都可以最大效率的传送数据。

3.实验证明效率

用三种不同的函数,完成读文件后写到标准输出的工作。

对文件 I/O,标准 I/O 的缓冲的理解-LMLPHP

对文件 I/O,标准 I/O 的缓冲的理解-LMLPHP

对文件 I/O,标准 I/O 的缓冲的理解-LMLPHP

对文件 I/O,标准 I/O 的缓冲的理解-LMLPHP

05-11 21:42
查看更多