io函数一般分为两大类:
- 系统(不带缓存)调用: 如read、write、open
- 标准(带缓存)调用: fread、fwrite、fopen
上面说的带缓存/不带缓存是针对用户态的,内核态本身都是带缓存的(由操作系统实现)
系统调用的流程:当对文件/套接字进行write时,都会先写到内核所设的缓冲存储器。如果该缓存未满,则并不将其排入输出队列,直到缓存写满或者内核再次需要重新使用此缓存时才将其排入磁盘I/O输入队列,再进行实际的I/O操作,也就是此时才把数据真正写到磁盘,这种技术叫延迟写。
标准调用的流程:在用户态内存中多实现了一层缓冲区,缓冲区大小及收放管理都由标准库代为实现。当第一次调用fread的时候,先从文件/套接字读取大段(可能比需要的多)到内核缓冲区,再从内核缓冲区读到用户态内存缓冲区;当第二次、第三次读取的时候,很有可能就直接从用户态内存缓冲区读取,而不需要进行系统调用。
系统调用与标准调用区别:
- 系统I/O对文件描述符操作,标准I/O是针对流的。文件描述符只是个整数;而流是对象
- 系统I/O每次都有系统调用,多次操作延迟会较大;标准I/O偶尔(比如第一次)需要进行2次复制,但很多时候不需要进行系统调用
标准调用也分三种缓存管理方法:
1) 全缓存。当填满标准I/O缓存、显示调用fflush、进程exit后才执行I/O操作。磁盘上的文件通常是全缓存的。
2) 行缓存。当输入输出遇到新行符或缓存满时、显示调用fflush、进程exit后,才由标准I/O库执行实际I/O操作。stdin、stdout通常是行缓存的。
3) 无缓存。相当于read、write了。stderr通常是无缓存的,因为它必须尽快输出。