2.1 文件描述符
对于内核而言,所有打开文件都由文件描述符引用。文件描述符是一个非负整数。当打开 一个现存文件或创建一个新文件时,内核向进程返回一个文件描述符。当读、写一个文件时, 用open或creat返回的文件描述符标识该文件,将其作为参数传送给 read或write。
UNIX shell使文件描述符0与进程的标准输入相结合,文件描述符 1与标准输出 相结合,文件描述符2与标准出错输出相结合。
幻数 0、1、2应被代换成符号常数 STDIN _ FILENO、STDOUT _ FILENO和STDERR_FILENO。
2.2 open函数
调用open函数可以打开或创建一个文件。
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
//返回:若成功为文件描述符,若出错为- 1
//由open返回的文件描述符一定是最小的未用描述符数字
int open(const char *pathname , int oflag,.../*, mode_t mode * /) ;
对于open函数而言,仅当创建新文件时才使用第三个参数。
pathname是要打开或创建的文件的名字。oflag参数可用来说明此函数的多个选择项。用下列一个或多个常数进行或运算构成oflag参数(这些常数定义在<fcntl . h>头文件中):
- O_RDONLY 只读打开。
- O_WRONLY 只写打开。
- O_RDWR 读、写打开。
这三个常数中只能指定一个。下列常数是可选择的:
- O_APPEND 每次写时都加到文件的尾端。
- O_CREAT 若此文件不存在则创建它。使用此选择项时,需同时说明第三个参数 mode, 用其说明该新文件的存取许可权位。
- O_EXCL 如果同时指定了O_CREAT,而文件已经存在,则出错。这可测试一个文件是 否存在,如果不存在则创建此文件成为一个原子操作。
- O_TRUNC 如果此文件存在,而且为只读或只写成功打开,则将其长度截短为 0。
- O_NOCTTY 如果pathname指的是终端设备,则不将此设备分配作为此进程的控制终端。
- O_NONBLOCK 如果pathname指的是一个FIFO、一个块特殊文件或一个字符特殊文件, 则此选择项为此文件的本次打开操作和后续的 I / O操作设置非阻塞方式。
- O_SYNC 使每次write都等到物理I / O操作完成。
2.3 create函数
creat函数创建一个新文件。
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
//返回:若成功为只写打开的文件描述符,若出错为- 1
int creat(const char *pathname, mode_t mode) ;
//这个函数等效于:
open (pathname, O_WRONLY|O_CREAT|O_TRUNC, mode) ;
2.4 close函数
用close函数关闭一个打开文件:
#include <unistd.h>
int close (int filedes);
关闭一个文件时也释放该进程加在该文件上的所有记录锁。当一个进程终止时,它所有的打开文件都由内核自动关闭。
2.5 lseek函数
每个打开文件都有一个与其相关联的“当前文件位移量”。它是一个非负整数,用以度量 从文件开始处计算的字节数。一般来说,读、写操作都从当前文件位移量处开始,并使位移量增加所读或写的字节数。按系统默认,当 打开一个文件时,除非指定O_APPEND选择项,否则该位移量被设置为0。
可以调用lseek显式地定位一个打开文件。
#include <sys/types.h>
#include <unistd.h>
//返回:若成功为新的文件位移,若出错为- 1
off_t lseek(int filedes, off_t offset, int whence) ;
对参数offset 的解释与参数whence的值有关。
- 若whence是SEEK_SET,则将该文件的位移量设置为距文件开始处offset 个字节。
- 若whence是SEEK_CUR,则将该文件的位移量设置为其当前值加offset, offset可为正或负。
- 若whence是SEEK_END,则将该文件的位移量设置为文件长度加offset, offset可为正或负。
- 若lseek成功执行,则返回新的文件位移量,为此可以用下列方式确定一个打开文件的当前位移量:
off_t currpos;
currpos = lseek(fd, 0, SEEK_CUR);
这种方法也可用来确定所涉及的文件是否可以设置位移量。如果文件描述符引用的是一个管道或FIFO,则lseek返回-1,并将errno设置为EPIPE。
2.6 read函数
#include <unistd.h>
//返回:读到的字节数,若已到文件尾为 0,若出错为-1
ssize_t read(int filedes, void *buff, size_t nbytes) ;
如read成功,则返回读到的字节数。如已到达文件的尾端,则返回 0。 有多种情况可使实际读到的字节数少于要求读字节数:
- 读普通文件时,在读到要求字节数之前已到达了文件尾端。例如,若在到达文件尾端之前还有30个字节,而要求读100个字节,则read返回30,下一次再调用read时,它将返回0 (文件 尾端)。
- 当从终端设备读时,通常一次最多读一行。
- 当从网络读时,网络中的缓冲机构可能造成返回值小于所要求读的字节数。
- 某些面向记录的设备,例如磁带,一次最多返回一个记录。 读操作从文件的当前位移量处开始,在成功返回之前,该位移量增加实际读得的字节数。
2.7 write函数
#include <unistd.h>
//返回:若成功为已写的字节数,若出错为- 1
ssize_t write(int filedes, const void * buff, size_t nbytes) ;
其返回值通常与参数nbytes的值不同,否则表示出错。write出错的一个常见原因是:磁盘已写满,或者超过了对一个给定进程的文件长度限制。
2.8 文件共享
UNIX支持在不同进程间共享打开文件。内核使用了三种I/O的数据结构,它们之间的关系决定了在文件共享方面一个进程对另一个进程 可能产生的影响。
(1)每个进程在进程表中都有一个记录项,每个记录项中有一张打开文件描述符表,可将其视为一个矢量,每个描述符占用一项。与每个文件描述符相关联的是:
(a)文件描述符标志。
(b)指向一个文件表项的指针。
(2)内核为所有打开文件维持一张文件表。每个文件表项包含:
(a)文件状态标志(读、写、增写、同步、非阻塞等)。
(b)当前文件位移量。
(c)指向该文件v节点表项的指针。
(3)每个打开文件(或设备)都有一个 v节点结构。 v节点包含了文件类型和对此文件进行各种操作的函数的指针信息。对于大多数文件, v节点还包含了该文件的i节点(索引节点)。这些信息是在打开文件时从盘上读入内存的,所以所有关于文件的信息都是快速可供使用的。例如, i节点包含了文件的所有者、文件长度、文件所在的设备、指向文件在盘上所使用的实际数据块的指针等等。
如果两个独立进程各自打开了同一文件,则有下图中所示的安排。我们假定第一个进程使该文件在文件描述符 3上打开,而另一个进程则使此文件在文件描述符 4上打开。打开此文件的每个进程都得到一个文件表项,但对一个给定的文件只有一个 v节点表项。每个进程都有自己的文件表项的一个理由是:这种安排使每个进程都有它自己的对该文件的当前位移量。
- 在完成每个write后,在文件表项中的当前文件位移量即增加所写的字节数。如果这使当前文件位移量超过了当前文件长度,则在i节点表项中的当前文件长度被设置为当前文件位移 量(也就是该文件加长了)。
- 如果用O_APPEND标志打开了一个文件,则相应标志也被设置到文件表项的文件状态标志中。每次对这种具有添写标志的文件执行写操作时,在文件表项中的当前文件位移量首先被设置为i节点表项中的文件长度。这就使得每次写的数据都添加到文件的当前尾端处。
- lseek函数只修改文件表项中的当前文件位移量,没有进行任何 I / O操作。
- 若一个文件用lseek被定位到文件当前的尾端,则文件表项中的当前文件位移量被设置为 i 节点表项中的当前文件长度。 可能有多个文件描述符项指向同一文件表项。
2.9 原子操作
2.9.1 添加至一个文件
假定有两个独立的进程A和B,都对同一文件进行添加操作。每个进程都已打开了该文件, 但未使用O_APPEND标志。此时每个进程都有它自己的文件表项,但是共享一个v节点表项。假定进程A调用了lseek,进程B也调用了lseek,这时如果有一个进程写了数据,那么文件的长度就会发生改变,就会影响另一个进程的操作。
UNIX提供了一种方法使这种操作成为原子操作,其方法就是在打开文件时设置 O_APPEND标志。使内核每次对这种文件进行写之前,都将进程的当前位移量设置到该文件的尾端处,于是在每次写之前就不再需要调用 lseek。
2.10 dup和dup2函数
两个函数都可用来复制一个现存的文件描述符:
#include <unistd.h>
//两函数的返回:若成功为新的文件描述符,若出错为- 1
int dup(int filedes) ;
int dup2(int filedes, int filedes2) ;
由dup返回的新文件描述符一定是当前可用文件描述符中的最小数值。用dup2则可以用filedes2参数指定新描述符的数值。如果filedes2已经打开,则先将其关闭。如若filedes等于filedes2,则dup2返回filedes2,而不关闭它。
2.11 fcntl函数
fcntl函数可以改变已经打开文件的性质。
#include <sys/types.h>
#include <unistd.h>
#include <fcntl.h>
//返回:若成功则依赖于cmd,若出错为-1
int fcntl(int filedes, int cmd,.../* int arg * / ) ;
fcntl函数有五种功能:
• 复制一个现存的描述符(cmd=F_DUPFD)。
• 获得/设置文件描述符标记(cmd = F_GETFD或F_SETFD)。
• 获得/设置文件状态标志(cmd = F_GETFL或F_SETFL)。
• 获得/设置异步I / O有权(cmd = F_GETOWN或F_SETOWN)。
• 获得/设置记录锁(cmd = F_GETLK , F_SETLK或F_SETLKW)。
2.12 ioctl函数
ioctl 函数是I / O操作的杂物箱。不能用本章中其他函数表示的 I / O操作通常都能用ioctl表示。 终端I / O是ioctl 的最大使用方面。
#include <unistd.h>
#include <sys/ioctl.h>
//返回:若出错则为- 1,若成功则为其他值
int ioctl(int f i l e d e s, int re q u e s t, . . . ) ;
2.13 /dev/fd
比较新的系统都提供名为 /dev/fd的目录,其目录项是名为 0、1、2等的文件。打开文件/dev/fd/n等效于复制描述符n。
fd = open("/dev/fd/0", mode);