我有一个生产者/消费者设置:我们的客户向我们提供服务器处理的数据,我们的客户通过不断写入文件来向服务器提供数据。我们的服务器使用inotify查找任何文件修改,并处理新数据。

问题:服务器中的文件阅读器具有大小为4096的缓冲区。我已经进行了模拟上述情况的单元测试。测试不断地将其写入打开的文件,文件读取器会不断尝试读取该进程。但是,我注意到在读取了比4096小得多的第一条记录之后,在ifstream对象中设置了一个错误标志。这意味着任何新到达的数据都不会被处理。一个简单的解决方法似乎是在每次读取后调用ifstream::clear,这确实解决了问题。但是,这是怎么回事?这是正确的解决方案吗?

最佳答案

首先,取决于您的系统,可能无法读取另一个进程写入的文件:在Windows上,打开文件时的常规设置将使访问权限独占。我对Window知之甚少,无法判断是否还有其他设置。在POSIX系统上,可以打开具有适当权限的文件,以供不同进程进行读写。从它的声音来看,您正在使用Linux,即遵循POSIX规范的东西。

但是,更改时轮询文件的方法并不是完全理想的:如您所注意到的,每次到达当前文件末尾时,都会出现“错误”。实际上,到达文件末尾并不是一个错误,但是尝试解码超出文件末尾的内容是一个错误。同样,超出文件末尾的读取仍将设置std::ios_base::eofbit,因此,流将不是good()。如果您坚持使用这种方法,除了读取文件的末尾并以某种方式处理不完整的读取,没有太多选择。

但是,如果您可以控制文件的创建,则可以做一个简单的技巧:不用让文件成为普通文件,可以创建mkfifo来使用编写程序将写入的文件名来创建命名管道:在POSIX系统上打开文件时,如果已经存在,但不会使用现有文件创建新文件。好吧,文件或文件名可以解决的其他任何问题(除了文件和命名管道外,您可能还会看到目录,字符或阻止特殊设备,以及其他可能出现的东西)。

命名管道是好奇的野兽,它们旨在使两个进程相互通信:一个进程写到一端的内容在另一端可以被另一进程读取!命名管道本身没有任何内容,即,如果您既需要文件的内容,又需要与另一个进程的通信,则可能需要将内容复制到某个地方。打开一个用于读取的命名管道,该管道将在到达文件的当前末尾时阻塞,即,最初读取将阻塞,直到有写入器为止。同样,对命名管道的写入将阻塞,直到有读取器为止。一旦有两个进程进行通信,则在另一进程退出后,在读取或写入命名管道时,将通信各自的另一端。

关于c++ - C++连续读取文件,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/12535381/

10-12 12:42
查看更多