c++ - C++连续读取文件

我有一个生产者/消费者设置:我们的客户向我们提供服务器处理的数据，我们的客户通过不断写入文件来向服务器提供数据。我们的服务器使用inotify查找任何文件修改，并处理新数据。

问题:服务器中的文件阅读器具有大小为4096的缓冲区。我已经进行了模拟上述情况的单元测试。测试不断地将其写入打开的文件，文件读取器会不断尝试读取该进程。但是，我注意到在读取了比4096小得多的第一条记录之后，在ifstream对象中设置了一个错误标志。这意味着任何新到达的数据都不会被处理。一个简单的解决方法似乎是在每次读取后调用ifstream::clear，这确实解决了问题。但是，这是怎么回事？这是正确的解决方案吗？

最佳答案

首先，取决于您的系统，可能无法读取另一个进程写入的文件:在Windows上，打开文件时的常规设置将使访问权限独占。我对Window知之甚少，无法判断是否还有其他设置。在POSIX系统上，可以打开具有适当权限的文件，以供不同进程进行读写。从它的声音来看，您正在使用Linux，即遵循POSIX规范的东西。

但是，更改时轮询文件的方法并不是完全理想的:如您所注意到的，每次到达当前文件末尾时，都会出现“错误”。实际上，到达文件末尾并不是一个错误，但是尝试解码超出文件末尾的内容是一个错误。同样，超出文件末尾的读取仍将设置std::ios_base::eofbit，因此，流将不是good()。如果您坚持使用这种方法，除了读取文件的末尾并以某种方式处理不完整的读取，没有太多选择。

但是，如果您可以控制文件的创建，则可以做一个简单的技巧:不用让文件成为普通文件，可以创建mkfifo来使用编写程序将写入的文件名来创建命名管道:在POSIX系统上打开文件时，如果已经存在，但不会使用现有文件创建新文件。好吧，文件或文件名可以解决的其他任何问题(除了文件和命名管道外，您可能还会看到目录，字符或阻止特殊设备，以及其他可能出现的东西)。

命名管道是好奇的野兽，它们旨在使两个进程相互通信:一个进程写到一端的内容在另一端可以被另一进程读取!命名管道本身没有任何内容，即，如果您既需要文件的内容，又需要与另一个进程的通信，则可能需要将内容复制到某个地方。打开一个用于读取的命名管道，该管道将在到达文件的当前末尾时阻塞，即，最初读取将阻塞，直到有写入器为止。同样，对命名管道的写入将阻塞，直到有读取器为止。一旦有两个进程进行通信，则在另一进程退出后，在读取或写入命名管道时，将通信各自的另一端。

关于c++ - C++连续读取文件，我们在Stack Overflow上找到一个类似的问题：https://stackoverflow.com/questions/12535381/