我有一个很大的(950GB)二进制文件,其中存储了10亿个浮点序列。
我有一个长度为3的文件类型的小例子是:
-3.456 -2.981 1.244
2.453 1.234 0.11
3.45 13.452 1.245
-0.234 -1.983 -2.453
现在,我想读取一个特定的序列(假设索引为2的序列,因此是文件中的第3个序列),因此我使用以下代码:
#include <iostream>
#include <fstream>
#include <stdlib.h>
using namespace std;
int main (int argc, char** argv){
if(argc < 4){
cout << "usage: " << argv[0] << " <input_file> <length> <ts_index>" << endl;
exit(EXIT_FAILURE);
}
ifstream in (argv[1], ios::binary);
int length = atoi(argv[2]);
int index = atoi(argv[3]);
float* ts = new float [length];
in.clear();
**in.seekg(index*length*sizeof(float), in.beg);**
if(in.bad())
cout << "Errore\n";
**// for(int i=0; i<index+1; i++){**
in.read(reinterpret_cast<char*> (ts), sizeof(float)*length);
**// }**
for(int i=0; i<length; i++){
cout << ts[i] << " ";
}
cout << endl;
in.close();
delete [] ts;
return 0;
}
问题是,当我使用seekg时,某些索引读取失败,并且得到错误的结果。如果我按顺序读取文件(不使用seekg)并打印出所需的序列,那么我总是会得到正确的结果。
起初,我想到了seekg的溢出(因为字节数可能非常大),但是我看到seekg接受了一个巨大的流式输入(数十亿亿)。
最佳答案
换线
in.seekg(index*length*sizeof(float), in.beg);
进入
in.seekg((streamoff)index*length*sizeof(float), in.beg);
解决了问题。