我正在使用pdf.js解析pdf文件。首先我上传文件,然后尝试解析该文件。我将URL传递给parse函数以在PDFJS.getDocument(url)中读取它
如果我不使用上载部分并对pdf文件的网址进行硬编码,则可以正常工作。
代码:
var parse = function(payload,callback){
var data = payload;
if(data.file){
var name = data.file.hapi.filename;
var ext = name.split('.');
var extension = ext[1];
if(extension == "pdf"){
var path = __dirname + "/uploads/" + name;
checkFileExist();
var file = fs.createWriteStream(path);
file.on('error', function (err) {
console.error(err)
});
data.file.pipe(file);
var fileName = data.file.hapi.filename;
console.log(fileName);
var fileAbsolutepath = __dirname + "/uploads/" + fileName ;
console.log(fileAbsolutepath);
var parser = script.pdfParser(fileAbsolutepath,function(err,resp){
if(err){
callback(err);
}
else {
callback(resp);
}
})
callback(JSON.stringify(fileName));
}
else{
console.log("Invalid fileType");
callback(JSON.stringify("Invalid FileType"));
}
}
}
var checkFileExist = function() {
var path = __dirname + '/uploads';
fs.exists(path, function(exists) {
if (exists === false) fs.mkdirSync(path);
});
};
exports.pdfParser = function(url,callback){
PDFJS.workerSrc = 'pdf.worker.js';
PDFJS.getDocument(url).then(function (pdf) {
var pdfDocument = pdf;
}}
我仍然收到错误:“错误:PDFDocument:流中必须有数据”,文件已正确上传,且具有预期的文件大小,位于Uploads文件夹中
最佳答案
要使用pdf.js解析文件,而不是使用PDFJS.getDocument加载文件,请尝试将pdf文件转换为arrayBuffer或Uint8Array,然后使用该文件创建新的LocalPdfManager对象。然后,您可以直接调用LocalPdfManager的方法来解析pdf。
像这样:
import { LocalPdfManager } from 'pdfjs-dist/lib/core/pdf_manager';
pdfManager = new LocalPdfManager(1, arrayBuffer, '', {}, '');
// parameters = (docId, data, password, evaluatorOptions, docBaseUrl)
pdfManager.ensureDoc('parseStartXRef', []); // [] = arguments
pdfManager.ensureDoc('parse', false); // false = recoveryMode
pdfManager.ensureDoc('numPages');
pdfManager.ensureDoc('fingerprint');
然后在
pdfManager.pdfDocument
中查看已解析的pdf数据。例如,主要的“ / Catalog”条目将在
pdfManager.pdfDocument.catalog.catDict
中。我已使用此方法在浏览器中本地成功解析和修改pdf文件。我没有在使用node.js的服务器上尝试过它,但是我希望它应该能正常工作。
关于node.js - 错误:PDFDocument:流必须具有数据,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/47803028/