我正在尝试获取一个PDDocument对象,并将其作为InputStream传递给其他模块,而不将文档保存到文件系统中。

现在,我阅读了有关PDStream的内容,并了解其用途。因此,我试图做这样的事情:

PDStream stream = new PDStream(document);

InputStream is = stream.createInputStream();

但是,当我尝试将该输入流加载到PDDocument时,出现此错误:
Exception in thread "main" java.io.IOException: Error: End-of-File, expected line
    at org.apache.pdfbox.pdfparser.BaseParser.readLine(BaseParser.java:1111)
    at org.apache.pdfbox.pdfparser.COSParser.parseHeader(COSParser.java:1885)
    at org.apache.pdfbox.pdfparser.COSParser.parsePDFHeader(COSParser.java:1868)
    at org.apache.pdfbox.pdfparser.PDFParser.parse(PDFParser.java:245)
    at org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:1098)
    at org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:995)
    at app.DGDCreator.main(DGDCreator.java:35)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:498)
    at com.intellij.rt.execution.application.AppMain.main(AppMain.java:143)

后来我发现结果文件的大小为0kb ...

最佳答案

因此,其他任何人都可以对此找到一个很好的答案。我遇到了同样的情况,我不想将文件保存到任何计算机上,而只处理流本身。我找到了答案here,并将在下面重复。

ByteArrayOutputStream out = new ByteArrayOutputStream();
pdDoc.save(out);
pdDoc.close();
ByteArrayInputStream in = new ByteArrayInputStream(out.toByteArray());

09-25 17:53