我想阅读pdf表,现在我正在使用PDFxStream从PDF中获取表数据,但是当我遇到日语字符时,它变成了像“ዊᮻᏒⒷⓄ䋳ৼ⋡䋱䋱⇟䋲ภ”这样的奇怪字符,并发出警告因为有一个例外。

这是警告:


  警告:由于异常{java.lang.IllegalArgumentException:IV缓冲区对于给定的偏移量/长度组合太短}(3food.pdf),无法解析对象9,0的内容流
  java.lang.IllegalArgumentException:对于给定的偏移量/长度组合,IV缓冲区太短


这是mycode:

public class Sample {
    public static void main (String[] args) throws java.io.IOException {
        //String pdfFilePath = args[0];
        System.setProperty("pdfxs.config.property", "N");
        Document pdf = PDF.open("3food.pdf");
        StringBuilder text = new StringBuilder();

        Page wantedPage = pdf.getPage(3);

        wantedPage.pipe(new OutputTarget(text));
        pdf.close();
        System.out.println(text);
      }
}


如果您有任何线索,我将不胜感激,在此先感谢您

最佳答案

这实际上是已在PDFxStream版本3.7.0中修复的错误,可在此处下载或将其包含在Maven构建中:

https://www.snowtide.com/downloads

另外,如果您对PDFxStream还有其他问题或疑问,我敦促您直接与我们联系@ https://www.snowtide.com/contact😄

10-07 13:52