我想阅读pdf表,现在我正在使用PDFxStream从PDF中获取表数据,但是当我遇到日语字符时,它变成了像“ዊᮻᏒⒷⓄ䋳ৼ⋡䋱䋱⇟䋲ภ”这样的奇怪字符,并发出警告因为有一个例外。
这是警告:
警告:由于异常{java.lang.IllegalArgumentException:IV缓冲区对于给定的偏移量/长度组合太短}(3food.pdf),无法解析对象9,0的内容流
java.lang.IllegalArgumentException:对于给定的偏移量/长度组合,IV缓冲区太短
这是mycode:
public class Sample {
public static void main (String[] args) throws java.io.IOException {
//String pdfFilePath = args[0];
System.setProperty("pdfxs.config.property", "N");
Document pdf = PDF.open("3food.pdf");
StringBuilder text = new StringBuilder();
Page wantedPage = pdf.getPage(3);
wantedPage.pipe(new OutputTarget(text));
pdf.close();
System.out.println(text);
}
}
如果您有任何线索,我将不胜感激,在此先感谢您
最佳答案
这实际上是已在PDFxStream版本3.7.0
中修复的错误,可在此处下载或将其包含在Maven构建中:
https://www.snowtide.com/downloads
另外,如果您对PDFxStream还有其他问题或疑问,我敦促您直接与我们联系@ https://www.snowtide.com/contact😄