pdfminer3是从pdf提取文本的简单工具。在浏览minimal reproducible example的引用时,面临提取的文本中缺少空格的问题。

最佳答案

解决方法是指定laparams

from pdfminer3.layout import LAParams
converter = TextConverter(resource_manager, fake_file_handle, laparams=LAParams())

10-03 00:11