在python代码中,如何有效地将pdf中的某个页面保存为jpeg文件? (用例:我有一个 python Flask Web 服务器,其中 pdf-s 将被上传,每个页面对应的 jpeg-s 是存储。)
This solution很接近,但问题是它没有将整个页面转换为jpeg。
最佳答案
可以使用 pdf2image 库。
您可以简单地使用安装它,
pip install pdf2image
安装后,您可以使用以下代码获取图像。
from pdf2image import convert_from_path
pages = convert_from_path('pdf_file', 500)
以 jpeg 格式保存页面
for page in pages:
page.save('out.jpg', 'JPEG')
编辑:Github 存储库 pdf2image 还提到它使用
pdftoppm
并且需要其他安装:您可以通过执行以下操作使用 anaconda 在 Windows 下安装最新版本:
conda install -c conda-forge poppler
注意:http://blog.alivate.com.au/poppler-windows/ 提供高达 0.67 的 Windows 版本,但请注意,0.68 为 released in Aug 2018,因此您将无法获得最新功能或错误修复。
关于python - 从 pdf 中提取页面作为 jpeg,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/46184239/