我们目前正在尝试使用Python在AppEngine上将html文件转换为PDF。 HTML文件来自第三方供应商,因此我们无法控制其格式。灵活和标准环境都是可选项,但是我们走的每条路似乎都遇到了障碍:

  • PDFkit 需要安装wkhtml2pdf,没有可用的PIP软件包,但是可以完美地离线转换
  • xhtml2pdf/PISA -甚至可以在GAE Standard上使用,但不支持很多功能,例如float和格式错误的HTML
  • WeasyPrint -理论上C依赖项将在Flexible环境上运行,但是没有pip包可用于包括Cairo和Pango的依赖项

  • 有没有人拥有以上任何一种在AppEngine上运行的强大解决方案?还是缺少其他图书馆?

    最佳答案

    一年前,我遇到了同样的问题,并得出结论,至少在高质量转换的情况下,目前在App Engine中是不可能的。 (如果情况发生变化,请指出)

    xhtml2pdf -我能够在标准App Engine中成功运行它,但对转换质量一点都不满意。

    PDFkit -遇到类似的问题,并提出了不同的解决方案。将PDFkit托管在Compute Engine实例上,并公开一个端点,其中带有HTML文件的POST请求将返回转换后的PDF作为响应。就处理质量/速度而言,这给了我最佳/预期的结果。

    它确实产生了一些额外的费用,但我也能够将实例用于其他用途;)。最初,我选择了最少的配置,因为我没有在Compute Engine实例上存储任何内容。

    10-08 08:10
    查看更多