有什么方法可以使用pdf.js从pdf文档中获取作者或标题之类的元数据吗?

在此示例中:http://mozilla.github.io/pdf.js/web/viewer.html?file=compressed.tracemonkey-pldi-09.pdf

<div class="row">
<span data-l10n-id="document_properties_author">
    Autor:
</span>
<p id="authorField">
    -
</p>

并且authorField为空。有没有办法获取此信息?

最佳答案

仅使用PDF.js库而不使用第三方查看器,您可以利用Promise获得元数据。

PDFJS.getDocument(url).then(function (pdfDoc_) {
        pdfDoc = pdfDoc_;
        pdfDoc.getMetadata().then(function(stuff) {
            console.log(stuff); // Metadata object here
        }).catch(function(err) {
           console.log('Error getting meta data');
           console.log(err);
        });

       // Render the first page or whatever here
       // More code . . .
    }).catch(function(err) {
        console.log('Error getting PDF from ' + url);
        console.log(err);
    });

pdfDoc对象转储到控制台并查看其功能和属性后,我发现了这一点。我在其原型(prototype)中找到了该方法,并决定尝试一下。瞧,这行得通!

08-28 04:17