有什么方法可以使用pdf.js从pdf文档中获取作者或标题之类的元数据吗?
在此示例中:http://mozilla.github.io/pdf.js/web/viewer.html?file=compressed.tracemonkey-pldi-09.pdf
<div class="row">
<span data-l10n-id="document_properties_author">
Autor:
</span>
<p id="authorField">
-
</p>
并且authorField为空。有没有办法获取此信息?
最佳答案
仅使用PDF.js库而不使用第三方查看器,您可以利用Promise获得元数据。
PDFJS.getDocument(url).then(function (pdfDoc_) {
pdfDoc = pdfDoc_;
pdfDoc.getMetadata().then(function(stuff) {
console.log(stuff); // Metadata object here
}).catch(function(err) {
console.log('Error getting meta data');
console.log(err);
});
// Render the first page or whatever here
// More code . . .
}).catch(function(err) {
console.log('Error getting PDF from ' + url);
console.log(err);
});
将
pdfDoc
对象转储到控制台并查看其功能和属性后,我发现了这一点。我在其原型(prototype)中找到了该方法,并决定尝试一下。瞧,这行得通!