我目前正在开发一个会使用Copy/Transfer a sentence/paragraph from a PDF file to my program的应用程序。我正在使用Javascript开发程序,但还没有发现如何读取PDF文件的想法。

我想知道如何将句子/段落从PDF文件复制/传输到我的程序吗?

谢谢。

最佳答案

我知道这个问题很老,但是如果您发现PDF.js太复杂了,那就用npm install pdfreader。 (我写了那个模块)

从您的PDF文件中提取文本需要5行代码:

var PdfReader = require("pdfreader").PdfReader;
new PdfReader().parseFileItems("sample.pdf", function(err, item){
  if (item && item.text)
    console.log(item.text);
});

09-28 10:05