我目前正在开发一个会使用Copy/Transfer a sentence/paragraph from a PDF file to my program
的应用程序。我正在使用Javascript开发程序,但还没有发现如何读取PDF文件的想法。
我想知道如何将句子/段落从PDF文件复制/传输到我的程序吗?
谢谢。
最佳答案
我知道这个问题很老,但是如果您发现PDF.js太复杂了,那就用npm install
pdfreader。 (我写了那个模块)
从您的PDF文件中提取文本需要5行代码:
var PdfReader = require("pdfreader").PdfReader;
new PdfReader().parseFileItems("sample.pdf", function(err, item){
if (item && item.text)
console.log(item.text);
});