有没有人知道一种简单的方法,可以从pdf文件中提取一个信息表并将其插入mysql数据库,而不必先将其转换为csv或xml文件?我有超过200页的内容和转换每一页将永远占用我。

最佳答案

没有捷径可走。
您需要使用一些第三方应用程序将pdf中的内容提取到文本中,然后将其上载到数据库。但是是的,一旦脚本准备好了,就可以通过编程实现这一点。
例子:
http://pastebin.com/hRviHKp1下载class.pdf2text.php
然后像这样提取:

include('class.pdf2text.php');
$pdfobj = new PDF2Text();

$pdf_list = array('1.pdf', '2.pdf', '3.pdf', '4.pdf');
foreach($pdf_list as $pdf_file){
  $pdfobj->setFilename($pdf_file);
  $pdfobj->decodePDF();
  echo $pdfobj->output();

// using regex break the content in desired format & then store it to database

}

希望这会有帮助。

关于php - 将PDF数据转换为MYSQL,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/16740160/

10-13 03:29
查看更多