我的任务很简单:我需要阅读PDF文件并写出其图像内容,而忽略其文本内容。因此,基本上我需要对“另存为文本”进行补充。

理想情况下,我希望避免对图像内容进行任何形式的重新压缩,但是如果不可能的话,也可以。

是如何做的例子吗?

谢谢!

最佳答案

使用PDFsharp从PDF文件中提取文本不是一件容易的事。

最近在此线程中进行了讨论:
https://stackoverflow.com/a/9161732/162529

关于c# - C#PDFSharp : Examples of how to strip text from PDF?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/9591992/

10-10 01:37