我的任务很简单:我需要阅读PDF文件并写出其图像内容,而忽略其文本内容。因此,基本上我需要对“另存为文本”进行补充。
理想情况下,我希望避免对图像内容进行任何形式的重新压缩,但是如果不可能的话,也可以。
是如何做的例子吗?
谢谢!
最佳答案
使用PDFsharp从PDF文件中提取文本不是一件容易的事。
最近在此线程中进行了讨论:
https://stackoverflow.com/a/9161732/162529
关于c# - C#PDFSharp : Examples of how to strip text from PDF?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/9591992/