Closed. This question does not meet Stack Overflow guidelines。它当前不接受答案。
                        
                    
                
            
        
            
        
                
                    
                
            
                
                    想改善这个问题吗? Update the question,所以它是on-topic,用于堆栈溢出。
                
                    2年前关闭。
            
        

    

我工作的公司希望自动审核发布给客户的PDF,而不是验证文本的某些部分,是否有任何好的工具或开源工具可让您确定客户收到的PDF是您所需要的期望是吗?
许多PDF是动态生成的,因此我没有明确的基线来精确地一对一地显示文件的外观。
我正在寻找能够为我提供表格结构而非文本安全性的解决方案

最佳答案

使用iText(尤其是pdf2Data),您可以从PDF文件中提取所有信息,并将其与给定模板匹配。

使用这种方法,您可以轻松地验证PDF是否包含您期望包含的所有信息。

在此处查看pdf2Data
http://pdf2data.online/

09-28 01:57