下午好,

我陷入了测试的最后一步,在插入一系列信息之后,该网站将生成pdf付款指南:

java - 阅读使用Selenium WebDriver生成的PDF的最佳方法-LMLPHP

我需要捕获绿色的信息

这里的代码在检查源代码时显示:

<embed id="plugin" type="application/x-google-chrome-pdf"

src="https://secweb.procergs.com.br/sng/javax.faces.resource/dynamiccontent.properties.xhtml?ln=primefaces&amp;v=5.3.17&amp;pfdrid=a9fc559a-bea3-4bc2-8234-5543c59715cc&amp;pfdrt=sc&amp;pfdrid_c=false&amp;uid=e483b7ac-35d3-429e-9c84-c5db516f1b8c" stream-url="blob:chrome-extension://mhjfbmdgcfjbbpaeojofohoefgiehjai/3173c884-d121-48c6-b417-5972f907fe9e" headers="Cache-Control: no-cache, no-store, must-revalidate
Connection: Keep-Alive
Content-Encoding: gzip
Content-Language: pt-br
Content-Type: application/pdf; charset=UTF-8
Date: Mon, 03 Sep 2018 20:26:44 GMT
Expires: Mon, 8 Aug 1980 10:00:00 GMT
Keep-Alive: timeout=16, max=1021
Pragma: no-cache
Server: Apache
Transfer-Encoding: chunked
Vary: Accept-Encoding
X-UA-Compatible: IE=Edge
" background-color="0xFF525659" top-toolbar-height="56" top-level-url="undefined">


按照我的逻辑,我什至不能从第一步开始,即通过一些唯一的文本来识别屏幕上PDF的存在:

if (driver0.getPageSource().contains("SECRETARIA DE MODERNIZAÇÃO ADMINISTRATIVA E DOS RECURSOS HUMANOS")) {
System.out.println("Located, we will capture the information ...");
} else {
System.out.println("Not found...");
}


使用PDFUtil库更新主题失败,我将其添加到库中,但无法正常工作

这是我的主要测试:

try {
            PDFUtil pdfUtil = new PDFUtil();
            pdfUtil.getText("C://64914273.pdf");
        } catch (Exception ex) {
            System.out.println(ex);
        }


控制台根本不返回任何内容

感谢那些可以帮助我的人

最佳答案

一种选择是保存pdf并使用PDF库读取内容并解析您要查找的文本。

看看PDFUtil和示例

http://www.testautomationguru.com/introducing-pdfutil-to-compare-pdf-files-extract-resources/

10-04 23:21