我目前正在使用Java所提供的Jaunt api从网站检索超链接。代码如下:

        for (Element link : UA.doc.findEvery("<h3 class=r>").findEvery("<a>")) {
            String temp = link.getAt("href");
            System.out.println(temp);
        }


问题是当我访问下面的网站并将其打印到控制台时,该问题是什么?我将=号转换为%3F和%3D。

https://www.bloomberg.com/research/stocks/private/snapshot.asp?privcapId=7991464

很抱歉,如果问题是基本的,但我在网上找不到任何与此问题有关的信息。你们认为这可能是编码问题吗?总而言之,如果可能的话,我想将%3F和%3D转换成它们的原始形式。

如果您需要更多信息,请告诉我。

最佳答案

我们可以关闭主题。当我使用以下代码时,它起作用了:

System.out.println(URLDecoder.decode(link.getAt("href"), "UTF-8"));

10-07 16:59