我目前正在使用Java所提供的Jaunt api从网站检索超链接。代码如下:
for (Element link : UA.doc.findEvery("<h3 class=r>").findEvery("<a>")) {
String temp = link.getAt("href");
System.out.println(temp);
}
问题是当我访问下面的网站并将其打印到控制台时,该问题是什么?我将=号转换为%3F和%3D。
https://www.bloomberg.com/research/stocks/private/snapshot.asp?privcapId=7991464
很抱歉,如果问题是基本的,但我在网上找不到任何与此问题有关的信息。你们认为这可能是编码问题吗?总而言之,如果可能的话,我想将%3F和%3D转换成它们的原始形式。
如果您需要更多信息,请告诉我。
最佳答案
我们可以关闭主题。当我使用以下代码时,它起作用了:
System.out.println(URLDecoder.decode(link.getAt("href"), "UTF-8"));