我正在创建一个Web搜寻器,我只是阅读页面的html并存储到字符串中。然后,我在html内找到了所有的定位标记,并将它们存储到一个名为anchorTags的ArrayList中。现在,我需要了解数组列表中每个字符串的“ a href =“部分。为此,我编写了以下代码;但是,由于某种原因,我遇到了出站异常。请注意,我需要使用循环(仅数组列表)来执行此操作:
ArrayList<String> parsedLinks = new ArrayList<String>();
String storeHTML = "";
for(int i = 0; i < anchorTags.size(); i++) {
String anchorTag = anchorTags.get(i);
int hrefIndex = anchorTag.indexOf("a href=");
if (hrefIndex > -1) {
int beginQuote = anchorTag.indexOf("\"", hrefIndex);
int EndQuote = anchorTag.indexOf("\"", beginQuote +1);
if (EndQuote > beginQuote) {
storeHTML.substring(beginQuote +1, EndQuote);
}
}
}
parsedLinks.add(storeHTML);
System.out.println(parsedLinks);
return parsedLinks;
}
最佳答案
不应该storeHTML.substring(beginQuote +1, EndQuote);
是storeHTML = anchorTag.substring(beginQuote +1, EndQuote);
吗?