我正在尝试从以下html片段中解析标题:
"Website (Newton) at datanucleus.org">Website</a></div>
我这样使用
indexOf
:strLine.indexOf("\">Website")
并且我想知道如何搜索链接之前出现的第一个SPACE。因此,我想捕获“”和““>网站
即
datanucleus.org
有任何想法吗?谢谢!
最佳答案
我认为这是您想要的:
int end = strLine.indexOf("\">Website");
int start = strLine.lastIndexOf(" ", end);
从
lastIndexOf
的文档中:返回最后一次出现的指定子字符串在此字符串内的索引,从指定索引开始向后搜索。
还有一个
lastIndexOf
版本,它使用char
而不是字符串。在这种特定情况下可能会更有效(但我尚未检查):int start = strLine.lastIndexOf(' ', end);
对于更复杂的事情,您还可以考虑研究java.util.regex包。