我正在尝试从以下html片段中解析标题:

"Website (Newton) at datanucleus.org">Website</a></div>


我这样使用indexOfstrLine.indexOf("\">Website")

并且我想知道如何搜索链接之前出现的第一个SPACE。因此,我想捕获“”和““>网站
datanucleus.org

有任何想法吗?谢谢!

最佳答案

我认为这是您想要的:

int end = strLine.indexOf("\">Website");
int start = strLine.lastIndexOf(" ", end);


lastIndexOf的文档中:


返回最后一次出现的指定子字符串在此字符串内的索引,从指定索引开始向后搜索。


还有一个lastIndexOf版本,它使用char而不是字符串。在这种特定情况下可能会更有效(但我尚未检查):

int start = strLine.lastIndexOf(' ', end);


对于更复杂的事情,您还可以考虑研究java.util.regex包。

09-27 20:16