我有一小段HTML,我需要从中提取一个单词。字符串realClean包含HTML。

<div class="smallfont">
<small>

Originally Posted By: chingy51o

</small>
</div>


我需要从中拉出chingy51o。我已经遇到了一段时间了,所以我扩大了搜索范围,只拔出任何包含Originally Posted By:的行,希望一旦我能够隔离出来,就可以提取更具体的数据从中,但我什至可以提取该行。

            String authorString = "Originally Posted By: .*?";
            if (realClean.contains(authorString)) {
                    Log.d("AUTHORS!", authorString + "\n");
            }


但这不返回任何值。

最佳答案

创建一个Scanner对象并搜索每一行。

String authorString = "Originally Posted By:";
Scanner scanner = new Scanner(realClean);
try {
  while ( scanner.hasNextLine() ){
    String line = scanner.nextLine();
    if(line.contains(authorString){
       Log.d("AUTHORS!", line.split(authorString)[1] + "\n");
  }
}

10-06 14:58