我有一小段HTML,我需要从中提取一个单词。字符串realClean
包含HTML。
<div class="smallfont">
<small>
Originally Posted By: chingy51o
</small>
</div>
我需要从中拉出
chingy51o
。我已经遇到了一段时间了,所以我扩大了搜索范围,只拔出任何包含Originally Posted By:
的行,希望一旦我能够隔离出来,就可以提取更具体的数据从中,但我什至可以提取该行。 String authorString = "Originally Posted By: .*?";
if (realClean.contains(authorString)) {
Log.d("AUTHORS!", authorString + "\n");
}
但这不返回任何值。
最佳答案
创建一个Scanner
对象并搜索每一行。
String authorString = "Originally Posted By:";
Scanner scanner = new Scanner(realClean);
try {
while ( scanner.hasNextLine() ){
String line = scanner.nextLine();
if(line.contains(authorString){
Log.d("AUTHORS!", line.split(authorString)[1] + "\n");
}
}