我想浏览一个html页面并计算“。”的次数。 (句点)显示。在这里,我有一些读取html的代码,并打印出所需的输出。

我当时正在考虑修改此代码,但是看到这是一个简单的问题,也许我们不需要麻烦去修改它。相反,我们可以直接编写新程序。

这是我阅读网页html的代码(很多代码应该是不必要的代码):

import edu.duke.*;


public class URLFinder {
    public StorageResource findURLs(String url) {
        URLResource page = new URLResource(url);
        String source = page.asString();
        StorageResource store = new StorageResource();
        int start = 0;
        while (true) {
            int index = source.indexOf("href=", start);
            if (index == -1) {
                break;
            }
            int firstQuote = index+6; // after href="
            int endQuote = source.indexOf("\"", firstQuote);
            String sub = source.substring(firstQuote, endQuote);
            if (sub.contains(".")) {
                store.add(sub);
            }
            start = endQuote + 1;
        }
        return store;
    }

    public void testURL() {
        StorageResource s1 = findURLs("http://www.dukelearntoprogram.com/course2/data/newyorktimes.html");
        //StorageResource s2 = findURLs("http://www.doctorswithoutborders.org");
        for (String link : s1.data()) {
            System.out.println(link);
        }
        System.out.println("size = " + s1.size());
        //System.out.println("size = " + s2.size());
    }
}

最佳答案

一种方法是使用indexOf方法:

int index = -1;
int count = 0;
String source = ...;
while((index = source.indexOf(".", ++index) != -1)
    count++


正如@TJCrowder指出的那样,可能是需要让某些脚本执行的情况。如果是这种情况,请参考this上一个SO问题。

关于java - 如何计算次数“。”出现在网页上?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/34506152/

10-13 01:08