<form action="http://www.lyricsfreak.com/search.php">
    <input name="a" value="search" type="hidden">
    <input type="hidden" name="type" value="song">
    <input type="text" name="q" class="searchinp" placeholder="Search artist, albums and songs">
    <input value="Search" type="submit" class="srchbtn searchst" data-tracking='["Search","Lyrics","Search button"]'>
    <a href="http://www.lyricsfreak.com/search.php" class="srchadv" data-tracking='["Search","Lyrics","Advanced search"]'>Advanced search</a>
</form>


我知道已经有人问过这个问题,但这对我不起作用。实际上,在这个站点上,当我什至将url复制并粘贴到其他选项卡时,它首先显示错误,然后在几秒钟后再次重新加载并显示所需的页面,因此我第一次尝试时无法获得该值。如果有人可以给我任何解决方案,那将是很好。如您所见,如果我犯了任何类型的错误,那么我对stackoverflow还是陌生的,对不起...

最佳答案

链接http://www.lyricsfreak.com/search.php不可用,这就是其显示错误的原因。当您说它有时列出之后,实际上发生的是重定向到主页。因此,您可以使用首页链接http://www.lyricsfreak.com/search.php代替使用http://www.lyricsfreak.com/

基于评论的样本

好。我想您想在使用jsoup从Java程序中搜索后读取轨道。 lyricsfreak的问题在于它在返回结果之前先检查源。如果源查询不是lyricsfreak.com,则将其重定向到access_error.htm,并使用以下脚本从此处重新提交,以在3.5秒后再次提交以获取结果

<script type="text/javascript">
    var redirect_url = document.location.href.match(/\?(.*)/);
    redirect_url = redirect_url ? '/search.php?' + redirect_url[1] : '/';
    setTimeout(function() { document.location.href = (redirect_url); }, 3500);
</script>


因此,您可以在此处通过jsoup将referrer设置为'lyricsfreak.com',这样可以在没有access_error的情况下为您提供正确的结果。因此,示例代码如下。当然,您可以以更好的方式解析页面,但这只是为了给您一个想法。

import java.util.ArrayList;
import java.util.List;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

public class LyricsParser {

    public static void main(String[] args) throws Exception {

        String SEARCH_STRING = "Madonna";
        String URL = "http://www.lyricsfreak.com/search.php?a=search&type=song&q=";

        List<String> artists = new ArrayList<String>();
        List<String> songs = new ArrayList<String>();
        List<String> hits = new ArrayList<String>();

        Document doc = Jsoup.connect(URL + SEARCH_STRING)
                .referrer(URL + SEARCH_STRING).get();

        for(Element tracks : doc.select("td.colfirst")){
            for(Element links : tracks.getElementsByTag("a")){
                artists.add(links.text());
            }
        }

        for(Element tracks : doc.select("td > a.song")){
            for(Element links : tracks.getElementsByTag("a")){
                songs.add(links.text());
            }
        }

        for(Element tracks : doc.select("td.colast")){
            hits.add(tracks.text());
        }

        int length = artists.size();
        for(int i=0; i<length; i++){
            System.out.println("[" + artists.get(i) + ",\t" + songs.get(i) + ",\t" + hits.get(i+1) + "]");
        }
    }

}

09-25 21:05