我正在使用scrapy&splash从启用JavaScript的银行页面抓取促销优惠。

https://www.dbs.com.sg/personal/product-promotion-list.page?pct=Cards#

我面临的问题是其中的分页是使用javascript完成的,因此链接采用以下格式:

<a href="#">1</a>
<a href="#">2</a>
<a href="#">3</a>

href链接都隐藏在#内。

当我进一步挖掘时,html代码中的分页功能是:
<script type="text/javascript">

    $(document).ready(function(){
    productList();
    });
    $('.pagination').on("click","a",checkClass);
    $('#filterSearch').on("click",searchTextChange);
    $('form').submit(function(e){
         e.preventDefault();
    });
    $("#Search").keyup(function(event){
        if(event.keyCode == 13){
            $("#filterSearch").click();
        }
    });

</script>

谁能帮我这个 ?任何帮助表示赞赏!谢谢。

最佳答案

通过单击每个分页(1、2或3),使用POST从服务器请求以下URL:

https://www.dbs.com.sg/personal/product-promotion-list-child.page

具有以下已过帐的表单数据:
promotype=&start=1&pageNum=1&search=&type=promotion&pct=Cards(第1页)promotype=&start=2&pageNum=1&search=&type=promotion&pct=Cards(第2页)promotype=&start=3&pageNum=1&search=&type=promotion&pct=Cards(第3页)

如果您直接通过正确的页码访问此URL,该怎么办?该请求将返回带有所需促销列表的HTML。

09-29 21:03