def index_page(self, response):
        for each in response.doc(‘a[href^="http"]’).items():
            self.crawl(each.attr.href, callback=self.detail_page)

是取回所有链接。如果我想只取回 链接地址里含有bids 这四个字母的链接,该怎么写?

求教了。谢谢!

辽宁网友:

  1. def index_page(self, response):
  2.         for each in response.doc(‘a[href^="http"]’).items():
  3.             if ‘bids’ in each.attr.href:
  4.                         self.crawl(each.attr.href, callback=self.detail_page)

复制代码

四川网友:一楼说的没错,赞一个。
辽宁网友:非常感谢!

01-26 17:11