def index_page(self, response):
for each in response.doc(‘a[href^="http"]’).items():
self.crawl(each.attr.href, callback=self.detail_page)
是取回所有链接。如果我想只取回 链接地址里含有bids 这四个字母的链接,该怎么写?
求教了。谢谢!
辽宁网友:
- def index_page(self, response):
- for each in response.doc(‘a[href^="http"]’).items():
- if ‘bids’ in each.attr.href:
- self.crawl(each.attr.href, callback=self.detail_page)
复制代码
四川网友:一楼说的没错,赞一个。
辽宁网友:非常感谢!