有用过pyspider的吗?请教一个小白问题

搬瓦工机场JMS

def index_page(self, response):
        for each in response.doc(‘a[href^="http"]’).items():
            self.crawl(each.attr.href, callback=self.detail_page)

是取回所有链接。如果我想只取回 链接地址里含有bids 这四个字母的链接,该怎么写?

求教了。谢谢!

辽宁网友:

  1. def index_page(self, response):
  2.         for each in response.doc(‘a[href^="http"]’).items():
  3.             if ‘bids’ in each.attr.href:
  4.                         self.crawl(each.attr.href, callback=self.detail_page)

复制代码

四川网友:一楼说的没错,赞一个。
辽宁网友:非常感谢!

未经允许不得转载:美国VPS_搬瓦工CN2 GIA VPS » 有用过pyspider的吗?请教一个小白问题

赞 (0) 打赏

评论 0

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏