让scrapy重复抓一个页面

yield scrapy.Request(self.start_urls[0], callback=self.parse,dont_filter=True)dont_filter=True这里很重要,表示这个url不被去重。示例代码import scrapyimport jsonfrom alipa
python 爬虫 scrapy 2021年07月28日 13次浏览

Python 正则表达式基础

正则表达式基础篇> 是什么 ?正则表达式(Regular Expression)是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为"元字符")。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。通俗来讲正则表达式就是为了匹配文本而
正则 python 2020年03月27日 269次浏览

Pipenv,让生活更优雅!

pipenv,给人用的 项目管理工具!
python 2020年03月10日 263次浏览

PyQuery库 简单使用

Pyquery,简单使用撒!
python 爬虫 pyquery 2020年03月10日 267次浏览

Requests库 简单使用

requests 我爬,我爬,我爬爬爬!
python 爬虫 requests 2020年03月10日 310次浏览