资讯专栏INFORMATION COLUMN

scrapy添加新命令

CastlePeaK / 699人阅读

摘要:允许开发者自定义命令,假设工程名字为,在工程的根目录有一个文件内容如下在文件里设置,就可以在的帮助中看到这个命令,运行时用。自定义命令的默认设置会和工程的设置合并到一起,但是相比在文件里和命令行定义的设置优先级要低。

COMMANDS_MODULE允许开发者自定义命令,假设工程名字为properties,在工程的根目录有一个hi.py文件内容如下:

from scrapy.commands import ScrapyCommand
class Command(ScrapyCommand):

   default_settings = {"LOG_ENABLED": False}
   def run(self, args, opts):
       print("hello")

在settings.py文件里设置COMMANDS_MODULE = "properties.hi" ,就可以在Scrapy的帮助中看到这个命令,运行时用scrapy hi。自定义命令的默认设置default_settings会和工程的设置合并到 一起,但是相比在settings.py文件里和命令行定义的设置优先级要低。

如果需要自定义多个命令,则可以在工程的根目录下建立一个文件夹,又如commands,里面放一些类似上面hi.py文件的命令,然后设置COMMANDS_MODULE = "properties.commands即可

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/42335.html

相关文章

  • scrapy入门教程3:scrapy的shell命令

    摘要:用例运行爬虫命令基本语法是否需要项目存在当然是不需要咯貌似这个命令是不依托一个项目而直接运行一个爬虫的命令。用例我终于写完了,喜欢的就收藏推荐一下吧,这样我就会更有动力写新的教程了,哇哈哈 0. 基本环境说明 本文截图及运行环境均在Win8上实现(是的,我放假回家了,家里的机器是win8的没有办法),但基本步骤与win 7环境基本相同。(应该把~)ps:我后来换了台win7的电脑,所...

    zhongmeizhi 评论0 收藏0
  • 基于 Python 的 Scrapy 爬虫入门:环境搭建

    摘要:一基础环境由于不是职业的开发者,因此环境是基于的。二安装打开命令行工具创建虚拟环境,默认情况下会创建目录,所有的虚拟环境都会产生一个子目录保存在此,里面包含基本程序文件以及库文件。 目录 基于 Python 的 Scrapy 爬虫入门:环境搭建 基于 Python 的 Scrapy 爬虫入门:页面提取 基于 Python 的 Scrapy 爬虫入门:图片处理 作为一个全栈工程师(...

    Gu_Yan 评论0 收藏0
  • scrapy-redis分布式爬虫框架详解

    摘要:分布式爬虫框架详解随着互联网技术的发展与应用的普及,网络作为信息的载体,已经成为社会大众参与社会生活的一种重要信息渠道。下载器中间件位于引擎和下载器之间的框架,主要是处理引擎与下载器之间的请求及响应。 scrapy-redis分布式爬虫框架详解 随着互联网技术的发展与应用的普及,网络作为信息的载体,已经成为社会大众参与社会生活的一种重要信息渠道。由于互联网是开放的,每个人都可以在网络上...

    myeveryheart 评论0 收藏0
  • 18、 Python快速开发分布式搜索引擎Scrapy精讲—Scrapy启动文件的配置—xpath表

    摘要:百度云搜索,搜各种资料搜网盘,搜各种资料我们自定义一个来作为启动文件导入执行命令方法给解释器,添加模块新路径将文件所在目录添加到解释器执行命令爬虫文件表达式基本使用设置爬虫起始域名设置爬虫起始地址默认爬虫回调函数,返 【百度云搜索,搜各种资料:http://www.bdyss.cn】 【搜网盘,搜各种资料:http://www.swpan.cn】 我们自定义一个main.py来作为启动...

    rubyshen 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<