创建爬虫项目

在你开始爬取网站之前,你得先建立一个Scrapy项目。在命令行中输入你要建立项目和存放代码的路径(cd C:/project/filepath),然后运行:

    >Scrapy startproject tutorial

这将会建立一个tutorial项目,而文件树如下图:


  • tutoral/
    • scrapy.cfg #部署配置文件

    • tutorial/ #项目的Python模块,你将会从这导入的的代码模块

      • __init__.py #初始化文件
      • items.py #定义项目的文件
      • pipelines.py #项目的管道文件
      • setting.py #项目设置文件
      • spider/ #存放爬虫的文件夹
        • __init__.py
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容