登录注册写文章

爬虫

爬虫

1、Scrapy

安装Scrapy:

sudo pip install virtualenv

virtualenv scrapyenv

cd scrapyenv

source bin/activate

pip install Scrapy

文档:https://docs.scrapy.org/en/latest/intro/tutorial.html

2、使用urllib2和正则表达式实现

import urllib2

import re

response = urllib2.urlopen('http://www.baidu.com/')

html = response.read()

print(re.match('dev', html).span())

最后编辑于：2017.12.29 13:26:35

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

爬虫初探-Scrapy
爬虫初探-Scrapy Scrapy 资料官方文档永远是首选，建议把 tutorial 完整的过一遍。网址：h...
廖少少阅读 6,303评论 0赞 3
《Learning Scrapy》（中文版）第3章爬虫基础
序言第1章 Scrapy介绍第2章理解HTML和XPath第3章爬虫基础第4章从Scrapy到移动应用第5章...
SeanCheney阅读 15,201评论 13赞 61
Scrapy-redis实现分布式爬虫
Scrapy，Python开发的一个快速,高层次的屏幕抓取和web抓取框架，用于抓取web站点并从页面中提取结构化...
Evtion阅读 11,149评论 12赞 18
最可怕的
我觉得最可怕的事我知道这样做不正确也不想成为这样的人但是潜意识里总有一个声音再说你不过也就是一个这样的人罢了。
牛排七分熟oo阅读 916评论 0赞 0
【摄影手机每周一图】春雪
手机型号：vivoY67 修图软件：手机自带只做了调色
魔笛大公举阅读 1,040评论 0赞 1

赞1赞

赞赏

手机看全文