python 爬虫练习

python 六节课爬虫 1-3
//www.greatytc.com/p/645c731c5422
python 六节课爬虫 4-6
//www.greatytc.com/p/b3003cbcdf92

上面的例子用的是requests，然后现在用urllib，其实路子一样
https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/001432688314740a0aed473a39f47b09c8c7274c9ab6aee000
主要是练习xpath和lxml

from urllib import request,parse
from lxml import etree


with request.urlopen('http://oabt004.com/index/index/k/%E7%BA%B8%E7%89%8C%E5%B1%8B/p/2') as f:
    data = f.read().decode('utf-8')
    #print(etree.HTML(data).xpath("//li/@data-ed2k"))
    for element in etree.HTML(data).xpath("//li/@data-ed2k"):
       print(parse.unquote(element))

结果

image.png

最后编辑于：2018.05.02 15:31:53

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

python 爬虫练习（一）
通过python 爬虫爬取小说使用python版本为3.6 模块为 Requests,BeautifulSo...
Pydii阅读 5,738评论 0赞 2
python爬虫练习-爬取豆瓣电影：环太平洋：雷霆再起部分信息
1.导入的库：requests、lxml 2.xpath获取火狐浏览器：打开网页，按F12,选择查看器代码结果
Cookie_hunter阅读 1,859评论 0赞 1

python爬虫练习-抓取多玩图片-美女图片
先上学习链接,先学习 https://www.bilibili.com/video/av15332766?from...
Cookie_hunter阅读 3,800评论 1赞 0
Python爬虫练习——抓取东方财富静态内容
刚学了一点python，写了一个简单的爬虫来抓取股票信息，最后将数据储存在excel文件中。功能比较简单，拓展性较...
大河马爱吃草阅读 5,247评论 0赞 3
D74 BentleyCui 2月22日打卡记录 [沉淀-精进1000天]
1. 站桩D06 --目标：累积40分钟以上。---未达标今日完成： (21+ = 43分钟) （太极浑圆...
BentleyCui阅读 962评论 0赞 0

赞1赞

赞赏

手机看全文