python3.6 网络爬虫爬去图片

<pre>

!/usr/python3

import re
import urllib.request
def gethtml(url):
page=urllib.request.urlopen(url)
html=page.read()
return html
def getimg(html):
reg = r'src="(.*?.jpg)"'
img=re.compile(reg)
html=html.decode('utf-8')#python3
imglist=re.findall(img,html)
x = 0
for imgurl in imglist:
urllib.request.urlretrieve(imgurl,'%s.jpg'%x)
x = x+1
html=gethtml("http://sports.ifeng.com/a/20170623/51305326_0.shtml")
print(getimg(html))
</pre>

最后编辑于：2017.12.08 05:35:28

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

python3.5爬虫实例（一）简单图片抓取
为了提高教学的趣味性，先不从基本的正则表达式入手介绍，用到的时候会解释一下。先直接一个图片抓取的实例（能快速保存...
下水道潜水员阅读 4,673评论 0赞 1
python3网络爬虫 (2)-使用BeautifulSoup获取网页标题
使用python包管理工具安装BeautifulSoup 新建2.py文件，将以下代码拷贝到文件中运行pytho...
Vuji阅读 8,718评论 0赞 1

使用python3进行优雅的爬虫（一）爬取图片
先从一个最简单的页面开始爬起这是一个只有照片的页面现在我要做的时把它从网页是爬下来，贴出代码值得注意的是对文...
十年之前i阅读 33,516评论 11赞 15
文|前方熙熙攘攘里人来人往，街角小屋处寻一抹书香
熙熙攘攘里，留一份慢时光，用心看，何处无风景。 2017年10月8日星期日晴阿紫，我们在路上堵了...
南湘紫阅读 5,692评论 44赞 71
关于孩子的学习
今天，彦蕊和云燕在群里探讨孩子学习的问题。话题从孩子的学习说起，说的却不止是孩子的事。爬楼听她们的讨论，我也在回...
真冉阅读 906评论 0赞 0

赞1赞

赞赏

手机看全文