学习Python爬虫(五):爬取图片
16lz
2021-01-22
直到现在我们都是在和文本形式的页面打交道,现在是时候来尝试点新事物了——今天我们尝试爬取图片,当然既然是爬取那就一定遵循Python爬虫的基本法,前面讲过的的知识对图片的爬取同样适用:让我们开始吧!
网络图片的URL格式
如果一个URL链接是以.jpg
结尾,那它就是一个图片链接
http://www.example.com/picture.jpg
例如(国家地理的某张图片)
http://image.nationalgeographic.com.cn/2017/0211/20170211061910157.jpg
在知道了图片的url链接后,我们还要给出把图片保存到本地的位置路径
path = '/Users/macbookpro/Desktop' #这里path变量用来保存目标路径,名字可以随便取,最好利于阅读
保存网络图片到本地
知识点:
1)使用Requests库爬取网络图片
2)处理返回Responce对象,在该对象身上调用方法
3)文件处理(hint:图片是二进制格式,r.content
表示返回信息的二进制格式)
开始吧:
让我们把代码写得健壮一点:
是不是很清晰、很有成就感?还等什么,赶紧上机试一试吧!
写在最后:通过文件读写,我们把二进制存储格式的网络图片保存到了本地——类似的,我们还可以用来爬取网络上的音乐、视频等
更多相关文章
- 【Python】keras神经网络识别mnist
- 【Python】python3实现网页爬虫下载图片
- PXE高效能网络批量装机
- Linux网络和进程管理命令
- linux socket网络编程:fcntl select(多个客户端连接服务器端情形)
- 我想开始学习Linux网络编程和android开发,希望大家给点指点!
- linux常用的有关网络操作的命令:
- Linux网络编程-客户端与服务器端通信(Echo)
- Linux网络设备驱动架構學習(三)