
爬虫
destiny_python
目前正从事数据分析工作,并在不断精进中
展开
-
爬虫第一天:环境配置
工欲善其事,必先利其器 要想顺利开心快捷的爬啊爬,环境当然得到配置好啊,那接下来一步一步来吧: 一:下载anaconda,为什么下载anaconda呢,为什么不直接去官网下载python安装包下载呢,当然也是可以的,只是anaconda更加方便,因为它集成了很多爬虫,数据分析需要的第三方库,也集成了像pip这样的神器,所以安装它来的更简单 二:安装一个python IDE 这个就看个人喜好了原创 2017-08-09 22:45:56 · 1229 阅读 · 0 评论 -
爬虫初探:把豆瓣读书主页上书的URL、书名、作者、出版时间、出版社全部爬下来
import requests import re #进入豆瓣读书主页,把网页源代码打出来 content = requests.get('https://book.douban.com/').text #定义一个正则表达式对象 pattern = re.compile('(.*?).*?year">(.*?).*?publisher">(.*?).*?', re.S) results = re.原创 2017-08-10 21:22:50 · 2151 阅读 · 1 评论