使用 Python 编写多线程爬虫抓取百度贴吧邮箱与手机号
需求分析:本爬虫主要是对百度贴吧中各种帖子的内容进行抓取,并且分析帖子内容将其中的手机号和邮箱地址抓取出来。主要流程在代码注释中有详细解释。测试环境:代码在Windows7 64bit,python 2.7 64bit(安装mysqldb扩展)以及centos 6.5,python 2.7(带mysqldb扩展)环境下测试通过环境准备:工欲善其事必先利其器,大家可以从截图看出我的环境是Window...
转载
2018-03-06 09:58:28 ·
862 阅读 ·
0 评论