有没有懂python scrapy代理ip的老哥?

一个困扰我好几天的问题：用scrapy写的一个访问58同城的简易爬虫，在中间件里爬了很多有效的代理IP，但是在process____request方法里，代理IP不知道为什么就是不切换，一直使用的是最初成功的那个IP，明明打印的信息是已经更换了新的IP，实际访问的结果来看却还是没有更换。。。

-----这是控制台的打印：

图片说明

这是爬虫文件：xicispider.py

name = 'xicispider'
allowed_domains = ['58.com']
start_urls = ['https://www.58.com/']

def parse(self, response):
    reg = r'<title>(.*?)</title>'
    print(re.search(reg,response.text).group())
    yield scrapy.Request(url='https://www.58.com',callback=self.parsep, dont_filter=True)

def parsep(self, response):
    reg = r'<title>(.*?)</title>'
    print(re.search(reg,response.text).group())

这是中间件：middleware.py
def process_request(self,spider,request):

    ip = random.choice(self.proxies)
    print("process_request方法运行了，重新获取的ip是：--------->",ip)
    request.meta['proxy'] = ip

这是settings.py里的有关配置：

DOWNLOADER_MIDDLEWARES = {
'xici.middlewares.XiciDM': 543,
}

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2019-09-27 23:18
关注
你得找匿名代理才行，普通代理会通过x-forward-for参数向服务器报告被代理者的ip

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python用scrapy爬虫豆瓣_python爬虫，用Scrapy爬取豆瓣Top250，存入MySQL
2021-01-14 06:17

催眠神兔的博客小白大四生，虽然是计算机专业，但是对学的几门编程语言缘分不深，然后自学了python。(这是我后来补得，因为我发现我写的太笼统了并不适合给新手看，对不起！所以希望大家轻点喷，后面我会从特别特别特别详细写的，...
崔老哥python scrapy爬虫框架入门
2018-06-24 19:42

你是真饿了的博客 Scrapy 爬虫框架入门案例详解Scrapy入门创建项目创建Spider创建Item解析Response使用Item后续Request保存到文件使用Item Pipeline源代码Scrapy入门本篇会通过介绍一...，可以对Scrapy对基本用法和原理有大体的了解...
Python爬虫：和我一起学习scrapy（一）
2021-03-22 22:55

小志codings的博客 scrapy是由Python语言开发的一个快速、高层次的屏幕抓取和web抓取框架，用于抓取web站点并从页面中提取结构化的数据。 scrapy用途广泛，可以用于数据挖掘、监测和自动化测试。 scrapy最吸引人的地方在于它是一个框架...
Python的爬虫框架 Scrapy 初探
2019-09-20 21:13

一个不务正业的互联网人的博客一、Scrapy介绍 Scrapy是一个为了爬取网站数据，用于快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。二、基本架构 Engine 引擎整个系统的核心数据流处理、触发事务 item ...
用数据分析来看哪种 Python 程序员最赚钱？
2019-06-18 21:21

魔都飘雪的博客本文以Python爬虫、数据分析、后端、数据挖掘、全栈开发、运维开发、高级开发工程师、大数据、机器学习、架构师这10个岗位，从拉勾网上爬取了相应的职位信息和任职要求，并通过数据分析可视化，直观地展示了这10个...
Scrapy爬取B站小姐姐入门教程，结果万万没想到！
2021-09-04 08:10

印象Python的博客 scrapy是由Python语言开发的一个快速、高层次的屏幕抓取和web抓取框架，用于抓取web站点并从页面中提取结构化的数据。它的作用有下: Scrapy 是用 Python 实现的一个为了爬取网站数据、提取结构性数据而编写的...
python15天使用教程_怎么才能在半个月内学会写Python？
2020-12-02 19:27

weixin_39825259的博客半个月学会写Python，完全可行！接下来，不BB，直接给你上干货。看完这些资料，保证你半个月完全掌握Python。而且能够达到找工作和面试的水准。以下资料全部来自互联网，全部100%免费使用。建议保存收藏，方便日后...
Python的进击（上）-- IC工程师的软实力
2021-08-20 23:03

艾思芯片设计的博客使用python提升工程师的软实力
Scrapy工作原理
2019-01-31 14:02

可爱丸学python的博客一、Scrapy架构图 Scrapy框架主要由六大组件组成，它们分别是调试器(Scheduler)、下载器(Downloader)、爬虫（Spider）、中间件（Middleware）、实体管道(Item Pipeline)和Scrapy引擎(Scrapy Engine) 1、Scrapy ...
python爬虫抓取分页_Python爬虫—简书首页数据抓取
2020-12-03 21:19

weixin_39581099的博客 seen_snote_ids[]参数应该在那找第一页我们看到第一页并没有带参数，我们再去看一下第二页的请求信息第二页请求信息有很多id，那么我们应该去哪找呢，我们先去看一下第一页的源码第一页源码信息看到这些数字...
没有解决我的问题, 去提问

有没有懂python scrapy代理ip的老哥?

2条回答 默认 最新

2条回答默认最新