Python爬虫之requests的高级用法

本文详细介绍了Python requests库的高级用法,包括文件上传、设置Cookies和使用正则表达式处理HTML内容。示例代码展示了如何进行文件上传、如何获取和设置Cookies以维持登录状态,以及如何利用正则表达式匹配和提取网页信息。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

高级用法

在上节中,我们了解了requests的基本用法,如基本的GET、POST请求以及Response对象。在本节中,我们再来了解以下requests的一些高级用法,如文件上传、Cookies设置、代理设置等。

文件上传

我们知道requests可以模拟提交一些数据。假如有的网站需要上传文件,我们也可以用它来实现,这非常简单,示例如下:

image

在前一节中我们保存了一个文件favicon.ico,这次用它来模拟文件上传的过程。需要注意的是,favicon.ico需要和当前脚本在同一目录下,如果有其他文件,当然也可以使用其他文件来上传,更改下代码即可。

运行结果如下:

image

以上省略部分内容,这个网站会返回响应,里面包含files这个字段,而form字段是空的,这证明文件上传部分会单独有一个files字段来标识。

Cookies

前面我们使用了urllib处理过Cookies,写法比较复杂,而有了requests,获取和设置Cookies只需一步即可完成。

我们先用一个实例看一下获取Cookies的过程:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值