Python爬虫层层递进，从爬取一章小说到爬取全站小说！

原创

于 2019-11-15 14:30:35 发布 · 965 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#Python

本文教你如何使用Python爬虫，结合requests和xpath，从爬取单一章节到实现全站小说的抓取。讲解了从获取网页数据、解析数据到数据持久化的全过程，并提供全站爬取的思路和方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

很多好看的小说只能看不能下载，教你怎么爬取一个网站的所有小说

知识点：

requests
xpath
全站小说爬取思路

开发环境：

版本：anaconda5.2.0（python3.6.5）
编辑器：pycharm

第三方库：

requests
parsel

进行网页分析

目标站点:

私信博主01 领取完整代码！

开发者工具的使用networkelement

爬取一章小说

requests库的使用（请求网页数据）
对请求网页数据步骤进行封装
css选择器的使用（解析网页数据）
操作文件（数据持久化）

# -*- coding: utf-8 -*-
import requests
import parsel
"""爬取一章小说"""
# 请求网页数据
headers = {
 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safa

最低0.47元/天解锁文章

200万优质内容无限畅学