
Python 爬虫
文章平均质量分 62
Python 爬虫
一个不务正业的程序猿
这个作者很懒,什么都没留下…
展开
-
Python 爬虫(5)Beautiful Soup 4 实战
BeautifulSoup 是一个用于从 HTML 或 XML 文件中提取数据的 Python 库。它可以将复杂的 HTML 或 XML 文档转化为树形结构,使得开发者能够轻松地遍历、搜索和修改文档内容。借助 BeautifulSoup,我们能够迅速定位到所需的数据,如特定的标签、属性或文本信息。自动将输入文档转换为Unicode编码,输出文档转换为UTF-8编码。支持多种解析器(如lxml、html5lib等)。提供简单易用的导航、搜索和修改文档树的方法。能够处理不规范的HTML文档。原创 2025-03-30 22:38:45 · 1160 阅读 · 0 评论 -
Python 爬虫(4)HTTP协议
HTTP(HyperText Transfer Protocol,超文本传输协议)是互联网上应用最为广泛的一种网络协议,用于在客户端和服务器之间传输超文本(如HTML文件)。HTTP协议是Web的基础,它定义了客户端如何请求资源以及服务器如何响应这些请求。原创 2025-03-21 09:28:51 · 1048 阅读 · 0 评论 -
Python 爬虫(3)requests包
在Python爬虫开发中,原创 2025-03-20 11:16:36 · 1084 阅读 · 0 评论 -
Python 爬虫(2)Web请求
Web请求是互联网通信的基础,它允许客户端(如浏览器)与服务器之间进行数据交换。理解Web请求的原理对于开发Web应用、优化性能以及解决网络问题至关重要。本文将详细介绍Web请求的基本原理,包括其组成部分、工作流程以及常见的协议和技术。原创 2025-03-18 14:39:18 · 1040 阅读 · 0 评论 -
Python 爬虫 (1)基础 | XHR
XHR,全称XMLHttpRequest,是一种在无需重新加载整个网页的情况下,能够更新部分网页的技术。它允许网页的JavaScript代码与服务器进行异步通信,即在发送请求后,浏览器不会阻塞用户的后续操作,而是等待服务器响应后再处理数据。XHR是AJAX(Asynchronous JavaScript and XML)技术的核心,尽管名称中包含“XML”,但实际上它并不限于传输XML数据,也可以传输JSON、HTML、纯文本等多种格式的数据。原创 2024-12-09 09:47:25 · 1271 阅读 · 1 评论 -
Python 爬虫 (1)开发者工具 | 功能简介
一、功能简介原创 2024-11-24 09:35:12 · 138 阅读 · 0 评论 -
Python 爬虫 (1)基础 | 基础操作
安装JS环境:https://www.jb51.net/python/307069k7q.htm。原创 2024-11-22 23:19:17 · 1129 阅读 · 0 评论 -
Python 爬虫 (1)基础 | 目标网站
一、目标网站1、加密网站1.1、带关键字企名片:https://wx.qmpsee.com/articleDetail?id=feef62bfdac45a94b9cd89aed5c235be原创 2024-11-22 10:16:16 · 637 阅读 · 0 评论