用Python爬取QQ空间说说和相册!还不让我访问!

本文介绍了如何使用Python的selenium模块自动化登录QQ空间,抓取个人说说和相册内容。通过分析网页源代码,定位登录字段,并实现滚动加载获取全部说说。同时模拟鼠标操作进入相册,下载照片。文章以实例展示,带领读者回味过去的青春记忆。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

QQ 空间在 2005 年被腾讯开发,已经经历了 15 个年头,在还没有微信的年代,看网友发表的心情、心事、照片大多都在 QQ 空间的里。它承载了80、90 后的大量青春,下面我们一起用 selenium 模块导出说说和相册回忆青春吧

安装 selenium selenium 是一个在浏览器中运行,以模拟用户操作浏览器的方式获取网页源码,使用 pip 安装 selenium 模块 pip install selenium 复制代码 查看 chrome 浏览器版本并下载 对应的 chrome 浏览器驱动

在 http://npm.taobao.org/mirrors/chromedriver 网址中找到相同版本的 chrome 驱动,并放在 python 程序运行的同一个文件夹中 登陆 按 F12 检擦网页源代码,找到登录和密码的文本框,如下图所示

def login(login_qq,password, business_qq): ''' 登陆 :param login_qq: 登陆用的QQ :param password: 登陆的QQ密码 :param business_qq: 业务QQ :return: driver ''' driver = webdriver.Chrome()

driver.get('https://user.qzone.qq.com/{}/311'.format(business_qq))  # URL
driver.implicitly_wait(10)  # 隐示等待,为了等待充分加载好网址
driver.find_element_by_id('login_div')
driver.switch_to.frame('login_frame')  # 切到输入账号密码的frame
driver.find_element_by_id('switcher_plogin').click()  ##点击‘账号密码登录’
Python爬取别人的QQ空间相册通常涉及到网络抓取HTML解析,因为QQ空间的内容通常是动态加载在网页上的。以下是一个简化的步骤说明: 1. **安装必要的库**:首先,你需要安装`requests`库来发送HTTP请求,以及像`BeautifulSoup`或`lxml`这样的库用于解析HTML内容。 ```bash pip install requests beautifulsoup4 ``` 2. **获取网页源码**:使用`requests.get()`函数获取QQ空间相册页面的HTML。注意,这可能会遇到反爬策略,所以需要模拟浏览器行为并处理cookies。 ```python import requests url = 'https://user.qzone.qq.com/{username}/photoalbums' # 将{username}替换为目标用户的空间地址 headers = {'User-Agent': 'Mozilla/5.0'} # 设置合适的User-Agent response = requests.get(url, headers=headers) html_content = response.text ``` 3. **解析HTML**:使用BeautifulSoup解析HTML,找到包含图片URL的部分。这通常在CSS选择器或JavaScript生成的内容中,所以可能需要一些时间定位。 ```python from bs4 import BeautifulSoup soup = BeautifulSoup(html_content, 'lxml') album_images = soup.select('.photo-item img') # 根据实际HTML结构调整选择器 ``` 4. **保存图片**:拿到图片链接后,可以使用`requests`下载图片并保存到本地。 ```python for image in album_images: img_url = image['src'] with open(f'{image["alt"]}.jpg', 'wb') as f: response = requests.get(img_url, stream=True) for chunk in response.iter_content(1024): f.write(chunk) ``` 请注意,直接爬取他人QQ空间可能违反服务条款,并且频繁操作可能会导致账号受限。在实际操作前,最好先检查目标网站的robots.txt文件政策,确保你的行为合法。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值