《Python网络安全项目实战》项目5 编写网站扫描程序_python安全编程项目实训教程-CSDN博客

本文链接：https://blog.csdn.net/zheng_ruiguo/article/details/143782658

《Python网络安全项目实战》项目5 编写网站扫描程序

项目目标：
任务5.1 暴力破解网站目录和文件位置
任务5.2 制作网页JPG爬虫

WEB网站安全渗透测试过程中需要进行目录扫描和网站爬行，网上可以找到一些不错的工具软件，但是对于别人写的工具是否安全可靠有待商榷，所以我们如果能够写出自己的网站扫描和爬行程序，对于我们的工作会有极大的帮助。
使用Python的标准网络模块编写网络工具软件非常方便，这里我们使用Python完成网站扫描程序的编写。

项目目标：

 熟悉使用Python进行网站扫描程序的编写。

任务5.1 暴力破解网站目录和文件位置

任务描述

当我们通过sql注入等方式得到网站的数据库时，由于后台一般是隐藏起来的，所以我们想要登陆后台的话，还是要手工或者以暴力破解的方式找到后台。

任务分析

对一个站点目录和文件进行扫描，那么就需要用Python3环境下requests模块。扫描目录主要是对网站地址发出请求，若网站存在这个地址则会返回状态码200，如果不存在则会返回404，如果是没有权限访问，或者是其他一些情况，都会有相应的状态码，我们主要是需要访问成功的状态码和地址就可以了。
Requests 是使用 Apache2 Licensed 许可证的 HTTP 库, 支持 HTTP 连接保持和连接池，支持使用cookie 保持会话，支持文件上传，支持自动确定响应内容的编码，支持国际化的 URL 和 POST 数据自动编码。本次任务要扫描的WWW服务器就搭建在本机上，我们在本机搭建了一个Discuz网站，计划扫描的网址是：http://127.0.0.1/Discuz/upload。
pathlist.txt是预先准备的字典文件，包含网站常用文件路径的字符串列表。
应用字典碰撞的原理，使用上万条字典条目进行碰撞。字典中包括常用网站的含有路径的文件名，获得有反馈的条目记录，其中就体现出了常用网站的目录结构。

任务实施

实验环境：windows 7、phpstudy、php5.4.45、apache、mysql5.0.10。
【步骤1】：建立pathlist.txt,我们将这些文件夹的名字保存进一个TXT文件中，建立一个目录字典，再加一些这个目录中没有的文件名扩展程序可查找文件范围，如图5-1-1所示。
在这里插入图片描述