自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(97)
  • 资源 (2)
  • 收藏
  • 关注

原创 shein列表页详情页评论页数据爬虫

shein详情页数据爬虫。

2024-10-18 10:14:08 933 3

原创 亚马逊评论获取

【代码】亚马逊评论获取。

2023-09-12 15:45:33 300 2

原创 登录系列|bitly.com网站

本文属于专栏python爬虫登录,该专栏列举了10+个网站的登录破解办法,如感兴趣,欢迎关注及订阅。主要在_xsrf参数的更新。

2023-07-20 12:15:58 1357

原创 Python——cmd调用(os.system阻塞处理)

os.system默认阻塞当前程序执行,在cmd命令前加入start可不阻塞当前程序执行。例如:

2023-01-05 11:00:18 1774

原创 通过requests登录店小秘解决验证码问题

requests登录的难点在于将验证码与账号联系起来,这里是cookie和referer。欢迎关注,爬虫王者

2022-12-07 17:32:41 818

原创 linux(centos)创建虚拟环境部署airflow

一、创建虚拟环境1.安装virtualenv,virtualenvwrapperpip install virtualenv virtualenvwrapper安装好之后创建存放虚拟环境目录,这里我存在 ~/pythonvenv 里,查看当前路径:pwd,返回/home/cch/pythonvenv如果没有pip 先安装pip:yum install -y pip安装好了之后,查找virtualenv位置:find / -name virtualenv例:返回:/home/cch/.local

2022-05-29 11:55:35 655

原创 天工矩阵爬虫

# - * - coding : utf-8 - * -"""====================================================================================================================function : 具体需求如下: http://www.titanmatrix.com/tgxx 按照品牌和系列可以看到选型参数 不同

2021-12-29 13:44:46 569 2

原创 多个CSV写入同一个Excel不同sheet中

import pandas as pdexcelWriter = pd.ExcelWriter("result.xlsx")for index, name in enumerate(names): df = pd.read_csv(f"data/{name}.csv", encoding='utf-8') df.to_excel(excel_writer=excelWriter, sheet_name=name, index=None)excelWriter.save()

2021-10-15 15:57:48 1330

原创 PDF转图片

由于pyautogui无法在电脑软件上进行粘贴操作,故通过向日葵远程桌面进行粘贴操作发送任务端# - * - coding : utf-8 - * -"""====================================================================================================================function : PDF转图片自动化===================================

2021-10-15 11:22:05 165

原创 工品一号登录

本文属于专栏python爬虫登录,该专栏列举了10+个网站的登录破解办法,如感兴趣,欢迎关注及订阅。录入的网站有:1688淘宝信发集团上海有色网厦钨平台用友商业创新平台京满仓(工品汇)米思米三块神铁怡合达万千紧固件工品一号其中技术难点包括验证码识别,js逆向分析等。网站持续增加中…如以上网站不在您需要的范围内,欢迎私信询问。# - * - coding : utf-8 - * -import urllib3urllib3.disable_warnings()im

2021-10-13 15:48:38 715

原创 pyautogui的键盘功能不能在软件界面上实现

pyautogui的键盘功不能在软件界面上实现!

2021-10-12 16:47:25 567

原创 怡合达登录

本文属于专栏python爬虫登录,该专栏列举了10+个网站的登录破解办法,如感兴趣,欢迎关注及订阅。录入的网站有:1688淘宝信发集团上海有色网厦钨平台用友商业创新平台京满仓(工品汇)米思米三块神铁怡合达万千紧固件其中技术难点包括验证码识别,js逆向分析等。网站持续增加中…如以上网站不在您需要的范围内,欢迎私信询问。# - * - coding : utf-8 - * -import urllib3urllib3.disable_warnings()import

2021-10-09 16:26:10 431

原创 京满仓(工品汇)登录

本文属于专栏python爬虫登录,该专栏列举了10+个网站的登录破解办法,如感兴趣,欢迎关注及订阅。录入的网站有:1688淘宝信发集团上海有色网厦钨平台用友商业创新平台京满仓(工品汇)米思米三块神铁怡合达万千紧固件其中技术难点包括验证码识别,js逆向分析等。网站持续增加中…如以上网站不在您需要的范围内,欢迎私信询问。import urllib3urllib3.disable_warnings()import osimport reimport mathimpor

2021-10-09 16:22:07 1282

原创 js分析之怡合达模拟js生成verify, nvcValue, timestamp, type - 公开版

一 需求https://www.yhdfa.com/product/A/A01/SAD01-22?productModel=SAD01-D3-L50账号:xx密码:xx获取指定型号的价格信息二 分析请求发现通过这个接口获取:https://www.yhdfa.com/apiphp/quotation/enquiry,这里的token通过登录获取,临时性任务的话直接复制粘贴得了。难点在于verify生成。三 实操分析发现verify是通过这个接口生成的。那么就来看看如何请求得到这个capt

2021-09-29 19:43:53 422

原创 js与python转化

jspython>>>>>string.charCodeAt(index)ord(string[index])encodeURIComponenturllib.unquote实现js中unescape解码方法import urllib.parseimport sysimport htmlimport redef unescape(string): string = urllib.parse.unquote(strin...

2021-09-07 15:01:43 1368

原创 Ubuntu18 airflow安装及使用

1.下载安装virtualbox(Oracle VM VirtualBox)2.下载ubuntu16镜像https://releases.ubuntu.com/xenial/3.virtualbox新建一个虚拟环境(选择Linux64)完成后,选择设置-存储-没有盘片-分配光驱-选择下载的ubuntu-16.04.6-desktop-i386.iso4.安装ubuntu16环境5.安装pip3:wget https://bootstrap.pypa.io/pip/3.5/get-pip.pypy

2021-07-30 09:36:06 1818

原创 chrome截长图

chrome截长图: F12-> CTRL+SHIFT+P ->capture full size screenshot对某些网页table节点似乎不能做到屏幕外节点截图

2021-05-21 17:14:17 422

原创 1688获取数据并发邮件

# - * - coding : utf-8 - * -import osfrom datetime import datetime, timedeltaimport timeimport pyautoguiimport pyperclipimport randomimport pandas as pdimport jsonimport mathfrom urllib.parse import urlencodefrom utils.request import Reques

2021-04-21 16:24:38 713

原创 linux运行xx.exe报错

linux不能运行xx.exe文件,只能运行xx文件

2021-04-08 17:10:14 274

原创 linux运行phantomjs报错QXcbConnection: Could not connect to display

https://panfake.com/2020/03/qxcbconnection-could-not-connect-to-display/首先vim ~/.bashrc然后把下面的这句话加进去,第一行就可以export QT_QPA_PLATFORM='offscreen'运行如下命令使配置生效source ~/.bashrc再次运行phantomjs,无报错成功进入。...

2021-04-08 15:15:11 608 1

原创 json.loads()出现Expecting property name enclosed in double quotes: line 1 column 2 (char 1)

import demjsonimport jsoncookie = cookie_handler.get_cookies()# print(json.loads(cookie))cookie = demjson.decode(cookie)print(cookie)使用demjson转换

2021-03-23 15:23:20 721

原创 selenium 加载到设定时长后不再加载(防止长时加载)

from selenium import webdriverfrom selenium.webdriver.common.desired_capabilities import DesiredCapabilitiesimport time desired_capabilities = DesiredCapabilities().CHROMEdesired_capabilities['pageLoadStrategy'] = 'none'driver = webdriver.Chrome(desi

2021-03-18 11:43:51 603

原创 解决某网站无法调试的问题(function anonymous( ) { debugger })

Ctrl+F8

2021-02-23 21:51:24 35720 1

原创 下载fiddler后出现注册不了的情况

下载fiddler everywhere后出现注册不了的情况(发送的注册邮件链接地址打开有误):下载经典版的fiddler即可。https://www.telerik.com/fiddler安装包可见百度网盘:链接:https://pan.baidu.com/s/1i_d-bJPg2jkFf3EOUf9_ww提取码:sfcb...

2021-01-24 20:38:54 2885

原创 视频/音频处理工具ffmpeg安装

1.网站https://ffmpeg.org/2.D:\zhichixuqiu\9267\ffmpeg\bin 加入到环境变量3.验证

2020-12-11 16:05:37 125

原创 解决IntelliJ定位不到函数定义问题

1.IDEA close调project2.删除.idea3.重启IDEA4.build

2020-11-18 19:36:56 1089

原创 索引,分区和分桶的区别

一、索引简介Hive支持索引,但是Hive的索引与关系型数据库中的索引并不相同,比如,Hive不支持主键或者外键。Hive索引可以建立在表中的某些列上,以提升一些操作的效率,例如减少MapReduce任务中需要读取的数据块的数量。为什么要创建索引?Hive的索引目的是提高Hive表指定列的查询速度。没有索引时,类似WHERE tab1.col1 = 10的查询,Hive会加载整张表或分区,然后处理所有的rows,但是如果在字段col1上面存在索引时,那么只会加载和处理文件的一部分。与其他传统数

2020-11-10 10:34:06 660

原创 Grunt 使用

https://www.cnblogs.com/wangweizhang/p/10531848.html

2020-10-28 17:20:01 126

原创 yii框架第一个应用浏览器始终无法打开的坑

对于小白来说,https://www.yiichina.com/doc/guide/1.1/quickstart.installation是很好的yii框架学习指南。按照指南写第一个应用的时候出现打不开网页的情况。简单总结以下几点:1.想通过浏览器打开页面,首先得开启http服务,建议使用wampserver,安装后,一键开启即可,不开启服务是不行的。2.指南中的http://hostname/path/to/yii/requirements/index.php并没有说明白到底是什么!这对于小白很不

2020-09-28 16:08:30 571

原创 python3 requests禁用安全请求警告

# 禁用安全请求警告import requestsfrom requests.packages.urllib3.exceptions import InsecureRequestWarningrequests.packages.urllib3.disable_warnings(InsecureRequestWarning)控制台输出中无 SSL认证警告 了亲测可用

2020-09-02 14:32:37 1223

原创 论年会为何物,看来年寻觅他处

迈入职场已一年有余,离开学校后,才发现生活的不易,甚至丢失了生活的方向,丢失了奋斗的方向。因为看不到出路,无任何含金量专业毕业的我(985硕)工作半年后毅然裸辞,自学编程。在家啃了3个月的书之后开始找工作,所幸老天待我不薄,一个星期时间我就拿到一个offer,没有太多的犹豫,我就入职了,虽然工资在行业里算是垫底的(一万出头),但好歹比之前多了好几千,所以打算踏踏实实的好好干,慢慢攒经验(简历上无...

2020-08-12 17:16:07 288 5

原创 css选择器中:nth-child()和:nth-of-type()简洁明了的区别

以https://bj.fang.lianjia.com/loupan/p_ycyxhfaawyk/huxingtu/1120032477145011.html为例,观察.news-glob > div:nth-child(10)和.news-glob > div:nth-of-type(10)的区别。实验发现:div:nth-child(10):是选择第10个子节点(按顺序看所有子节点),若第10个子节点是div节点,则返回该节点,若该节点不是div节点,则返回空。div:nth-of-

2020-07-14 17:18:03 366

原创 常用SQL语句及SQL效率提高

这里写自定义目录标题数据库类型Postgresql功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入数据库类型你好! ...

2020-07-02 10:12:56 171

原创 Python求质数/素数

先写一个装饰器,为了测试执行时间from functools import wrapsimport timedef f1(func): @wraps(func) def f2(): begin = time.time() func() end = time.time() print('cost', end - begin) return f2

2020-06-22 15:16:59 302

原创 pycharm配置

打开设置添加外部工具使用

2020-06-19 15:14:48 497

原创 python装饰器-测试运行时间

单独写一个函数d1.pyfrom functools import wrapsimport timedef f1(func): @wraps(func) def f2(): begin = time.time() func() end = time.time() print('cost', end - begin) return f2以下是应用from d1 import f1@f1def f():

2020-06-19 14:27:13 408

原创 win10安装python文字识别包pytesseract

安装pytesseractpip insatll pytesseract安装Tesseract-OCR(https://github.com/tesseract-ocr/tesseract)安装完后将Tesseract-OCR的安装路径添加到环境变量中PATH和Path中,都要添加。重启使用:from PIL import Imageimport pytesseractimage = Image.open('2.png')c = pytesseract.image_to_s.

2020-06-11 10:36:18 353

原创 利用PIL进行图片裁剪与拼接之简单使用

最简单最清晰的方法如下:# -*- coding: utf-8 -*-from PIL import Image# 图片裁剪# img = Image.open('imgs/2.jpg')# print('图片的大小为: {}'.format(img.size))# img.resize((700, 700))# img.show()# img2 = img.crop((0, 0, 700, 600))# img2.save('imgs/3.jpg')# img3 = img.cro

2020-05-14 22:50:33 818

原创 用Tkinter的mainloop时插入循环用线程

import Threadclass Product(): def __init__(self): pass def f1(self): while True: time.sleep(1) print(1) def f2(self): while True: ...

2020-04-19 16:04:29 1896

原创 linux分屏工具

Screen https://blog.csdn.net/qq_39498924/article/details/101272208linux分屏工具,可管理远程会话,可多屏编程

2020-04-19 16:02:14 332

charles-proxy-ssl-proxying-certificate.pem

charles-proxy-ssl-proxying-certificate.pem

2022-10-23

机器学习破解滑块验证码.rar

机器学习学习人为拖动轨迹,模拟滑块拖动,提高通过率

2020-05-16

pymssql‑2.1.4.dev5‑cp37‑cp37m‑win32.whl pymssql‑2.1.4.dev5‑cp37‑cp37m‑win_amd64.whl.rar

pymssql‑2.1.4.dev5‑cp37‑cp37m‑win32.whl pymssql‑2.1.4.dev5‑cp37‑cp37m‑win_amd64.whl

2019-11-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除