- 博客(302)
- 收藏
- 关注
原创 Pandas库:(四)数组对象的增删改操作
它可以替换单个值、列表中的多个值、正则表达式匹配的值,甚至可以使用字典指定复杂的替换规则。它是一个非常常用的数据清理工具,可以根据索引或标签删除指定的行或列。Keep:支持'first', 'last', ``False``,默认为first,表示要保留的数据,False是表示都不保留。ignore_index=True :是否生成新的索引,新索引使用系统默认的整型索引。axis=0:表示沿着指定的轴拼接(默认为0,表示行方向;ignore_index:是否生成新的索引,新索引使用系统默认的整型索引。
2025-02-21 15:25:32
971
原创 Pandas库:(三)数组对象的数据查询
iloc表示计算机系统记忆的索引(从0开始的整型递增数字),不支持的修改的索引,相当于EXCEL中的行号和列号,用法:DataFrame.iloc()[行索引,列索引]使用时可以省去括号 ,loc()[] 同 loc[] ,iloc()[] 同 iloc[],[]中均可传两个参数,[行参数,列参数]loc表示自定义或系统默认索引,支持修改的索引,用法:DataFrame.loc()[行索引或行名称或条件,列名称]tail: 获取后n行,有一个参数n,默认=5,为后五行,可以自定义设置。
2025-02-20 12:02:57
629
原创 Pandas库:(二)数组对象的索引
对于顺序数据(索引必须是单调递增或递减的),如时间序列或数值作为索引时,重建索引时会需要进行插值或填值处理,使用method参数进行设置。"backfill"和"bfill", 表示后项值填充;"ffill"和 "pad",表示前项值填充。默认的缺失值为nan,可通过fill_value参数指定自定义的缺失值。重建索引时,如果索引值不存在就会引入缺失值。
2025-02-19 16:31:50
164
原创 Pandas库:(一)数组对象的创建
Pandas是Python高效且强大的数据分析库。它是基于NumPy的数据分析模块,它提供了大量标准数据模型和高效操作大型数据集所需的工具。Pandas有:Series、DutaFrame和Panel三种数据结构。Series类似于数组,DataFrame类似于表格的二维数组,Panel可以视为Excel的多表单Sheet。方便测试,这里写两个方法用来产生随机列表和字典。
2025-02-19 15:42:05
299
原创 python+Ollama库实现简单的AI模型问答交互
安装ollama库:pip install ollama -i https://pypi.mirrors.ustc.edu.cn/simple/需要先在本地部署对应的模型。
2025-02-18 16:04:31
423
原创 DeepSeek本地部署和调用
ollama是一个开源的本地大语言模型运行框架,设计用于简化在本地运行大型语言模型的过程,降低使用门槛。它通过简单的安装指令,使得用户可以通过一条命令在本地运行开源大型语言模型。Ollama保留了类似Docker的操作习惯,支持上传和管理大语言模型仓库。可选择Chatbox或Cherry Studio作为可视化交互工具使用。当前太过火热,下载一直很慢,点击后几乎没有响应,这里选择使用。打开命令行窗口进行命令运行,下载安装有点慢哦,耐心等待一下,你可以正常问它,但是它不一定正常回复你,呵呵。
2025-02-18 15:13:05
870
原创 Python+PIL:压缩图片
有时在发送一些文件如PPT、Word时,由于文件中的图片太大,导致文件也太大,无法发送,所有可以对文件中的图片进行压缩,下面代码根据用户自定义的目标大小(如30KB或40KB)进行压缩,并尽可能保证图片清晰度。:优先降低质量,避免不必要的缩放,减少清晰度损失。:在压缩后对图片进行锐化处理,进一步提升清晰度。重采样算法,保证缩放后的图片清晰度。
2025-02-12 16:59:09
251
原创 Python+spire.doc:读取Word文档内容
因为Word文档本质上是流式文档,流式布局,所以没有“页面”的概念。为了方便页面操作,Spire.Doc for Python提供了FixedLayoutDocument类,用于将Word文档转换为固定布局。Document.Sections[index] 属性可用于获取Word 文档中的特定节点。获取后,可遍历该节中的段落、表格等。可对查找的内容进行其他操作。
2025-02-12 15:52:00
610
原创 Python-pywin32库的使用
Beep()用于通过计算机的主板扬声器(或声卡模拟)发出指定频率和时长的蜂鸣声。与(播放系统预定义声音)不同,Beep()允许自定义声音的频率和持续时间。参数名类型描述frequencyint声音的频率(单位:赫兹,Hz)。37 Hz 到 32767 Hz。262 Hz (中音C)、440 Hz (标准音A)、1000 Hz (高频提示音)durationint声音的持续时间(单位:毫秒,ms)。正整数(如 500=0.5秒)。演示一段音符,# 定义音符频率和时长(毫秒)melody = [
2025-02-12 11:16:20
1565
原创 Python内置库之pathlib
print(p.stat().st_atime) # 输出最后访问时间print(p.stat().st_mtime) # 输出最后修改时间print(p.stat().st_atime) # 输出文件系统最后访问时间print(p.stat().st_mtime) # 输出文件系统最后修改时间print(p.stat().st_atime) # 输出文件系统最后访问时间print(p.stat().st_mtime) # 输出文件系统最后修改时间。
2025-02-11 11:28:32
929
原创 Python+wxauto:实现电脑端微信程序自动化
wxauto库底层使用的是uiautomation框架,进行了封装处理。安装:pip install wxauto -i https://pypi.tuna.tsinghua.edu.cn/simple/
2025-02-10 17:46:37
3155
1
原创 python+playwright自动化测试(十):自动化脚本录制
录制命令示例:playwright codegen --target python -o E:\桌面\test_pro.py -b chromium https://www.baidu.com。
2025-02-10 14:10:25
395
原创 python内置库之getpass、msvcrt:密码安全输入(keyring+getpass、msvcrt实现密码安全管理)
中介绍了使用keyring库进行密码的安全存储,但是也提到keyring库的使用可能需要用户的交互,如在首次存储凭证时输入密码或修改密码时需要输入密码,这样会是密码暴露出来。所有我们可以使用Python的内置库getpass,这个模块是用来在终端(命令行界面)中安全地获取用户密码输入的。在用户输入密码时隐藏输入内容,从而增强了安全性。对于编写需要用户输入密码的程序非常有用。
2025-02-10 11:28:46
478
原创 python之keyring库:安全密码管理库,不同平台service_name、username的获取
keyring是一个Python库,它提供了一个简单的方法来访问系统的密钥管理服务,使得存储和检索敏感信息(如密码)变得更加安全和便捷。使用keyring库的好处之一是它抽象了底层密钥管理的细节,使得你的应用程序可以跨多个平台(如Windows、macOS、Linux等)一致地工作,而无需关心每个平台特定的密钥存储机制,方便测试及开发中的用户及密码管理。需要注意的是,keyring库的使用可能需要用户的交互(如在首次存储凭证时输入密码),这取决于底层的密钥管理服务实现。
2025-02-10 10:18:51
1091
1
原创 adb命令对手机短信进行读取
Android的短信存储在content provider中,通常是content://sms/inbox。可根据短信的内容、发件人号码或时间戳来筛选短息。因此,ADB命令需要包含这些条件。例如,使用--where参数来指定条件,比如address='号码'或body LIKE '%关键词%'。通过调整--uri参数可操作不同短信箱(收件箱)(已发送)(草稿箱)content://sms/all (所有短信)content://sms/outbox 发件箱(尚未发送)
2025-02-08 17:26:05
644
原创 python+imbox实现邮件读取、附件下载、邮件删除
print(message.body['plain']) 输出结果是 Unicode 编码的字符串列表,而不是直接解析后的文本。返回的邮件正文内容可能是以列表形式存储的,并且可能包含 HTML 实体或 Unicode 编码。)将 Unicode 编码的字符串转换为可读文本。返回的是一个列表,你需要提取列表中的字符串。:如果邮件正文包含 HTML 实体(如。:使用 Python 的内置功能(如。可根据邮件内容或主题等进行标记。可根据邮件内容或主题等进行删除。
2025-02-08 14:15:52
399
原创 python+imaplib+email实现邮箱数据读取、附件下载、条件删除
可以根据条件如邮件标题、内容等进行邮件的删除操作,注意此删除操作是真删,删除后无法在已删除邮件中找到邮件。等),或者正文内容可能是 HTML 或纯文本的多部分结构。这个错误是因为邮件的正文内容可能不是 UTF-8 编码的文本,而是其他编码格式(如。需要遍历邮件的各个部分,找到合适的正文内容。如果没有明确指定编码,可以尝试常见的编码格式(如。:邮件的正文可能包含多种编码格式,需要根据邮件的。可指定邮件时间获取对应范围内容的邮件。库提供的工具安全地解码邮件正文。:邮件正文可能是多部分结构(如。
2025-02-08 11:28:50
1351
原创 python+playwright自动化测试(九):expect断言和expect_xxx()元素及事件捕获
如果提供了谓词,则传递‘ Page ’值输入‘ predicate ’函数,并等待‘ predicate(event) ’返回一个真值。context.expect_event():指定事件触发时执行一个断言函数,并返回事件数据值。这些方法通常用在异步编程中,特别是在测试框架中,如pytest,可以帮助在测试期间等待特定的页面状态或元素状态。context.expect_console_message():执行操作并等待‘ ConsoleMessage ’在上下文中的页面中被记录。
2025-01-24 17:13:00
456
原创 python+playwright自动化测试(八):iframe切换、多窗口切换
context.add_cookies():将cookie添加到此浏览器上下文所在的所有页面中。context.grant_permissions():浏览器上下文的指定权限授权。context.clear_cookies():清除context的cookie。context.clear_permissions():清除授权。context.pages :获取context所有page对象。context.new_page():生成一个新的page对象。context.close():关闭context。
2025-01-24 10:49:12
537
原创 python+playwright自动化测试(七):同步与异步
异步需要导入from playwright.async_api import async_playwright,使用with async_playwright()创建上下文操作对象。代码中需要使用异步编程库asyncio中的async进行异步函数的定义,每个要执行的语句需要使用await关键字等待异步执行的结果返回。
2025-01-24 10:07:28
464
原创 python+playwright自动化测试(六):设置代理及网络监听和数据拦截修改
上面代码中使用了from functools import partial,解决事件监控时的函数传参问题,监控函数第一个传参为事件本身,如on_close中的event实际代表close。当然后面的网络拦截中也适用。修改响应数据通过使用 APIRequestContext 获取原始响应,然后将响应传递给 route.fulfill()。这种方式可以在不修改代码的情况下改变代理设置。中止请求使用route.abort()要在固定的上下文中使用代理,可以使用。
2025-01-23 16:53:24
476
原创 python+playwright自动化测试(五):使用token实现免登录
自动化测试时时常需要做初始化的动作,但又不需要每次都做登录操作,尤其是单元测试过程中,那么就需要做免登录处理。
2025-01-23 12:01:26
514
原创 python+playwright自动化测试(四):元素操作(键盘鼠标事件)、文件上传
支持键盘按键,可执行的按键有Backquote, Minus, Equal, Backslash, Backspace, Tab, Delete, Escape,ArrowDown, End, Enter, Home, Insert, PageDown, PageUp, ArrowRight,ArrowUp, F1 - F12, Digit0 - Digit9, KeyA - KeyZ, etc。但输入结果有所不同,type()输入内容不会清除后输入,会在原来内容的基础上追加。通过循环输入可看出差异。
2025-01-22 16:11:35
705
原创 python+playwright自动化测试(三):事件等待机制
playwright中的timeout默认为30s,timeout=30000,有时需要根据具体情况进行自定义调整。
2025-01-17 16:41:40
1096
原创 python+playwright自动化测试(二):元素定位与页面内容获取
官网:playwright同selenium一样,支持css、xpath等的元素方法定位。
2025-01-14 17:37:45
1607
原创 python+playwright自动化测试(一):安装及简单使用,截图录屏
playwright是一个非常强大的自动化框架,支持Linux、Mac以及Windows操作系统操作,支持Chromium、Firefox、WebKit等主流浏览器自动化操作。官网:https://playwright.dev/安装playwright框架:pip install playwright安装浏览器驱动:playwright install ,可指定对应浏览器安装,如playwright install Chromium,不指定时安装默认的Chromium、Firefox、Webkit,
2025-01-14 12:01:41
882
原创 用python实现html转pdf:weasyprint、pdfkit
OSError: cannot load library 'libgobject-2.0-0': error 0x7e. Additionally, ctypes.util.find_library() did not manage to locate a library called 'libgobject-2.0-0',需要将gtk的bin添加到环境变量path中,或者使用os模块添加。在文件或字符串转pdf时,可通过css选项指定外部css文件,支持单个或多个css文件的添加。
2025-01-10 11:39:51
977
原创 python+pdfplumber:提取和分析PDF中的表格、文本等数据,实现pdf转图片、CSV、JSON、dict
安装:pip install pdfplumber -i https://pypi.tuna.tsinghua.edu.cn/simple/
2025-01-09 14:25:29
943
原创 python+fpdf:创建pdf并实现表格数据写入
fname=r'C:\Users\DELL\AppData\Local\JianyingPro\User Data\Cache\effect\9182767\56dfcfca94158a7a92263aa5b41f8a84-preview\Aa以梦为马.ttf')
2025-01-08 17:50:34
922
原创 python+watchdog 实现文件资源监控
watchdog 支持跨平台文件资源监控,可以检测指定文件夹下文件及文件夹变动,当出现不同变动(新增、删除、修改)后,可进行相应处理。安装:pip install watchdog。
2025-01-07 16:25:08
234
原创 python+camelot库:提取pdf中的表格数据
支持将读取到的表格数据转为以下格式的文件:"csv", "html", "json", "markdown", "excel", "sqlite"pages:要提取表格的页面范围,可以是单个页面或多个页面,如值为‘1-4’,表示1到4页,如写成‘1,4,6’表示提取第1,第4,第6页的数据。table_areas:要提取表格的区域范围,可以是单个区域或区域范围的列表[x1,y1,x2,y2]。flavor:PDF解析器的类型,默认为"lattice",常用选择"stream"。
2025-01-07 15:02:14
740
原创 python+PyMuPDF库:(三)pdf文件的选择性合并、其他格式文件转pdf
insert_file: 支持docx、xlsx、pdf、PPTX、txt、svg、xps、FB2、CBZ、EPUB、MOBI、HWPX、图片等多种格式的文件的插入。利用此方法可以将此类文件转为pdf格式的文件。# from_page,to_page 要截取的开始页和终止页,默认为-1,表示所有页。# start_at 要插入到某页,默认-1,表示最后一页。insert_pdf :用来打开pdf文件并插入。# rotate旋转角度。
2025-01-03 17:09:19
432
原创 python+PyMuPDF库:(二)提取pdf文件中的图片及修改内容
修改图片时无法加载直接将目标图片替换成和原pdf图片一样的大小,会出现空白,边框等,这里使用PIL单独写了一个方法将目标图片修改成和要求一样的大小。
2024-12-27 18:02:51
400
原创 python+PyMuPDF库:(一)创建pdf文件及内容读取和写入
安装:pip install PyMuPDF -i https://pypi.mirrors.ustc.edu.cn/simple/PyMuPDF库支持多种文档格式的内容读取,如PDF、XPS、CBZ等,支持将文档转换为其他格式,如HTML、SVG、PDF和CBZ等。PyMuPDF可以修改pdf文件的内容。其他文件类型用PyMuPDF是只读的。但可以将任何文档(包括图像)转换为PDF(Document.convert_to_pdf()),然后将再使用PyMuPDF的功能进行操作。
2024-12-27 11:29:25
1392
原创 python+reportlab创建PDF文件
reportlab库支持创建包含文本、图像、图形和表格的复杂PDF文档。安装:pip install reportlab -i https://pypi.tuna.tsinghua.edu.cn/simple。
2024-12-25 14:56:40
805
原创 python+PyPDF2实现PDF的文本内容读取、多文件合并、旋转、裁剪、缩放、加解密、添加水印
安装:pip install PyPDF2 -i https://pypi.tuna.tsinghua.edu.cn/simple。
2024-12-24 11:51:32
563
原创 python实现Word转PDF(comtypes、win32com、docx2pdf)
支持docx和doc格式的文档转PDF,comtypes与win32com底层调用一样,使用方法也一样。保存文件时相当于调用了office中的另存为。只需要修改SaveAs中的FileFormat参数值即可转为对应格式的文件。docx2pdf是封装了Windows 系统 win32com 及macos系统处理文件的应用库,只支持docx格式文件转PDF。安装后一行代码即可使用。office 2007支持的全部文件格式对应表。安装:pip install docx2pdf。
2024-12-20 15:15:08
521
原创 python实现Excel转图片
安装:pip install spire.xls -i https://pypi.tuna.tsinghua.edu.cn/simple。安装:pip install excel2img -i https://pypi.tuna.tsinghua.edu.cn/simple。支持选择行和列截图,不好的一点就是商业库,转出来的图片有水印。
2024-12-19 16:49:01
859
原创 python实现word转html
mammoth库支持将word转为HTML和markdown格式的文件。强大的word文件处理库,不太好的就是商业库转换出的文件有水印。
2024-12-19 11:09:39
646
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人