- 博客(6)
- 收藏
- 关注
原创 python中 fitz 库和 pdfplumber 混合操作
参考:Python+pymupdf处理PDF文档案例6则 - 云+社区 - 腾讯云 (tencent.com)参考原文有一些函数过时了,本文对其进行更新环境import fitzimport pdfplumber母文件地址fn = r'D:\Desktop\highlight_test.pdf'一、提取pdf文件中的文本,写入文本文件方法一:plumber 库with pdfplumber.open("D:\\Desktop\\highlight_test.pdf.
2022-04-24 16:35:01
3113
2
原创 PDF文件中的图片的提取
在网上查找的时候,确实有很多相关的代码,最多的是利用基于 fitz 库和正则搜索提取图片但是,在使用中发现,有些函数都过时了,导致功能无法实现,最后结合网上文章,然后自己排查了一下错误,最终整合出来一段目前能用的 python 提取 pdf 文件的代码。在这之前需要安装 pymupdf 库(fitz 是它的子库)pip install pymupdfimport fitzimport reimport osfile_path =r'D:\Desktop\picture.pdf
2022-04-24 15:28:17
702
原创 ipad如何将颜色反转,以及消除pdf水印
1. 有些时候白色底色的pdf看累了,切换成黑底白字对眼睛会更友好,但是单纯的ipad的黑夜模式,只能将系统调节为黑色,不能将pdf纸张调节为黑色,下面将利用颜色反转调节pdf为黑底白字。2. 同时有些pdf上面有一些水印,看着很烦人,在颜色反转的前提下我们可以通过"降低白色值"将水印消除。打开设置 打开控制中心 将辅助功能添加至控制中心 打开辅助功能(如下图点击) 点进去后添加"经典反转"和"降低白点值" 然后就发现切换成颜色反转模式,而且水印也消失了 最后视觉效果对比...
2022-04-15 14:53:18
4982
1
原创 pip安装已经下载的whl文件
下载whl文件(地址:reportlab · PyPI,选择合适版本) 将whl文件放到一个文件夹中(我的是D:\python other libraries) 通过 pip 安装下载好的whl文件 先找到文件夹位置----如果文件夹不在C盘,先用 d:命令转到 D 盘,F盘类似 f: 通过cd D:\python other librarise 转到具体文件夹 最后通过 pip 下载 pip install +文件全名 4.安装成功...
2022-04-09 21:44:18
13522
原创 (二)python编辑PDF文件:pdfplumber库操作
文章参考知乎 >> 传送门(一)字符操作(1)pdf文件任意页字符提取import pdfplumberwith pdfplumber.open("D:\\Desktop\\1.pdf") as pdf: for page in pdf.pages: text = page.extract_text() # 提取文本 print(text)(2)提取所有pdf文字并写入文本中import pdfplumberwith pdfp
2022-04-09 16:10:05
2635
翻译 (一)python编辑PDF文件:pdfplumber库
本文来源于Github: pdfplumber(一)安装(cmd运行):pip install pdfplumber(二)类顶层类:pdfplumber.PDF核心类:pdfplumber.Page(三)主要方法&功能简介 method:.crop(bounding_box, relative=False) .within_bbox(bounding_box, relative=False) .filter(test_function) .ded.
2022-04-09 15:28:43
4344
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人