对于AcroForm
类型的PDF
,想要提取内容,python
的pdfminer
库可以实现。如下图,是一份确认单,为AcroForm
类型的PDF
。
代码示例
# 安装pdfminer:pip install pdfminer
from pdfminer.pdfparser import PDFParser
from pdfminer.pdfdocument import PDFDocument
from pdfminer.pdftypes import resolve1
from pdfminer.psparser import PSLiteral, PSKeyword
from pdfminer.utils import decode_text
data = {
}
pdf_path = r"E:\项目目录\嘉实\一年持有期混合型基金.pdf"
def decode_value(value)