Python ocr文字识别(pyocr)

愚公搬程序

已于 2023-11-04 14:40:00 修改

阅读量1.9k

点赞数

文章标签： ocr

于 2023-11-04 14:39:02 首次发布

本文链接：https://blog.csdn.net/wgq2020/article/details/134218200

版权

Python ocr文字识别(pyocr)

pyocr是Python的一个OCR（Optical Character
Recognition，光学字符识别）第三方库，可以将图片中的文字转换成可编辑的文本。pyocr支持多种OCR引擎，如Tesseract、CuneiForm等，可以根据需要选择OCR引擎进行文字识别。

使用pyocr进行文字识别的基本流程如下：

安装pyocr库及OCR引擎
导入pyocr库和需要使用的OCR引擎
加载需要识别的图片
进行文字识别
输出识别结果

以下是使用pyocr进行文字识别的示例代码：

import pyocr
import pyocr.builders

# 获取所有可用的OCR引擎
tools = pyocr.get_available_tools()

# 选择使用Tesseract引擎
tool = tools[0]

# 加载需要识别的图片
img = Image.open('test.png')

# 进行文字识别
text = tool.image_to_string(img, builder=pyocr.builders.TextBuilder())

# 输出识别结果
print(text)