利用pytesseract进行图片文字识别

pytesseract是基于Python的OCR工具，底层使用的是Google的Tesseract-OCR 引擎，支持识别图片中的文字，支持jpeg, png, gif, bmp, tiff等图片格式。安装pip install pytesseract使用这里只简单介绍识别图中文字并输出字符串，有兴趣的同学可以自行探索更多的方法。from PIL import Imagefrom pytesse

joker_zsl

2775人浏览 · 2022-02-18 14:05:17

joker_zsl · 2022-02-18 14:05:17 发布

pytesseract是基于Python的OCR工具，底层使用的是Google的Tesseract-OCR 引擎，支持识别图片中的文字，支持jpeg, png, gif, bmp, tiff等图片格式。

安装

pip install pytesseract

使用

这里只简单介绍识别图中文字并输出字符串，有兴趣的同学可以自行探索更多的方法。

from PIL import Image
from pytesseract import *


img = Image.open('test.png')
code = pytesseract.image_to_string(img)

识别图片和结果：

这种方法比较适合简单的验证码的识别。为了提高识别的成功率，图片最好配合PIL库，进行二值化和降噪的预处理。

在使用时可能会遇到TesseractNotFoundError，这是因为pytesseract需要调用tesseract.exe的接口来进行图片的识别。

需要先安装Tesseract-OCR的应用：https://github.com/tesseract-ocr/tesseract

然后修改pytesseract.py的tesseract_cmd

技术共进，成长同行——讯飞AI开发者社区

在这里，我们一起交流AI，学习AI，用AI改变世界。如有AI产品需求，可访问讯飞开放平台，www.xfyun.cn。

更多推荐

SpringBoot前后端分离项目使用大模型API并配置知识库（dify）

讯飞AI开发者社区

智脑进化：神经网络如何从单层感知机迈向深度学习新纪元

讯飞AI开发者社区

Uniapp 安卓实现讯飞语音听写（复制即用）

讯飞AI开发者社区

所有评论(0)

查看更多评论

joker_zsl

@joker_zsl

已为社区贡献1条内容