Python OCR(Optical Character Recognition)光学字符识别

Python OCR(Optical Character Recognition)光学字符识别

OCR(Optical Character Recognition):光学字符识别,是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。

OCR 的应用场景:

  • 扫描件的文字识别:纸质扫描件,PDF文件,纸书籍转电子书
  • 卡证文字识别:名片,身份证,银行卡
  • 车牌设别:多用在停车场和交警执法
  • 票据识别:报销凭证,税务票据,医疗票据
  • 教育领域:公式识别,自动判卷,自动答题

OCR 原理

	
扫描/拍照 > 图像输入 > 二值化 > 去噪声 > 倾斜校正 > 版面分析 > 字符切割 > 字符识别 > 版面恢复 > 文字校对	
	
	

扫描或拍照:使用扫描仪将纸质资料扫描成图像文件,手机拍照也能达到同样效果,然后将图像文件交给OCR软件进行处理。

首先把彩色图像编程黑白图像(黑色文字,白色背景),识别系统不关心颜色。

通过算法去除图像中的影响因素,噪点,污染,这部叫去噪声,类似Ps中的色阶,降噪,模糊一类

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

netkiller-BG7NYT

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值