OCR光学字符识别技术原理讲解

ocr (光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。如何除错或利用辅助信息提高识别正确率,是ocr最重要的课题,icr的名词也因此而产生。衡量一个ocr系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。
ocr识别的过程如下:
1、图像输入:要进行ocr识别,第一步便要采集所要识别的图像,可以是名片、身份证、护照、行驶证、驾驶证、公文、文档等等都可以,然后将图像输入到识别核心。
2、图像预处理:此过程包含二值化(将图像上的像素点灰度值设置为0或255,也就是将整个图像呈现出明显的只有黑和白的视觉效果)、去噪、倾斜度矫正等。
3、版面分析:将所要识别的文档分段、分行处理
4、字符切割:此时需要字符定位和字符切割,定位出字符串的边界,然后分别对字符串进行单个切割,单个分割出来的字符再做识别。
5、字符特征提取:提取字符特征,为后面的识别提供依据。
6、字符识别:将当前字符提取的特征向量与特征模板库进行模板粗分类和模板细匹配,识别出字符。
7、版面回复:将识别结果按照原来的版面排班,输出word或pdf格式的文档。
8、后处理校正: 根据特定的语言上下文的关系,对识别结果进行较正的算法。

IP RAN是动静融合综合业务承载网络解决方案
视频图像智能分析技术的发展
OPPO R9s清新绿、vivo Xplay6磨砂黑、蓝色荣耀8、红色iPhone7!这四款当红颜色的手机,你喜欢哪款?
什么是续流二极管,bldc中续流二极管的应用原理
欧胜推出具有卓越音频性能的数模转换器WM8533
OCR光学字符识别技术原理讲解
智慧城市的建设存在什么误区
TouchGFX是一个基于STM32硬件由C++写成的软件框架
ATSHA204进行对称加密的步骤教程
电流表与电压表有何区别
直流模块:12V/15V升高压至10000V/12000V
这项电磁兼容国家标准正式发布,今年12月实施
探析5G网联无人机整体解决方案
5G、AI等被写进《工业互联网创新发展行动计划(2021-2023年)》
变频器如何与西门子300PLC实现通讯实例
先进封装,十年路线图
画电源板时要注意地方
国美手机U7图赏 圆弧阶梯边框流光双面玻璃
Tilt Five新AR头显众筹金额突破120万美元 最终筹资总额有望翻三番
拍照为什么那么牛? 一加3T摄像头解析