OCR字符的关键技术。
(1)光学扫描:在OCR光学扫描仪中一般是将光的强度转换为gray-levels. 最简单的识别就是白纸黑字这通常就是阀值处理的过程。低于阀值的gray-levels被定为白色高于阀值的gray-levels被定为黑色。然而茬实际中由于光线强弱不均匀容易出错需要改进就需要对阀值能够动态变化,对一个文档的每一部分进行局部化的亮度适应
(2)位置囷分隔:需要对数字图形进行区分,需要考虑是对单一字符进行识别还是对一组字符进行识别在字符分割中容易出现几个问题,由于识別的模糊可能将几个字符识别成一个,一些标点符号可能会被认为是噪音没法区分图片或者文本。
(3)预处理:扫描仪的分辨率可能會导致图像包含很多的噪点导致字符变模糊或者覆盖。就需要平滑处理和归一化就是对有不同角度的字符统一角度,对字符的格式等進行统一
1)模版匹配技术:不包含特征提取,将输入的字符图像与原有模版进行对比找到匹配最高的模型,但是如果noise过多则会很大的影响输出结果
3)Transformations and series expansions:通过描绘字符的轮廓,提取轮廓特征对于边缘的噪声很敏感会造成识别偏差,但是字符内的不规整则影响较小
1)Decision-theoretic methods:反向传播网络对输入不断加权优化,通过训练从而得到所需输出或者当每一个类分离的很清楚是最小距离分类器的效果很好。概率识別是目前错误较低的一种方案
(6)后处理:将处理出来的字符组成字符串,对固定字符间距的分组很容易因为字符之间的距离远远小於字符串之间的距离,所以很容易识别那几个字符应当组成一个字符串但是当识别手写字符或者倾斜文本时就会出现问题。此时就需要錯误纠正通过上下文或者语法来纠正,例如“English language the probability of a “k” appearing after an
“h” in a word is zero.”其次就是基于字典库也就是字符库进行比较。
4.后面讲的是一些OCR的应用其中車牌的识别很普遍,但是伴随着车牌的识别通常需要闪光灯等强光条件会对路上行车造成安全,这就需要OCR技术适应uneven lightling 或者low lightling