...用乱,教MM用关键词识别品牌
郭人源
[摘 要]电器铭牌图片中文字风格不一、排版格式复杂多样,在智能终端OCR文字识别软件基础上,研究出一种对图像中关键词按需识别及输出的操作流程,开发测试相关功能软件,扩展智能终端OCR应用场景。
[关键词]电器铭牌、文字识别OCR、智能终端、图片按需识别
中图分类号:TM76 文献标识码:B 文章编号:1009-914X(2016)16-0108-01
一、问题
电器铭牌提供了电器设备的品牌、产品名称、型号等参数,在客户服务中,根据用户提供的设备铭牌信息,厂商或服务商能够迅速了解用户设备可能的问题。智能手机具有拍照功能,用户获取设备铭牌图片后,需及时把铭牌图片中关键文字识别出来,这样用户就能够准确提供电器设备信息,反馈给厂商。由于各种电器铭牌风格差异很大,采用现有文档OCR(Optical Character Recognition,光学字符识别)识别系统、特定(名片、票据等)的格式化OCR识别系统无法满足众多电器铭牌识别要求。
二、背景综述
OCR 是指电子设备(如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。如何除错或利用辅助信息提高识别正确率是OCR最重要的课题,一个OCR系统主要性能指标有拒识率、误识率、识别速度、用户界面友好性、产品稳定性、易用性及可行性等。
OCR软件主要由图像输入、预处理、版面分析、字符切割、字符识别、版面恢复、后处理、校对等功能组成。
1、图像输入,不同的图像有不同的存储格式、不同的压缩方式,目前有JPEG、PDF、IMG等图像格式。
2、预处理包括二值化、噪声去除、倾斜校正等。(1)二值化,摄像头拍摄的彩色图像所含信息量巨大,图像内容可以简单地分为前景与背景,为让计算机更快更好地识别文字,需对彩色图进行处理,使图片只含前景信息与背景信息,简单地定义前景信息为黑色,背景信息为白色,这就是二值化图。(2)噪声去除,对不同文档定义不同噪声特征,根据噪声的特征进行去噪,就叫做噪声去除。(3)倾斜校正,用户在拍照或扫描文档时,很难完全平直,拍照出来的图片不可避免地产生倾斜,对倾斜图像进行拉直,使图像整体达到平直。
3、版面分析,将文档图片分段落、分行的过程就叫做版面分析,由于实际文档的多样性、复杂性,因此没有一个固定的、最优的切割模型。
4、字符切割,由于拍照条件所限,造成字符粘连、断笔,限制了识别系统性能,这就需要文字识别软件有字符切割功能。
5、字符识别,字符识别方法有多种,早期有模板匹配,后来以特征提取为主。特征分为两类:一类为统计特征,如文字区域内的黑/白点数比,当文字区分成好几个区域时,这一个个区域黑/白点数比之联合,就成了空间的一个数值向量,在比对时,基本的数学理论就足够。另一类为结构特征,如文字影像细线化后,取得字的笔划端点、交叉点之数量及位置,或以笔划段为特征,配合特殊的比对方法,进行比对。当输入文字算完特征后,不管是统计或结构的特征,都有一比对数据库或特征数据库来进行比对,数据库的内容应包含所有欲识别的字集文字,根据与输入文字一样的特征抽取方法所得的特征群组。
6、版面恢复,对识别后的文字,像原文档图片那样,段落不变、位置不变、顺序不变地输出到word文档、pdf文档等。
7、后处理、校对,根据特定的语言上下文的关系,对识别结果进行校正。
OCR技术为现有纸介质文字的数字化提供了批量录入手段,对特定格式图片的内容识别,让OCR在发票管理、名片管理等行业获得了广泛应用。国内OCR技术方案提供商包括汉王、文通、合合等。
鉴于图片文档的复杂多样,版面分析没有固定、最优的切割模型,本研究项目提出由用户根据图片实际情况,按需选择图片中多个关键词进行识别,以图片属性或文件名方式输出识别结果,以解决无特定字符排版格式的图片中关键词识别,扩大OCR技术在更多场景下的应用。
三、方案设计
电器铭牌图片,必需的关键词为厂商品牌、产品名称、产品型号,可选的关键词为设备电气参数、出厂日期、序列号。
原始图像输入后,经过预处理,得到一个可用于识别的图像。版面分析阶段,用户在终端设备上适当放大图像,并移动图像到字符需识别的位置,用户用矩形框选择待识别区域,然后进行字符切割、字符识别,在选择区域的输出框中看到识别结果,确认是否正确。若正确无误,输出到关键词框中,若不正确,提示重新选择待识别区域,以确保得到正确的识别结果。接着移动图像到下一个字符需识别的位置,用户用矩形框选择待识别区域,然后进行字符切割、字符识别。所有关键词识别后,保存关键词到图像文件的属性,用关键词另存成新的图像文件名。
软件操作流程(图1):
铭牌图片输入、图片预处理、图片关键词识别输出示例(图1、2):
原始拍摄铭牌图片文件名:IMG_20160528_160918.jpg
铭牌预处理后图片形状,校正了图片倾斜,文字基本达到水平位置。
关键词识别后另存图片文件名:帅康_电热水器_DSF-60JEKA.jpg
四、应用场景
电器铭牌图片经过关键词识别,存为新的图片文件,电器厂商的客服中心收到用户发送的电器铭牌图片文件,直接把获得的电器品牌型号参数导入客服系统,铭牌图片通过验证后,调出该型号电器的维护修理方案,根据用户提出的问题,给用户提供准确的电器服务信息。
参考文献
[1] 百度百科:http://baike.baidu.com/,OCR(光学字符识别).
[2] 汉王科技:http://www.hw99.com/.
[3] 文通科技:http://www.wintone.com.cn/.
[4] 合合信息:http://www.intsig.com/.