基于图像识别技术的汽车衡检定数据自动化处理系统的设计
本文旨在通过摄像装置对汽车衡的数字称重显示器中所显示的称重结果进行拍摄,将拍摄结果自动截图成数字图像,并以数字图像处理、模式识别、计算机视觉等技术为基础,将得到的每一张数字图像进行分析、识别后转换成文本格式录入到软件中,并根据检定规程要求进行一系列运算得到最终结果,自动完成原始记录的运算、生成和保存等一系列操作。整个过程计算机自动处理,排除人为干预,从而进一步提高检定效率和数据处理的正确率。
1.概述
汽车衡采用现代传感器技术、电子技术和计算机技术一体化的电子称量装置,是国家重点管理的强制检定计量器具,根据其自身特点一般可以分为电子秤、电子天平等类型,其检定依据一般是按照JJG 539-1997《数字指示秤》和JJG1036-2008《电子天平》进行的。然而这两个规程中所规定的检定项目以及数据的处理都相当复杂,检定过程中70%的时间耗费在数据处理上,完整检定一台汽车衡至少需要耗费30分钟以上时间,我们可以清晰地看到目前检定汽车衡一直存在着两个问题:一是检定效率低,尤其是面对农贸市场量大面广的电子计价秤,其现场检定更加需要检定员快速、精准的反应;其次是数据处理往往一不小心就容易出现错误,时常陷入“一子错满盘皆输”的尴尬境地,现场检定实用性不高,时常受人以诟病。因此,很多专家学者一直在追求一种能够自动检定的装置来满足检定规程的要求,有的利用的传感器读取数据、有的根据RS232接口获取称量结果等,但由于其操作复杂性、数据读取格式的不一致性等一系列问题,最终无法真正实现自动化检定的实物装置,更何况全自动检定对于电子秤来说自动加载砝码,尤其是感应砝码相对来说不易实现,而对于电子天平来说其高准确度等级的砝码的加载更加成为自动化检定装置的障碍.
小编结合日常的检定工作,设计了一款半自动的检定装置,所谓半自动检定,即检定时砝码
的取与放由检定员来操作,显示装置中的称量结果由摄像头等装置获取并自动录入到计算机,根据图像处理技术对获取的结果进行自动识别,从而将结果自动保存到原始记录中进行自动化运算,得到最终的检定结果,具体思路架构如图1所示。
2.图像识别系统设计
2.1图像识别开发基本流程
本系统中最关键的技术是图像识别系统,所谓图像识别就是指利用计算机或其他数字设备对图像信息进行各种加工和处理,抽取输入样本的模式表达形式与预先存储在计算机中标准样本的模式表达形式进行逐一比对,用一定的准则进行判断,找出最接近输入样本表达形式进行匹配其识别过程主要包括图像采集、图像预处理特征提取模式匹配四个环节,一个典型的识别过程如图2所示.
2.2图像采集
本系统第一步需要用图像采集设备对电子衡器的显示结果进行摄取并录入到系统软件中进行后续处理,由于输入的只是简单的一副图像,目前市场上的摄像头基本能够满足要求。
2.3图像预处理
含有复杂的显示装置背景和自然背景,同时在衡器检定过程中易受现场的照明条件。油污以及录入的图像倾斜等因素的影响,严重影响获取图像的质量,给之后的识别过程带来很大的障碍,因此在开始处理前需要进行图像变换、复原和校正去噪等一系列预处理来消除对图像的影响。预处理是图像自动识别系统中非常重要的一步,它的好坏直接影响图像识别的效果。预处理的目的是去除图像中的噪声,把它变成一幅清晰的点线图,以便于提取正确的图像特征,主要包括灰度化二值化和数字分割等。
2.3.1图像的灰度化
用摄像头摄录得到的图像是24位真彩图像,又称为RGB图像。,其存储量要求很大,而且在进行图像处理时,计算量也随之增加,不便于图像的识别处理,所以在图像预处理过程中,要对图像进行灰度化,将彩色的图像转换为灰度图像的过程叫做灰度化,由于彩色图像每个像素的颜色由R、G、B三个分量组成,统称为颜色空间模型如果一幅图像的颜色空间是一维的(一个颜色值只有一个颜色分量),则这幅图像就是一副灰度图,在位图图像中,一般以R=B=G来显示灰度图像,那么如何来确定R、G、B三个分量的值使接下来的图像处理更为方便、快捷和稳定呢?根据经验,图像的灰度化往往采用加权平均值法
2.3.2图像的二值化
图像经过灰度化处理后,所产生的灰度图像是由256个灰度级别组成的灰度图像,具有较为丰富的明暗度,但在搜索目标对象时,背景像素容易干扰,如图4所示的灰度图像中背景色仍然具有较大的噪点,极易影响后期图像识别的质量,因此要进行二值化,二值化是对图像进一步进行压缩,我们采用固定阀值,把灰度设置成0或255,,这样一来就把这个灰度级减少到1位2个灰度级,使图片只有前景和背景信息,就得到一副二值图,可以简单的将图片定义前景为白色,背景为黑色,那么二值图像中的数据全部是0或1,运行效果如图5、如图6所示。
2.3.3数字图片分割并存储
二值化后得到的图像仍然是一个整体,包括数字和数字之间的空白,我们需要从中分离出每个数字以便进行后续的单个数字的识别。图像分割技术一般采用的是边缘检测法,图像的边缘是图像的最基本特征,边缘点是指图像中周围像素灰度有阶梯变化的那些像素点,即灰度数导数较大或极大的地方,根据这个原理我们可以对图片进行分割,并将分割好的图片存储在计算机中。
2.4数字图片识别
数字图片识别就是把处理后的图片还原回字符文本的过程,包括特征提取和模式匹配等操作
常用做法是:先获取该数字图片的特征码,然后使用各种分类算法对该特征码进行分类,将其打上相应的类标签、分类模型的训练,是对字符库中的每个字符进行特征化处理,得到每个字符的特征码,该字符的标签就是该字符本身,利用特征码加上字符的标签对字符库中的所有数据进行训练,得到相应的分类模型。当然,得到了待识别字符的特征码后,也可以使用相似性度量和字符库中的字符的特征码进行比较,将该字符识别为与其特征码相似性最高的字符。在每个字符的边界内,按行(或列)扫描该图片,检测其中的每个像素点,如果像素为白色则为,如果像素为黑色则为1,将这些0和1连起来组成的字符串就构成了该字符图片的特征码。将最终得到的特征码与我们预先设置好的特征库内的特征码进行逐一比对,如果匹配成功则返回正确的结果。
2.5腾讯优图开放平台简介
本系统是利用腾讯公司现成的优图OCR识别技术进行图片识别的,腾讯优图是一个开放的平台,具有人脸识别、图片识别等集成功能,我们采用了该平台的OCR识别技术,即利用光学字符识别技术,将图片上的文字内容,直接转换为可编辑文本,该平台集成了图像灰度处理、二值化数字分割和存储、数字图片识别等一系列功能,能够将本系统所需功能整合实现,并且优图OCR识别技术支持数字识别和超过7000个常用汉字的识别,在内部测试集上,单字识别准确率可达到中文98%以上,数字99%以上。现有身份证、名片、营业执照识别的全流程解决方案,为用户提供最方便快捷的证件信息录入体验,使用优图技术,仅需轻轻一拍,即可自动完成证件信息识别录入。该平台首先具有高适用性,能够自动检测定位、版式分析、字符切分、文字识别、信息息校验,优图OCR识别技术技术涵盖了整个证件检测识别框架的所有核心算法。极高的文本行定位、字符切分准确率,支持横向、竖向拍摄,可容忍透视畸变、光照不均、部分遮挡的情况,适应各种照片分辨率,具备非常高的复杂环境可用性,其次,是具有高稳定性,优图身份证识别、名片识别营业执照识别服务已成功应用于微众银行、QQ广点通等内部核心业务,接受过海量用户和复杂场景的考验,各项反馈良好,因此用于简单的数字识别更加具有稳定性.
3.数据自动化处理系统的设计
一个最基本的数据自动化处理系统即为一个简易的计量管理子系统,主要包括:用户管理、企业管理、器具管理、原始记录管理、检定报告管理和统计报表等功能,其基本框架如图7所示.
本文仅讨论跟数据处理有关的原始记录录入模块,其余模块不在此赘述.根据上述原理设计处理的数字识别系统如图8所示。
图8中,界面最左边是摄像头时时摄录情况中间有两个按钮分别是识别与截图识别,右边最上面是一个标签,显示识别后的文本数据,下面是一个复制到粘贴板并插入按钮,下面来介绍具体功能。
(1)最左边是摄像头,它具体负责在检定时对检定数据的摄取,其摄取的质量好坏直接影响着后续的文字识别,因此摄像头的质量、像素以及摆放和录制都是相当重要的,应尽可能摄取我们所需要的信息。
(2)识别、按钮,当按下此按钮时,系统将进行文字识别,识别后的内容会显示在右边上方的标签栏中,如图9所示。
(3)但往往我们所摄录的摄像头没有像上图那样目标明确,我们实际中往往得到的是显示装置连带背景的非标准图像,如图10所示。因此我们就要用到截图识别这项功能。
当遇到图10所示情况时,我们就要用到截图识别这项功能了,该功能类似于的截图功能,就是将我们所需要的部分截图并识别之,点击截图识别,然后将鼠标放置到需要截图的起始点按住鼠标左键拖动到图片的结束点后松掉左键,如图11所示。
按照上述方法松掉左键后系统就自动进行文字识别,其结果如图12所示。
(4))复制到粘贴板并插入按钮就是将识别未识别后数字文本复制到电脑的粘贴板上方便用户使用,并且具有直接插入粘贴到系统文本框中的功能如图13所示。,将摄像头对准电子秤摄录,然后按截图识别按钮对视频中的称重结果处进行截图,这样一来就会在右边标签处显示,若识别成功便点击复制到粘贴板并插入按钮直接输入到系统软件中,若识别不成功,则调整摄像头继续进行识别,直到识别成功为止。
4.结论
用图像识别技术进行地磅的检定大大提高了检定效率,时间缩短了三分之二以上,并且
用计算机进行数据处理更加提高了原始记录计算的正确率。由于笔者经验有限,只是简单将汽车衡检定与计算机技术相结合,希望上述思路方法能够起到抛砖引玉的作用,让更多的从业者提出更加科学合理的建议,进一步提高汽车衡检定的工作效率工作质量,为营造一个更加科学更加合理公平公正的的环境而努力。