图像识别之前要进行哪些处理?
发布网友
发布时间:2022-04-23 01:45
我来回答
共1个回答
热心网友
时间:2022-05-01 18:04
图像预处理先对视频采集的车牌图像进行必要的预处理,有助于进一步的识别。图像预处理包括:图像的复原和图像的变换等。
图像的复原在一些场合输入的图像很有可能是模糊不清的, 也就是说存在噪声的影响,通常存在影响的因素是多方面的,如光线和天气条件的变化、角度不合适、同类型的车牌字符和车牌背景的细微差别等都有可能使图像模糊不清。因此要对图像进行复原。在不同的环境下对具体的图像的复原方法也不同, 例如由于均匀直线运动而引起的复原,几何畸变复原等等。
图像的变换原始图像的数据一般比较大,对其进行处理的时间一般也较长,而由于实时性的要求,车牌的提取需要一次处理性就能把绝大多数特征提取出来,而尽可能的不要利用后面的结果来调整这一步的工作。因此要从一整幅车牌图像包括车身、背景等中提取出车牌,必须抓住车牌的最主要特征,利用它来提取车牌。车牌最主要的特征就是:车牌的底色和车牌字的颜色对比度大,而且在一相对小的范围内变化频繁。应该紧紧抓住这个特征来完成对车牌的提取,为了放大这个特征,我们设计了一个处理函数,即:(x,y)=F (x-d,y)-2F (x,y)+F (x+d,y)F (x,y):原图像P (x,y):处理后图像d:处理参数,一般取1~4这样就突出了图像中竖直的边缘,而对水平边缘则先不予考虑。
牌照定位对图像预处理之后,下一个关键步骤就是对图像中的牌照进行定位。牌照定位就是从含有车牌的车牌图像中提取出车牌区域。车牌图像能否正确地从车辆图像中提取是自动识别的前提,所以图像提取需要极高的正确性。根据处理牌照的类型和特点,有多种牌照定位方法,如字符竖向纹理统计、彩色分类、神经网络、矢量量化等方法。下面主要介绍字符竖向纹理统计方法。这种方法能够对各类牌照图像实现很好的分割效果。将汽车图像文件以Raw 格式文件存入计算机后,计算机将车牌部分从整幅图像中提取出来,实现车牌的定位。设定门限值为127、检测阈值为16,对图像进行逐行扫描,若某一行0→1和1→0的变化大于阈值则设其为待测车牌最低点,继续逐行扫描,直至变化次数小于8。将该点设为最高点。若最高点和最低点之差大于15,则认为目标已检测到,否则,继续逐行扫描,如果未检测到上述条件的结果,则自动设定门限值,重复上述操作,直至检测到目标。
4 字符分割车牌定位处理后,得到的仍是车牌的灰度图像。而在字符识别中一般采用的都是二值图像,所以先要进行图像的二值化。牌照图像的二值化是处理与识别图像中很关键的一步。牌照图片可以看成由前景字符和背景两部分组成,在光照比较均匀的时候,二值化就相当于怎样找到一个合适的阈值把字符和背景分开。车牌图像二值化关键之一就是阈值的选择。下面介绍类间最大方差算法对已定位的图像进行二值化处理。类间最大方差算法的基本思想是:将图像直方图在某一阈值处理分割成两组,当被分成的两组的方差为最大时,决定阈值。设一幅图像的灰度级为L,灰度级为i的象素点数为ni,则图像的全部象素数为N=,各值的概率pi=ni/N,然后用t 将其分成两组c0={1-t}和c1={t+1~L-1},各组产生的概率如下:c0 产生的概率,c1 产生的概率 c0 组的平均值,c1 组的平均值 其中μT=:是整体图像的平均值:是阈值为t 时灰度的平均值,所以全部采样的灰度平均值为μ=ω0μ0+ω1μ1两组间的方差用下式求出:σ2B=ω0(μ0-μT)2+ω(μ1-μT)2=ω0ω1(μ1-μ0 )2从1~L 间改变t,求上式为最大值的t,即求maxσ2的t′值,此时,t′值便是阈值。
字符识别对待识别的字符,首先判断其HVR,如果小于等于1/3 ,则可能是字符'1', 按字符'1'识别, 否则按其它字符识别。对字符'1',可以检查字符的像素填充率,若大于0.6,则为'1',否则丢弃。对于其它字符,首先需将待识别的字符归一化,在此将其缩放成32×64;然后与字模数据库中的字符进行模板匹配,经过一些特殊处理后得到识别结果。模板匹配的基本算法是最小欧氏距离法, 即对任一原型模式Zi,计算它和待匹配字符X的欧氏距离Di,即Di=|X-Zi|。然后找到最小的Di ,其对应的Zi 的名字就是识别出的字符的名字。另外,也可以通过一些语法限定(即最后三位一定是数字,倒数第四五位是字母或数字,第二位一定是字母等)来提高正确率。