请选择 进入手机版 | 继续访问电脑版

#楼主# 2020-1-15

跳转到指定楼层

图像识别属于模式识别的一种,由于图像的复杂特征,利用传统的机器学习技术,人为无法进行高纬度的特征构建,只能用深度学习的卷积神经网络来实现图像特征的自动提取。图像识别的步骤大致为:图像采集、图像预处理、特征抽取和选择、分类器模型设计、分类决策。

关于计算机如何识别一张图片,可以参考:《图像的表达》一文


一、图像采集


图像采集,通常分为3步:获取图像、取样、量化。

图像获取:主要借助于数字摄像机、扫描仪、数码相机等设备来进行获取,从这些设备中的传感器来获取连续的电压波形(因为这些数字设备的传感器输出的是连续的电压波形)

取样:然后对这些电压波形,进行数字化坐标值处理,即取样。分别进行横向采取(宽度)和纵向采取(高度),横向和纵向取样的像素想乘就是分辨率。

量化:数字化幅度值,成为量化。在进行采样的过程中,需要进行量化,即采样的间隔。因为完全采样的图像数据量相对较大,计算机计算量比较大,量化是图像采样过程中降低图片分辨率的一种方法。量化等级表示在数字图像中,每个像素点的取值范围,常用的量化等级有:2、64、256、1024。。。2的n次方。

在图像采集环节,根据需求决定取样量化标准是采集任务的关键。


二、图像预处理


图像特征的表现,有一个很显然的特点,就是在图像边缘的像素点的颜色通常都是变化较大的。在完成图像采集后,我们需要通过图像预处理技术,让图像变得更容易被计算机识别。常见的图像预处理技术如下图所示:

iShot     2020-01-15 下午03.41.30.png


图像预处理的最终目的都是希望能够使图像中物体的轮廓更清晰,细节更明显,从而强化图像的重要特征。


三、图像识别的实现


当通过前面2步得到图像样本后,后面的步骤“特征抽取和选择、分类器模型设计、分类决策”,便需要通过卷积网络(CNN)来进行特征抽取和选择,具体CNN的运行原理,请查本站的深度学习之“卷积神经网络”





下一篇:图像的表达:为什么通过机器学习可以实现图像识别?
转播转播 分享淘帖
回复

使用道具

成为第一个回复人

AI产品经理
小黑屋|AI产品经理社 |京ICP备19051683号-1
Powered by 长弓PM   © 2019-2050