欢迎访问一起赢论文辅导网
SCI期刊论文
当前位置:首页 > SCI期刊论文
基于局部多分辨特征的SAR图像自动目标识别
来源:一起赢论文网     日期:2019-06-12     浏览数:195     【 字体:

  (自 版) 2011,51(8)值———Gauss差(DOG)模型。DOG 模型被成功应用到了图像处理领域,是边缘检测、边缘增强的有效工具,同时,该模型也被应用到图像的特征处理,如著名的SIFT方法,通过 DOG 空间,可以实现关键点的检测,并且可以得到某个关键点或某个区域的鲁棒特征。受感受野模型的启发,本文提出一种从图像局部点出发,对图像进行多分辨分析的图像处理方法。采用一组简单的八邻域正交基对图像进行多级滤波采样处理,得到原图像的多级类 Gauss差分图像尺度空间,直接利用图像关键像素的采样,就得到图像目标的特征。考虑到 MSTAR 数据集中 目标的特性,将这一 MSTAR SAR图像目标的特征提取。同时,基于多级特征的整合,运用基于多尺度核方法的 SVM 模型,实现了三类目标的分类,得到了很高的正确率。1 局部多分辨分析与特征提取1.1 感受野模型的认知基础感受器受刺激兴奋时,可通过感受器官中的向心神经元将神经冲动(各种感觉信息)传到上位中枢,一个神经元所反应(支配)的刺激区域称神经元的感受野。在视觉系统中,视网膜的神经节细胞位于网膜最终段的神经细胞,其轴索为视神经纤维。纤维在眼球内,分布于网膜的表面,集于视束(视神经)乳头,由眼球出来后,经视束交叉,止于外侧膝状体。此神经节细胞的受纳区域,多种动物都大致呈圆形,对其中心用光照射,峰值放电出现在照射开始(ON 反应);照射周边则在照射终止之后(OFF反应);如果再照射其中间时,将出现光照射的两时期(ON-OFF反应)。但这种性质并不是固定的,由于动物不同、波长不同,以及明暗适应的情况不同,而有很大的变化。视网膜和外膝体神经元都具有这种生理机能和特性,其感受野都形成同心圆式结构,称之为中心-外周颉颃型感受野,它是处理图像信息的基本形式,主要功能是检测图像的亮度对比和颜色对比。这种感受野的出现标志着视觉信息 处理的一个重要阶段。视觉最重要的功能是辨别图像,而任何图像归根结底是不同亮暗部分的组合。当光感受器检测到光的存在后,需要神经机制把明暗对比的信息加以特异处理,中心-外周颉颃型感受野正是这种神经机制的一种重要表现形式。传统的感受野理论用两个 Gauss函 别表示中心和外周的敏感性分布,神经元的输出决定于 Gauss差模型。其表达式为I(x,y)= A112πσ21exp- (x2+y2)σ[ ]21-A212πσ22exp- (x2+y2)σ[ ]22. (1)  该模型被成功应用到了图像的特征处理,如著名的 SIFT(scale invariant feature transform)方法[5],通过构造 DOG 尺度空间,可实现稳定关键点的检测,并且可得到某个关键点或某个区域的鲁棒特征描述子。SIFT 描述子性能优异[6],通用性强,是迄今使用最为广泛的一种特征。对图像的旋转和尺度变化具有不变性,对三维视角变化和光照变化具有很强的适应性,在局部遮挡和场景杂乱时仍保持不变性。特征之间相互区分的能力强,即辨别力强,非常利于 配。SIFT Gauss卷积和减法运算,计算效率高,可快速实现。1.2 SAR图像目标局部多分辨特征提取考虑SAR图像 ATR 的数据集,MSTAR 切片中的目标具有以下特点:样本图像为等大小的切片形式;每个切片中仅具有一个目标;每个目标都位于切片的中心位置;目标绕中心旋转成360°分布,分辨率相同,无比例变化。借鉴感受野模型的机理和 SIFT方法的特点,考虑构建一种新的基于图像的多级类DOG尺度空间,通过设计一组简单的八邻域正交基,对图像进行多级采样滤波处理,获得图像在8个方向上的特征,以及1个低频滤波特征。传统的多分辨分析多是采用滤波器加上采样实现的,虽然这种方法解决了正交基生成的问题,但采样往往是从序列的开始到结束,因此产生的正交基对于相同局部特性的数据并不能得到相似的表达。这对于特征提取是很不利的。为了解决这一问题,借用传统小波方法的采样滤波思想,采用一种局部延展的采样方法,每次采样都从局部点向周围扩展,保证产生的基是正对局部区域的,这样相同的局部特性在基上投影的系数是相似的,有利于特征的描述及目标的分类识别。如图1所示,在t时刻,对信号 W1和信号 W*1分别通过 X2和 X1进行采样,也就是在基 X2和 X1上进行投影,那么这两个信号得到的投影系数相同。将这一方法称为图像的局部多分辨分解。基于局部多分辨分解方法具有人眼观察事物的特点。人眼观察目标是具有选择性的,并不是一个等概率扫描过程,往往对注意点(特征点)附近的区域的“关注”更多,而对远离注意点的区域“关注”较少。设计了一组如图2a所示的八邻域正交基,对应的频谱图像为图2b,来实现上述采样率波。 (自 版) 2011,51(8)图4 局部多分辨分解与重建2 基于多尺度核方法的分类器设计2.1 多核学习理论人们对核方法的关注,得 Vapnik 的支持向量机[7]。核函数的采用使得线性的 SVM 很容易地推广到非线性的 SVM。其核心在于利用相对简单得多的核函数运算,避免了特征空间中复杂的内积计算,又避免了特征空间(学习机器)本身的设计。尽管上述的核方法在众多的应用领域有效并且实用,但这些方法都是基于单个特征空间的单核方法。由于不同的核函数具有的特性并不相同,从而使得在不同的应用场合,核函数的性能表现差别很大,且核函数的构造或选择至今没有完善的理论依据(一般采用经验性的方法)。此外,当样本特征含有 息,样 大,多 规则[8]或数据在高维特征空间分布的不平坦,使得采用单个简单核进行映射的方式对所有样本进行处理并不合理。针对这些问题,近年来,出现了大量关于核组合方法的研究,即多核学习方法[8-9]。多核模型是一类灵活性更强的基于核的学习模型,近来的理论和应用已经证明利用多核代替单核能增强决策函数的可解释性,并能提高其性能。构造多核模型,最简单也最常用的一种方法就是考虑多个基本核函数的凸组合,其形如K =mj=1βjKj, βj ≥0且mj=1βj =1.(2)其中:Kj是基本核函数,m 是基本核的总个数,βj是权系数。因此,在多核框架下,样本在特征空间中的表示问题转化成为基本核与权系数的选择问题。2.2 多尺度核支持向量分类器多核学习的一种特殊化情形就是将多个尺度的核进行融合。这种方法更具灵活性,并且能比合成核方法提供更完备的尺度选择。此外,随着小波理论、多尺度分析理论的不断成熟与完善,多尺度核方法通过 间,使 论背景。多尺度核 方法[10-13]的基础就是 要找到一 组具有多尺度表示能力的核函数。在被广泛使用的核函数中,Gauss径向基核k(x,z)=exp -‖x-z‖22σ( )2(3)是最受欢迎的,因为它们具有通用普遍的近似能力,同时它也是一种典型 可多尺度化核。以此核为例,将其多尺度化(假设其具有平移不变性):k‖x-z‖22σ( )21,…,k‖x-z‖22σ2( )m, (4)其中σ1<…<σm,可以看出,当σ较小时,SVC 可以对那些剧烈变化的样本进行分类,而当σ较大时,可以用来对那些平缓变化的样本进行分类,能得到更优的泛化能力。具体实现时,σ的取值可以借鉴小波变换中尺度变化的规律,σ可由下式定义:σi =2iσ, i=0,1,2,… (5)  利用 阵,代 规SVM 的简单核矩阵,可以将特征的辨别力大幅 提升,提高分类准确率。对于一个两类分类问题,简单核学习的决策函数为f(x)=sg(nni=1αiyi〈(x),(xi)〉+b), (6)代入核函数,其形式变换为f(x)=sg(nni=1αiyiK(x,xi)+b). (7)对于典型多核函数凸组合的多核学习方法,其决策函数为f(x)=sg(nmj=1βjni=1αiyi〈j(x),j(xi)〉+b),即f(x)=sg(nmj=1βjni=1αiyiKj(x,xi)+b).(8)  另一方面,将具有多分辨特性的特征与多个尺度核函数的核机器进行融合,也是提高目标识别正确率的有效途径。此外,在图像自动目标识别领域,还要关注特征提取的快速实现,重点是基于局部多分辨分解特征提取的有效性与易实现性,最后,将局部多分辨特征与多尺度核方法进行有机融合。具体实现上,将 CFAR 检测后的 128×128 像素图像取中心81×81像素大小,然后将获得的图像进行4级局部多分辨分解。其中最顶层为3×3大基于局部多分辨特征的 SAR 图像自动目标识别 1051   利用上述正交基从 中心区 域开始,对 Lena图像(图3a)进行采样滤波分解,结果如图3b所示。图3 Lena图像局部多分辨分解在各分辨率下选择 Lena右眼附 的特征 (少量像素)进行图 像重建,如图 所示。可以明 看出,Lena的右眼特征保持完整,而对周围的非注意点区域,图像变得模糊,符合人眼观察事物的特点。这一方法给目标的处理带来了极大的便利,仅需找到关注点,对关键点位置进行局部多分辨分解,而不用像小波分解那样对整幅图像进行分解,因此节省了大量的处理时间。基于局部多分辨特征的SAR图像自动目标识别汪洪桥1,2, 孙富春1, 蔡艳宁2, 陈 宁1, 裴得利1(1.清华大学 计算机科学与技术系,北京 100084;2.第二炮兵工程学院 指挥自动化系,西安 710025)收稿日期:2009-12-05基金项目:国家 “九七三”重点基础研究项目 (2007CB311003);国家自然科学杰出青年基金资助项目(60625304,60621062)作者简介:汪洪桥(1979—),男(汉),湖北,博士研究生。通信作者:孙富春,教授,E-mail:fcsun@tsinghua.edu.cn摘 要:合成孔径雷达(SAR)图像自动目标识别是图像 识别领域的一个重要方向。受视觉细胞感受野模型的启发,该文提出了一种从图像局部点出发,对图像进行多分辨分解的图像处理方法。采用一组简单的八邻域正交基对图像进行多级滤波采样处理,得到原图像的多级类 Gauss差分图像尺度空间,并将其应用到 MSTAR 数据集中的 SAR 图像目标的特征提取;同时,基于多级特征的整合思想,运用基于多尺度核方法的 SVM 模型,对不同级别图像特征采用不同尺度的核函数分别 射,然 成,实 类。对 MSTAR 数据集的实验结果表明,该方法具有很高的正确率,并且实 速。此 外,该 便 于SAR 图像场景中多类、多个目标的分割与自动目标识别,并且对相干斑噪声具有较强的鲁棒性。关键词:自动目标识别(ATR);感受野机理;局部多分辨分析;多尺度核方法;合成孔径雷达图像中图分类号:TP 391.4 文献标志码:A文章编号:1000-0054(2011)08-1049-06SAR image automatic target recognition basedon local multi-resolution featuresWANG Hongqiao1,2,SUN Fuchun1,CAI Yanning2,CHEN Ning1,PEI Deli 1(1.Department of Computer Science and Technology,Tsinghua University,Beijing 100084,China;2.Command Automation Department,The Second ArtilleryEngineering Institute,Xian 710025,China)Abstract:Synthetic aperture radar (SAR)image automatic targetrecognition is an important direction in image recognition domain.Inspired by the vision cell receptive field model,an image processingmethod was developed based on multi-resolution decompositionwhich starts from a local point in the image.The method uses asimple 8-neighborhood orthonormal basis for image multi-levelfiltering and sampling to obtain the difference of Gaussian liking scalespace of the original image.The method was then applied to thefeature extraction of the SAR image targets in the MSTAR dataset.Based on the integration of multi-level features,a multi-scale kernelmethod is utilized in the SVM model.The features from differentlevels of decomposition images are mapped into the feature spaces bykernel functions with different scales respectively,with the multiplekernel matrixes then integrated.Tests on the MSTAR dataset show thatthe method has a high correctness rate and classifies targets simply andrapidly.The method can also be conveniently used for the segmentationand automatic target recognition of multi-class/multi-target in SARimage scenes,with relatively strong robustness against the speckles.Key words:automatic target recognition (ATR);receptive fieldmechanism;local multi-resolution analysis;multi-scalekernel method;synthetic aperture radar image合成孔径 雷达 (SAR)已经成 为一种不可 缺的对地观测和侦察手段。面对不断增长的 SAR 图像收集能力,传统的图像人工判读方法已经越来越力不从心。如何对这 些图像进行 动或半自 快速、准确的解译已经引起人们的关注。自动目标识别(ATR)就 SAR 方面。国内外SAR 图像 ATR 方面的研究表明:与直接利用SAR 图像进行分类的方法相比,利用特征的分类方法正越来越引起人们的重视,也出现了很多相关的特征提取算法,如 PCA 方法、不变 矩、小波矩[1-2]等。在分类器的选择和设计方面,当前公认有效的方法有 SVM[1,3]和 Adaboost[4]的方法。从操作流程看,SAR 图像 ATR 对各步骤的算法具有特殊的要求:特征提取方法原理简单,实现方便,快速实时性强;特征抗噪声、杂波干扰能力强,对平移、旋转等畸变具有较强的容忍性,鲁棒性高。视觉认知理论是当前计算机视觉与智能信息处理领域的研究热点。传统的神经节细胞感受野模型可以用两个 Gauss函数来分别表示中心和外周的敏感性分布,神经元的输出决定于两个 Gauss函数的差基于局部多分辨特征的 SAR 图像自动目标识别 1053 小,直接取9维特征;第2层取顶层外围8个像素对应的8个3×3大小块,特征取72维;第3层类似于第2层,取上层各块中心对应的8个3×3大小块,特征取72维;第4层直接取外围的8个中心点,特征为 维;因 此,对 像,总 为161维。将各级特征分别对应不同尺度的 Gauss核进行映射,得到各自的核矩阵后,进行加权求和,其流程示意图如图5所示。对应的核函数尺度以2倍的关系增大,加权求和采用等系数平均,即β1=β2=β3=β4=1/4。图5 基于四级局部多分辨分解特征提取的四尺度Gauss核映射合成示意图3 仿真实验3.1 MSTAR数据集自动目标识别仿真多采用 MSTAR 数据集,该数据集是 美国 DARPA/AFRL MSTAR 项目组提供的实测SAR 地面静止军用目标数据。它是由Sandia国家实验室分别在1995年和1996年利用 X波段、HH 极化方式、0.3m×0.3m 高分辨率聚束式SAR 采集而得,目标图像大小为128×128像素。项目组推荐使用的训练样本是SAR 在俯仰角为17°时对地面目标的成像数据,包括3类,即 T72(主战坦克)、BMP2(装甲车人员输送车)、BTR70(步兵战车)。测试样本是 SAR 在俯仰角为15°时对地面目标的成像数据。MSTAR 数据中每类目标的方位覆盖范围均为0°~360°,间隔1°。训练样本和测试样本的个数见表1。从实验结果看,基于局部多分辨分解的特征提取方法,具有相对更高的分类正确率。测试样本总数为1 365,正确识别的样本数为1 351,正确率为98.97%。此外,算法实 现了近 3 000 SAR 图像(128×128像素)的快速读取和存储,实时性很高;在目标的快速检测、特征向量的维数等方面,与传统方法相比,均有较大的优势。表1 MSTAR 数据集目标类型训练集 测试集文件名 样本数 文件名 样本数T72SN_132  232 SN_132  196SN_812  231 SN_812  195SN_S7  228 SN_S7  191BMP2SN_9563  233 SN_9563  195SN_9566  232 SN_9566  196SN_C21  233 SN_C21  196BTR70 SN_C71  233 SN_C71  196目标总数 1 622  1 365这里采用最小二乘支持向量分类 (LSSVC)方法,引入 尺度核 函数,实现 LSSVC。多类问题转换为两 问题,采 “One VS One”方法。多尺度核参数分别为:σ1=4 000,σ2=2 000,σ3=1 000,σ4=500,惩罚系数取值范围:C={1,10,100,1 000}。通过不同的特征[1]进行比较实验,最终的分类结果如表2所示。表中数据为不同参数选择下,各种方法的最佳正确率。表2 不同特征提取方法下的 ATR 结果特征提取方法 特征维数 正确率Hu矩特征 7  0.731 3小波矩特征 7  0.846 917  0.918 4小波矩和熵组合特征 7  0.877 617  0.966 0PCA  196  0.964 3局部多分辨特征 161  0.980 2局部多分辨特征(多尺度核方法) 161  0.989 73.2 多目标场景 ATR仿真目前文献 MSTAR SAR ATR问题,都是针对目标图像切片的处理,对于大场景的多类/多个目标的识别,还未有涉及。从某种意义上说,这种情形下的目标识别才是真正的 ATR。基于MSTAR 数据的杂波分布特性,本文生成了一幅大场景图像,内含 MSTAR 试集中 的目标,分别 为:2 T72 标、2 BMP2 个BTR70目标。图像处理的流程如下:1)采用适当的阈 值,对 割,获 像;2)对二值图像 进行形 态学处理 (膨胀、开运 算、腐蚀),获得目标的二值图像;3)计算各目标的重心,并标记;4)从 展,得 图像,此重心也就是对切片图像进行局部多分辨分解的起始位置;5)保存目标切片,经过局部多分辨特1054  (自 版) 2011,51(8)征提取后,送入分类器进行测试,输出分类结果。原图像大小为512×512像素,均值10.82,方差75.30,动态范围64.07,等效视数1.56,辐射分辨率2.56;目标分割后,虽然目标的重心相对于原始 MSTAR 切片中心有所偏移,但经过分类实验,图像中3类6个目标均能实现正确检测和识别,充分证实了本文方法的有效性。为了进一步测试算法在强噪声下的鲁棒性,向原始图像中加入相干斑噪声。加入噪声后,图像相关参数如下:均值 10.83,方差 85.04,动态范围65.31,等效视数1.38,辐射分辨率2.67,峰值信噪比38.38。采用相同的目标检测、重心计算,目标切片获取(图6),分类结果显示,图像中的6个目标仍能正确检测和识别,进一步证实了本文特征提取方法的有效性和鲁棒性。图6 加入相干斑噪声的多目标场景图像 ATR 仿真4 结 论受感受野模型与多分辨分析的启发,提出了一种从图像局部点出发,对图像进行多分辨分析的图像处理方 法,并 MSTAR SAR图像目标的特征提取。同时基于多级特征的整合,运用基于多尺度核方法的 SVM 模型,实现了三类目标的分类。该方法实现简单、快 速有效,不仅对MSTAR 目标切片分类正确率高,对大场景 SAR 图像中的多类、多个目标的分割与自动目标识别也非常有效,并且对相干斑噪声具有较强的鲁棒性。参考文献 (References)[1] Wang H Q,Sun F C,Zhao Z T,et al.SAR image ATRusing SVM with a low dimensional combined feature [C]//Int Symposium on Multispectral Image Processing andPattern Recognition.Wuhan:SPIE Press,2007:67862J.[2] Shen D G. Discriminative wavelet shape descriptors forrecognition of 2-D patterns[J].Pattern Recognition,1999,32(2):151-165.[3] Zhao Q,Principe J C.Support vector machine for SARautomatic target recognition [J].IEEE Trans on Aerospaceand Electronic Systems,2001,37(2):643-654.[4] Sun Y J,Liu Z P,Todorovic S.Synthetic aperture radarautomatic target recognition adaptive boosting [C]//Proceedings of the 2005 International Society OpticalEngineering.San Diego:SPIE Press,2005:282-293.[5] Lowe D G.Distinctive image features from scale-invariantkeypoints[J].Int J Comput Vision,2004(2):91-110.[6] Mikolajczyk K,Schmid C.A performance evaluation of localdescriptors [J].IEEE Trans on Pattern Analysis andMachine Intelligence,2005,27(10):1615-1630.[7] Vapnik V N.The Nature of Statistical Learning Theory[M].NewYork:Springer Press,1999.[8] Ong C S,Smola A J,Williamson R C.Learning the kernelwith hyperkernels [J]. Journal of Machine LearningResearch,2005,6:1043-1071.[9] Sonnenburg S,Rtsch G,Schfer C,et al.Large scalemultiple kernel learning [J].Journal of Machine LearningResearch,2006,7:1531-1565.[10]Kingsbury N,Tay D B H,Palaniswami M. Multi-scalekernel methods for classification [C]//Proceedings of IEEEWorkshop on Machine Learning for Signal Processing.Piscataway,New Jersey:IEEE Press,2005:43-48.[11]Zheng D N, Wang J X,Zhao Y N. Non-flat functionestimation with a multi-scale support vector regression [J].Neurocomputing,2006,70:420-429.[12]Pozdnoukhov A,Kanevski M. Multi-scale support vectoralgorithms for hot spot detection and modeling [J].J StochEnviron Res and Risk Assess,2007,22:647-660.[13]Opfer R.Multiscale kernels[J].Advances in ComputationalMathematics,2006,25:357-380.

[返回]
上一篇:基于局部特征的图像目标识别问题综述
下一篇:基于近邻传播聚类与核匹配追踪的遥感图像目标识别方法