欢迎访问一起赢论文辅导网
机械论文
当前位置:首页 > 机械论文
基于K-Gmm算法的SAR海冰图像分类
来源:一起赢论文网     日期:2019-03-23     浏览数:398     【 字体:

 的分布。基于 GMM 模型的聚类算法是一种软聚类方法,其基本思想是在利用 GMM 模型对图像拟合后,基于每个高斯混合概率将相应标签分配给每个观测值。然而,由于初始点的选取具有随机性,其迭代过程的复杂度 通常具有不确 性。K-均值是一种典型的划分聚类方法,它以数据点到中心点的某种距离作为目标函数,通过迭代运算优化目标函数,进而产生输出结果。因此,本文结合业务化海冰分类的需求,提出一种基于 GMM 模型与K-均值的改进聚类方法。该方法在 K-均值聚类步骤中集成了合并操作,为后续的基于高斯混合模型的聚类提供初值,在分类精度可比甚至更高的情况下,有效降低了分类算法的计算复杂度,提高了输出结果的稳定性。1 理论背景1.1 雷达卫星的后向散射过程雷达系统将电磁信号作为脉冲信号从天线中发射出去,经由目标散射,其中一部分信号返回天线由传感器接收。对分布式目标而言,其散射过程的数学表达式为:Er=e-2πjr/λr(∑Ni=1|Bi|e-j(φi+θi))Et(1)式中:Er为接收到的电场;Et为发射电场;λ 为雷达波长;j=槡-1是虚部;远场情形下,认为某个分辨单元内所有散射体与天线间的均值距离相同,记为r;各个散射体相对于均值距离的距离向变化,均吸收到各位置的相位项θi中;局部复反射率|Bi|e-jφi和局部相位θi依赖于各散射体的随机值及其在分辨单元中的位置,其中总的复后向散射系数B 为:B=∑Ni=1|Bi|e-j(φi+θi)(2)由B 形成的图像是复图像,其包含模和散射相位。SAR图像的另两种主要形式是由B 的模构成的SAR幅度图像和由模的平方构成的SAR强度图像。1.2 基于高斯模型的统计分布对于复图像而言,当分辨单元中散射体较少或分辨率较高时,由于个别散射体对总散射系数影响较大,导致总散射系数服从非高斯分布,这种非高斯分布可由非高斯纹理项与多元基于高斯的散斑项的随机 积 模 型 描 述,如 典 型 的 高 斯 混 合 尺 度 模 型(SMoG)。当分辨单元中散射目标较多或分辨率较低时,B 服从零均 值 的 复 高 斯 分 布[13]。另 一 方 面,SAR 图像大量的统计结果表明,其散射信号的幅度服从伽马分布。然而,本文的内部测试和已有研究也证明,在幅度特征空间中将冰类建模为高斯分布能产生可接受的结果[14]。因此,为满足海冰业务化应用的要求,假定冰类服从高斯分布。本文仅关注SAR 海冰幅度图像的非监督分类。1.3 类别的概率形式描述统计分类 中 通 常 采 用 确 定 的 形 式 处 理 概 率 问题,如式(3)给出了贝叶斯定理的对称形式:p(x,i)=p(i|x)p(x)=p(x|i)p(i) (3)式中:i为类别标签;x 为像素点的特征向量。基于贝叶斯定理的统计分类是通过估计联合概率p(x,i)或条件概率p(i|x)实现的,而最大似然(MaximumLikelihood,ML)是常用的类别估计方法:c(x)=arg maxip(i|x)=arg maxip(x,i) (4)式中:c(x)是类别的最大似然估计,即条件概率的最大值。对于给定观测值x,边缘概率p(x)也是定值,因此对条件概率的最大似然估计等价于对联合概率的最大似然估计。1.4 马尔科夫随机场(MRF)模型算法传统的马尔科夫随机场(MRF)方法利用平稳模型,以统计最优方式考虑 SAR 斑点噪声的本质,同时为正则化提供了有效的空间语境模型,可对局部空间交互中的 图 像 像 素 概 率 分 布 进 行 描 述[15]。在MRF建模中,最大后验概率(Maximum a Posterio-ri,MAP)成 为 最 普 遍 的 选 择,其 与 MRF 组 成 了MAP-MRF框架,SAR 图像分割也采用此框架:e(x)=arg maxip(i|x)∝arg maxip(x,i)p(i)=arg miniE (5)式中:假设先验概率p(i)严格正定且具有马尔科夫性;e(x)代表最大化后验条件概率分布;E 是后验概率的能量表示。式(5)意味着最大后验条件概率分布与模型的最小化能量等价。如果能量函数是凸的,则经由确定性算法(如Iterated Conditional Modes,ICM)容易取得全局能量最小值[16]。然而,多数情况下能量函数是非凸 的,因此 算 法也许 会 收敛于局 部 最 小 值。更好的解决方案是模拟退火(Simulated Annealing,SA)算法,该算法采用随机采样,如 Metropolis-Has-tings或 Gibbs采样,可以保证收敛于全局能量最小值[17,18]。1.5 IRGS分割算法IRGS(Iterative Region Growing using Seman-tics)算法是一种基于 区域的 MRF 分 割方 法,与传统基于像素的 MRF分割方法相比,该算法分割精度更高,运行效率也有所提升[19]。IRGS 算法在构建页34第5期第     任莎莎,郎文辉:基于 K-GMM 算法的 SAR 海冰图像分类 模 型 时,引 入 了 边 缘 强 度 惩 罚 信 息g(Δst),其中边缘强度Δst=xt-xs,边缘强度越大,惩罚函数g(Δst)值越小[20]。该算法基于区域迭代生长技术得到目标函数的最优解:arg min{i,s∈Ωi{}∑s∈Ωi12ln(2πσ2i)+(xs-μi)22σ2[ ]i+    β ∑(s,t)∈C[1-δ(xs,xt)g(Δst})] (6)式中:s为栅格图像中的某个位置;Ωi为图像中类别为i的某个区域,C 为对应类标鉴区域Ωi的集合;μi和σi分别为类i的均值和方差;t是与s 相邻的另一位置;δ(·)为 Kronecker delta函数,是整幅栅格图像上的所有团(clique)集;参数β控制空间语境模型的影响。区域 迭 代 生 长 技 术 基 于 合 并 前 后 的 能 量 差异,确定是否合并一对相邻 的分割区域,若差 异 为正,则相应的区域不合并,反之,则合并。该过程迭代进行,直到能量不再降低为止。2 K-GMM 算法设计2.1 K-均值算法结合 Lloyd[21]和 Kanungo等[22]的思想,本文设计了适合海冰业务化应用的 K-均值 算 法。设S={x1,…,xN}表示要聚类的像素点集,N 代表图像中的像素点数。算法的主要步骤如下:(1)设k=kinit,从S 中随机抽样k 个聚类初始中心μ1,μ2,…,μk。考虑到海冰业务化分类主要包括冰水分类和冰类分类两种,前者为两类分类,后者通常不超过4类[14],因此将kinit设为4。(2)将每个点分配到其最近的聚类中心。对于1≤i,j≤k,i≠j,令SjS 是最接近μj的像素点子集,则对于任何x∈S,如果‖x-μj‖≤‖x-μi‖,有x∈Sj,这里用nj表示Sj的点数。(3)删 除 像 素 点 数 少 于 预 定 阈 值 的 聚 类 中 心。调整k的值,并重新标记其余聚类S1,…,Sk。(4)将每个聚类中心移动到相关点集的质心。即:μj←1nj∑x∈Sjx 1≤j≤k (7)如果在步骤(3)中删除了任何聚类,则算法返回步骤(2)。(5)在所有不同聚类中心对间,计算成对聚类间的距离dij:dij←|μi-μj| 1≤i<j≤k(8)(6)按升序对步骤(5)中的类间距离进行排序,选择类间距和数量皆小于各自预定义阈值的聚类对子集。针对子集中的每个聚类对(Si,Sj),只要Si和Sj 在本次迭代中尚未参与合并,就用合并聚类Sij=Si∪Sj 替代它们,合并后的聚类中心是其加权平均值μij(式(9)),重新标记其余类并相应地减少k值。μij←1ni+nj(niμi+njμj) (9)(7)如果迭代次数小于预定义阈值Imax且代价函数C=∑kj=1∑x∈Sj‖x-μj‖继续降低时,则转到步骤(2)。如果以直接方式实现本算法,则算法的时间复杂度为O(knImax),空间复杂度为 O(k)。由于聚类数k远小于图像中像素点个数n,算法中最耗时的阶段是步骤(2)。为提高该步骤的运行效率,将像素点而不是聚类中心存储在 KD 树中,然后利用该树反求最近邻问题[23]。2.2 EM-GMM 聚类算法GMM 是一种有限 混合概率模 型,它 描 述 了 由多个混合分量构成的随机变量,每个混合分量类似于加权高斯分布[24]。因此,根据1.1节的讨论,SAR幅度数据的概率分布密度函数可通过高斯加权函数表示:lnp(X|π,μ,∑)= ∏Nn=1ln∑Ki=1πiN(xn|μi,∑i{ )}= ∏Nn=1ln∑Ki=1πi1槡|∑j|(2π)dex{p         -12(xn-μi)T∑-1i(xn-μi( )})(10)式中:μi为类均值;∑i为类协方差矩阵;K 为冰类的数量,由2.1节推出;πi为混合分量权重,这里∑Ki=1πi=1;d 为特征空间的维数,如果仅使用单极化通道中的幅度信息,则d=1。通常 使 用 最 大 期 望 算 法 (Expectation Maxi-mum,EM)根据式(10)求解高斯混合问题。该算法首先基于 K-均值算法的结果获得μi0,并计算∑i0和πi0,然后迭代更新这些参数直到收敛。每次迭代包括一个 E 步骤和一个 M 步骤。针对给定参数,如果最大似然函数没有收敛或终止标准不满足,则 E 步骤使用贝叶斯规则为所有像素点xn和混合分量1≤k≤K 计算隶属度权重,得到大小为 N × K 的隶属度权重矩阵,其每行的和为 1。M 步骤则基于隶属度权重更新模型参数。由于估计参数的增多,标准 GMM 算法的时间复杂度 为 O(3 KNIGMM),空 间 复 杂 度 为 O(3(K+N))。但 K-GMM 中 的 迭 代 次 数IK-GMM要 远 低 于IGMM,为降低 计 算 量,EM 算 法 中 的 收 敛 条 件 也 由页44第 地 理 与 地 理 信 息 科 学                第34卷然的显著 变 化 改 为 检 测 估 计 参 数 的 显著变化。2.3 K-GMM 算法流程设计综上所述,K-GMM 分类流程(图1)为:1)首先使用高斯滤波器对SAR 图像进行滤波,去除斑点噪声;2)从滤波后的 SAR 图像中提取幅度特征,并绘制幅度直方图;3)使用 K-均值算法确定冰类数量、初始GMM聚类中心、协方差和混合分量权重;4)采图1 K-GMM 算法流程Fig.1 K-GMM algorithm flow chart用 EM 算法求解高斯混合模型中的参数,即 E 步骤中的隶属度权重矩阵计算,M 步骤中基于幅度直方图的均值、协方差和混合分量权重参数更新;5)判断各 个 估 计 参 数 (μi和∑i)的 改 变 量 是 否 小 于0.00001,且迭代次数是否大于 80 次,如果满足,则提前终止,否则返回上一步;6)输出分类结果。3 实验结果及分析3.1 测试数据为验证本文方法的有效性,选取了 3 幅不同的SAR 海冰图像进行测试:1)RADARSAT 采集的波弗特海(Beaufort Sea)部分海冰图像(图2a),507×367像素,其详细制作过程参见文献[25],图像中有由细碎冰组成的小尺度区域、平滑浮冰构成的中大块区域、大 块 平 滑 浮 冰 组 成 的 大 尺 度 区 域;2)RA-DARSAT-2于2009年1月14日拍摄的中国辽东湾海冰图像(图2b),1 410×1 410像素,分辨率为8m,极化方 式 为 VH,由 灰 冰、灰 白 冰 和 敞 水 3 类 冰 组成;3)SIR-C于1994年4月18日拍摄的拉布拉多海纽芬兰海岸部分海冰图像 (图 2c),1 730×1 730像素,HV 极化,包含一年冰、融冰[26]和敞水。图2 SAR 海冰图像Fig.2 Images of SAR sea ice3.2 实验结果与分析本研究采用 C编程语言实现实验算法(PC 配置为Intel酷睿i5 6200CPU ,UNVIDIA GeForce940MX+Intel GMA HD 520显卡),包括 K-GMM算法、经典 K-均值算法、Yu等[10]提出的IRGS分割算法、基于像素的马尔科夫随机场分割(MRF)算法和标准 GMM 聚类算法。从分类(分割)结果(图3-图5)可知,与海冰实况比较,无论是边缘细节比较丰富的图像(图2a),还是因相干斑噪声而严重退化的图像(图2b),亦或是海冰分布结构比较复杂的图像(图2c),K-GMM 算法在边缘保持和纹理细节识别方面均比较突出。表1给出了 分 割 质 量 的 定 量 比 较,在 纽 芬 兰 海 岸,K-GMM 算 法 的 整 体 准 确 率 和 Kappa 系 数 分 别 为67.37%和0.490,而IRGS 算 法 分 别 为 71.05% 和0.348,两种 方 法 基 本 持 平。而 在 波 弗 特 海 和 辽 东湾,K-GMM 算法的整体准确率和 Kappa系数均高于其他算法;且在3幅图像上,K-GMM 算法的整体准确率和 Kappa系数均高于标准 GMM 算法。由此表明,GMM 与 K-均值组合能有效提高 GMM 聚类算法的精度,可较好地拟合SAR 海冰数据分布。在运行效率方面,由表1可以看出,如果输入图像尺寸较 小 (波 弗 特 海),IRGS 与 MRF 算 法 的 运行 时间 分 别是K-GMM算 法的100倍与50倍 左 右 ;页54第5期第     任莎莎,郎文辉:基于 K-GMM 算法的 SAR 海冰图像分类:2017-10-25; 修回日期:2018-05-11  基金项目:国家自然科学基金项目(61271381、61371154、61102154);航空科学基金项目(201301P4007);中央高校基本科研业务费专项资金(2012HGCX0001)  作者简介:任莎莎(1992-),女,硕士研究生,研究方向为遥感图像处理。*通讯作者 E-mail:langwh@hfut.edu.cn图3 波弗特海海冰图像分类结果Fig.3 The classification results of Beaufort sea ice using a variety of algorithms图4 辽东湾海冰图像分类结果Fig.4 The classification results of sea ice in Liaodong Bay using a variety of algorithms页64第 地 理 与 地 理 信 息 科 学                第34卷图5 纽芬兰海岸海冰图像分类结果Fig.5 The classification results of sea ice in Newfoundland coast using a variety of algorithms如果所输入图像尺寸较大(辽东湾),MRF算法的运行时间是611s,为 K-GMM 算法的近50倍;继续增加输入 图 像 的 尺 寸 (纽 芬 兰 海 岸),此 时 IRGS 与MRF算法消耗的时间分别为 K-GMM 算法的 462倍和114倍左右。这是因为IRGS 和 MRF 的计算复杂度不仅与特征模型相关,还依赖于图像语境的复杂度,且随处理数据量的增加呈指数增长。表1 不同算法的分类性能与运行时间比较Table 1 Comparison of classification performanceand run time of different algorithms分类算法 波弗特海 辽东湾 纽芬兰海岸K-均值 67.79/0.173/0.1 42.41/0.304/11  65.47/0.303/8IRGS  70.37/0.438/102 51.59/0.282/19 71.05/0.348/3 695MRF  72.37/0.439/50 59.44/0.385/611 77.52/-0.437/913GMM  57.55/0.366/1  44.45/0.187/4  66.57/0.454/7K-GMM  72.38/0.587/1  64.84/0.464/12  67.37/0.490/8  注:*/*/*为算法的整体准确率(%)/Kappa系数/运行时间(s)。4 结语针对业务化SAR 海冰图像分类的需求,本文提出了一种组合非监督分类方法。该方法在 K-均值聚类步骤中经由合并操作自动测定冰类数,并为后续的 GMM 聚类步骤提供初始聚类中心。在有限混合模型分类阶段,基于像素分布,利用期望最大化方法估计类别似然,采用最大似然分类技术估计每个像素的最终类别。在3种 SAR 海冰场景上,将本文方法与其他几种常见方法进行了比较分析,结果表明:K-均值聚类步骤的引入大大缩减了 GMM 聚类步骤的迭代次数,有效降低了计算复杂度,使本文方法比其他方法更易于移植到小型化、移动化设备上;在中、低尺寸 SAR 图像中,本文方法呈现出更高的分类精度,这意味着图像中期望的冰类单峰分布更接近高斯分布。将本文方法与分层策略相结合,以提高对大尺寸SAR 海冰图像的非监督分类精度,将是进一步研究的方向。国家海洋 局 第 一 海 洋 研 究 所 提 供 了 中 国 辽 东湾、拉布拉多海纽芬兰海岸和波弗特海 SAR 海冰图像及相应海冰实况图,此致谢忱!参考文献:[1] 李炬霖,芮旸,李同昇,等.中国渔业地理集聚时空特征及影响因素[J].地理与地理信息科学,2017,33(2):100-107.[2] JOHANNESSEN O M,BENGTSSON L,MILES M W,et al.Arctic climate change-observed and modeled temperature andsea ice[J].Tellus Series A-Dynamic Meteorology and Oceanog-页74第5期第     任莎莎,郎文辉:基于 K-GMM 算法的 SAR 海冰图像分类raphy,2004,56(4):328-341.[3] 吴玮,秦其明,范一大.基于无人机可见光遥感影像的救灾帐篷信息提取[J].地理与地理信息科学,2015,31(2):20-23.[4] 郎文辉,沈杨,昂安,等.带有区域分裂自适应细化过程的 SAR海冰图像分割[J].遥感学报,2015,19(5):864-872.[5] LI S Z.Markov Random Field Modeling in Image Analysis[M].London:Springer,2009.24-48.[6] YUE B.SAR Sea Ice Recognition Using Texture Methods[D].Waterloo:University of Waterloo,2002.40-83.[7] TARABALKA Y,FAUVEL M,CHANUSSOT J,et al.SVM-and MRF-based method for accurate classification of hyperspec-tral images[J].IEEE Geoscience & Remote Sensing Letters,2010,7(4):736-740.[8] 沈杨,郎文辉,吴杰,等.结合 MRF与ν-SVM 的 SAR 海冰图像分类[J].遥感学报,2015,19(5):844-855.[9] DENG H,CLAUSI D A.Unsupervised image segmentation u-sing a simple MRF model with a new implementation scheme[A].IEEE International Conference on Pattern Recognition[C].2004.691-694.[10] YU Q Y,CLAUSI D A.IRGS:Image segmentation using edgepenalties and region growing[J].IEEE Transactions on Pattern A-nalysis and Machine Intelligence,2008,30(12):2126-2139.[11] DOULGERIS A P.An automatic u-distribution and Markovrandom field segmentation algorithm for PolSAR Images[J].IEEE Transactions on Geoscience & Remote Sensing,2015,53(4):1819-1827.[12] LI C T.A conditional random field approach to unsupervisedtexture image segmentation[J].EURASIP Journal on Ad-vances in Signal Processing,2010,2010(1):167942.[13] DOULGERIS A P.Non-Gaussian Statistical Analysis of Polar-imetric Synthetic Aperture Radar Images[D].Tromso:Uni-versitetet I Tromso,2011.3665-3676.[14] YU Q .Automated SAR Sea Ice Interpretation[D].Waterloo:University of Waterloo,2006.19-75.[15] DENG H,CLAUSI D A.Unsupervised segmentation of syn-thetic aperture radar sea ice imagery using a novel Markovrandom field model[J].IEEE Transactions on Geoscience &Remote Sensing,2005,43(3):528-538.[16] BESAG J.Spatial Interaction and the statistical analysis of lat-tice systems[J].Journal of the Royal Statistical Society,1974,36(2):192-236.[17] GEMAN S,GEMAN D.Stochastic relaxation,Gibbs distribu-tion,and the Bayesian restoration of images[J].IEEE Trans-actions on Pattern Analysis & Machine Intelligence,1984,6(5-6):721-741.[18] METROPOLIS N,ROSENBLUTH A W,ROSENBLUTH MN,et al.Equations of state calculations by fast computing ma-chines[J].Journal of Chemical Physics,1953,21:1087-1092.[19] YU P,QIN A K,CLAUSI D A.Unsupervised polarimetricSAR image segmentation and classification using region grow-ing with edge penalty[J].IEEE Transactions on Geoscience &Remote Sensing,2012,50(4):1302-1317.[20] LI F,CLAUSI D A,XU L,et al.ST-IRGS:A region-basedself-training algorithm applied to hyperspectral image classifi-cation and segmentation[J].IEEE Transactions on Geoscience& Remote Sensing,2017,PP(99):1-14.[21] LLOYD S P.Least squares quantization in PCM[J].IEEE Trans-actions on Information Theory,1982,28(2):129-137.[22] KANUNGO T,MOUNT D M,NETANYAHU N S,et al.Anefficient k-means clustering algorithm:Analysis and imple-mentation[J].IEEE Transactions on Pattern Analysis & Ma-chine Intelligence,2002,24(7):881-892.[23] DEMPSTER A P,LAIRD N M,RUBIN D B.Maximum likeli-hood from incomplete data via the EM algorithm[J].Journalof the Royal Statistical Society,1977,39(1):1-38.[24]  郎文辉,常灿灿,杨学志,等.ScanSAR 模式海冰图像的 分 割[J].遥感学报,2014,18(1):126-138.[25] OCHILOV S,CLAUSI D A.Operational SAR sea-ice imageclassification[J].IEEE Transactions on Geoscience & RemoteSensing,2012,50(11):4397-4408.[26] WANG L,SCOTT K A,XU L,et al.Sea ice concentration estima-tion during melt from dual-pol SAR scenes using deep convolu-tional Neural Networks:A case study[J].IEEE Transactionson Geoscience & Remote Sensing,2016,54(8):4524-4533.SAR Sea Ice Image Classification Based on the K-GMM AlgorithmREN Sha-sha,LANG Wen-hui(School of Computer and Information,Hefei University of Technology,Hefei 230009,China)Abstract:Due to the speckle and incident angle effect of the SAR sea ice images,the existing sea ice segmentation algorithmbased on the random field method often introduces the complex context model,which can easily lead to the over smoothing phe-nomenon.These methods not only reduce the segmentation accuracy of some images,but also compromise the program opera-tional efficiency.Therefore,according to the characteristics of sea ice classification (segmentation),this paper proposes an im-proved clustering method based on Gaussian mixture model(GMM)and K-means clustering.The merging operation is integrat-ed in the K-means clustering step,which provides initial values for the clustering based on Gaussian mixture model.On this ba-sis,the GMM is learned using the expectation maximum (EM)method.And finally,an maximum likelihood(ML)classificationis performed to assign each pixel into a final class.Among them,the introduction of the K-means clustering step greatly reducesthe number of iterations of the GMM clustering step and improves the stability of the output result.The proposed method wastested on various SAR images,and the results were compared with other well-established approaches.The quantitative analysisof the experimental results confirmed that the proposed method can significantly lower the computational complexity of the clas-sification algorithm,decrease the amount of computing resources on demand when the classification accuracy is comparable or e-ven higher.Also,the proposed method is easy to implement in miniaturized or mobile devices.Key words:SAR sea ice image;unsupervised classification;K-means;Gaussian mixture model页84第 地 理 与 地 理 信 息 科 学                第34卷

[返回]
上一篇:基于多尺度分块卷积神经网络的图像目标识别算法
下一篇:地球物理模式函数的SAR风速反演性能评估