基于遥感图像非监督分类的模糊聚类算法研究

(整期优先)网络出版时间:2016-12-22
/ 2

基于遥感图像非监督分类的模糊聚类算法研究

刘兵兵

四川西南交大铁路发展股份有限公司四川成都610073

摘要:文章针对遥感图像的模糊聚类算法进行了研究。数字图像分类技术是数字图像处理技术中非常重要的一个内容。遥感图像固有的模糊性,对于遥感数字图像来说,尤其是中、低分辨率遥感图像,由于混合像元的影响使得分类结果并不是最优的,也就是说,传统的分类方法往往不能取得理想的分类效果。而应用软分类算法原理,采用模糊聚类方法进行遥感图像的非监督分类是解决这种分类模糊性的主要方法之一。文章研究模糊聚类中的模糊C均值聚类算法,并通过计算机程序来实现算法,从而达到对遥感图像非监督分类的目的。此算法与人工判读分类相比,提高遥感图像非监督分类的速度和效率,节省了人力和物力。

关键词:遥感图像分类;模糊聚类;模糊C-均值算法

1引言

众所周知,遥感图像分类是遥感图像处理研究领域中的一项主要内容,分类的精度直接影响遥感数据的应用水平和实用价值[1]。可是现在从遥感图象中方法分类地物的方式多为人工判读,这类方式难以顺应如今信息化时期的要求,并且也会花费较多的人力和物力。用计算机对遥感图像进行分类则是提高分类的精度和速度非常经济实用的方法,也是遥感数字图像处理的一个重要内容。如何通过非监督分类算法研究来提高遥感图像分类的精度和速度是一个非常有现实意义的课题。本文就是基于模糊聚类中的模糊C均值聚类算法,并通过计算机程序来实现算法,从而达到对遥感图像非监督分类的目的。

2模糊C均值聚类算法

遥感图像的计算机分类,就是对地球表面及其在遥感图像上的信息进行属性的识别和分类,从而达到识别图像信息所相应的实际地物,提取所需地物信息的目的[2]。用计算机通过模式识别技术的运用来对遥感图像进行分类的,模糊聚类法是解决模式识别问题的一种数学方法,在众多的模糊聚类算法中,模糊C一均值算法(FCM)可以说是应用最为广泛、最为灵敏的一种算法[3]。

模糊C均值聚类(FCM),即众所周知的模糊ISODATA,于1973年Bezdek率先提出来。它是在硬C均值(HCM)算法的基础上经过不断改进而形成的,它依据最小二乘法原理采用迭代法对目标函数进进行优化,并通过优化目标函数得到每个样本点对所有类中心的隶属度,从而决定样本点的类属以达到自动对样本数据进行分类的目的[4]。

3模糊聚类在遥感影像非监督分类中的算法研究

3.1遥感影像分类中的模糊C均值聚类算法探索

图像分类的关键问题之一是选择适当的分类规则(或分类器),通过分类器把图像数据划分为尽可能符合实际情况的不同类别[5]。根据遥感图像分类的理论知识结合遥感图像的特性,将模糊C均值聚类方法运用于其图像分类的伪代码列出如下:

1.读入遥感影像数据到一多维数组中Image(band,row,col);其中,band为影像波段数,row、col分别为影像行列数;

2.设定聚类数目c和参数m(≥1);

3.初始化各个聚类中心mi,采用如下的方法:

1)统计各波段的最大值和最小值;

2)根据聚类数目c和各波段的统计值确定初始聚类中心M(0);

mij=minj+(i-0.5)×(maxj-minj)/c

上式中,mij为第i类第j波段聚类中心值,minj为第j波段最小值,maxj为第j波段最大值,i为类别序号(i=1,…,c),c=4为聚类数目。

4.初始化隶属度矩阵,用值在0,1间的随机数初始化隶属矩阵U(0),使其满足(3.1)式中的约束条件;

(3.1)

5.根据聚类中心和隶属度矩阵,按照(3.2)式和(3.3)式分别计算隶属度和新的聚类中心;

1)计算隶属度:

(3.2)

上述计算中,d可以使用欧式距离)

2)计算新的聚类中心:

(3.3)

6.根据(3.4)式计算价值函数。如果它小于某个确定的阀值,或它相对上次价值函数值的改变量小于某个阈值,则算法停止,否则返回步骤5。

(3.4)

3.2遥感影像数据的预处理

文章所用资料是2006年拍摄的成都市西北片区的伪彩色遥感图像(如图1)。该影像由四个波段信息叠加而成。首先,我们利用ErdasImagine8.7中的DataPrep模块下的ImageGeometricCorrection命令先对图像进行几何校正,然后再用DataPrepSubset命令裁剪出需要用的图像。

图1伪彩色遥感图像

为了提高处理速度,需要将假彩色图像转换成二进制数据文件。具体方法是利用遥感图像处理软件ErdasImagine8.7中的数据输入输出功能实现对假彩色图像进行二进制文件的转换。这样就得到在进行FCM之前所需要的原始假彩色图像(图2)。

图2原始假彩色图像

遥感影像数据的分类处理

1.根据二维空间中像元配置的不同,遥感图像的数据格式通常分为三种,即:BSQ(BandSequential),BIL(BandInterleavedbyLine)和BIP(BandInterleavedbyPixel)格式。本文采用的模糊聚类方法需要按波段对遥感数据进行处理,所以采用的数据格式是BSQ格式,该格式的优点是有利于聚类结果图的假彩色合成和图像显示。

2.研究区遥感图像的格式为img格式,数据量庞大,因此,为了加快图像处理速度,先将遥感图像通过ErdasImagine8.7软件转换成二进制文件。具体的操作过程是选择Import工具,再选择Export选项,将img格式转为GenericBinary格式文件,即二进制文件。如图3,该文本中,每一列中的数据分别属与两个样本点,每一个样本点对应四个波段中不同的像素值,这些值均要参与模糊聚类运算。

图3GenericBinary格式文件

3.依据欧式距离聚类的原理,读入各个样本点的坐标、初始化各个聚类中心并设定参数初值。这里我们将聚类类别数设置为4类。经过计算,程序运行完毕之后,会在该文件夹下面产生center.txt和matrix.txt两个文件,其中center.txt为聚类的中心,matrix1.txt为隶属度矩阵。而分类的过程就是判断每个样本点分别隶属于该4类的隶属度大小的过程。

4.在程序中完成各个样本点隶属度大小的比较。在matrix1.txt文件下,一个行表示一个样本属于四个类的隶属度向量,一个列表示属于第几类的隶属度。而经过隶属度大小比较之后,就把该聚类样本点规划到隶属度最大的那一列中去。我们用1、2、3、4来分别代表类别名称,将聚类样本点归类后,新生成的matrix2文件中的数据也就只剩下1-4四种数据(如图4)。最后我们需要做的,就是将聚类结果在Erdas软件中将其转化成灰度图像。

图4matrix2文件

遥感影像数据的分类处理结果分析

从分类之前的原始影像中,由于我们选择的是假彩色图像显示方法,所看到的物体色彩并不是其真实的颜色。但这并不影像我们得到其中所包含的几种典型物体类型,也就是我们聚类所需要的四种目标类:植被、水体、道路、房屋。具体介绍参见下表:

为了更好的显示出此次探索所得到的分类结果,我们需要将程序处理后的数据进一步处理。具体方法就是:使用Erdas软件下的Datapre模块中的import/export功能,勾选import,设置文件形式为genericbinary,载入分类隶属度统计文件matrix2.txt。该软件会针对四个类别号赋予各个像素点不同的灰度值。接下来我们在两个viewer中将分类前后的影象对比如下(图5):

图5原始影像分类前后的对比图

从结果图上看来,似乎灰度图像不是太直观,因此我们可以用伪彩色显示聚类后的图像。在Viewer菜单条的Rasterattributeeditor模块下对各个类别进行命名和修改颜色操作。修改显示模式之后的分类图像就要直观的多(如图6)。

图6聚类后的图像

与非监督分类结果的比较

为了对实验结果进行进一步的评定,本文对同一幅图像用Erdas软件的模块下的非监督分类模块进行了分类。比较两种分类结果如图7所示:

模糊聚类分类非监督分类

图7两种分类结果对比

从上图不难看出,虽然两种方法都大致的将需要划分的对象提取了出来。但是却存在着瑕疵:一是没有将钟楼分离出来;二是部分道路都被归到了别的类别中。从分类之前的原图中我们不难发现出现这一结果的原因。出现第一种情况的原因是因为钟楼和紧挨着的道路在图像上的灰度值显示很相似,而聚类的过程就是根据像素值将分布于聚类中心的像素点聚为一类。因此钟楼就被误分到了道路类别中;而从图像上看,出现第二种错误聚类的原因应该是因为植被类的聚类中心和道路类的聚类中心相隔不远。而灰度值处于道路和植被之间的那一段道路上的像素点到两个聚类中心的隶属度其实相差不大,但是在做隶属度分类取舍的过程中就误将其聚到了相似的类别中。

结束语

模糊聚类算法的改进和应用研究是一个非常有现实意义的课题。如果能完成各种影像的智能化聚类和处理,这不仅能使人们在面对与日俱增的海量数据处理问题上有所成就,更是能充分利用各种影像中蕴藏着的广泛的价值,这些方向可以从本文展开的研究内容和结果中略见一斑。而目前的影像处理技术实际上还没能达到完全的智能化。本文提出的改良算法,改良了模糊聚类的目标函数,在大数据量的情况下,取得良好的效果。

参考文献

[1]王莉君.面向目标的信息提取方法研究[J].成都理工大学,2010.

[2]孙家柄.遥感原理与应用[M].武汉大学出版社,2013.

[3]高新波.模糊聚类分析及其应用[M].西安电子科技大学出版社,2004.

[4]BezdekJC.PatternRecognitionwithFuzzyObjectiveFunctionAlgorithms[J].

PlenumPress,NewYork,1981.

[5]王荣华,干嘉元,过仲阳,吴佳勤.模糊理论在遥感图像分类中的应用[J],华东师范大学地理信息科学教育部重点实验室,上海200062.