한국지형공간정보학회지 (Journal of the Korean Society for Geospatial Information System) Vol.21 No.2 June 2013 pp.19-25 연구논문 ISSN: 1598-2955 (Print) ISSN: 2287-6693(Online) http://dx.doi.org/10.7319/kogsis.2013.21.2.019 * KOMPSAT-2 영상의토지피복분류에적합한 SVM 커널함수비교연구 A Comparative Study on Suitable SVM Kernel Function of Land Cover Classification Using KOMPSAT-2 Imagery 강남이 * ㆍ고신영 ** ㆍ조기성 *** Kang, Nam Yi ㆍ Go, Sin Young ㆍ Cho, Gi Sung 要旨 최근고해상도위성영상은자연자원이나환경관리에필요로하는토지피복및이용현황자료분석등에유용하게사용되고있다. 영상처리알고리즘중 SVM 알고리즘은최근다양한분야에서이용되고있다. 그러나 SVM 알고리즘은다양한커널함수및매개변수에의해그정확도가달라진다. 따라서본논문에서는 SVM 알고리즘의대표적커널함수를 KOMPSAT-2 의영상자료에적용하고토지피복결과를검사점을이용하여정확도분석을실시하였다. 또한대상지의토지피복분류에적합한 SVM 의커널함수선정하기위해분석을실시하였다. 그결과전체분류정확도에는 Polynomial 커널함수가가장높은정확도를보였으며분류항목별정확도에서의가장적절한커널함수는 Polynomial, RBF 커널함수임을알수있었다. 핵심용어 : 고해상도위성, KOMPSAT-2, 토지피복분류, SVM, 커널함수 Abstract Recently, the high-resolution satellite images is used the land cover and status data for the natural resources or environment management very helpful. The SVM algorithm of image processing has been used in various field. However, classification by SVM algorithm can be changed by various kernel functions and parameters. In this paper, the typical kernel function of the SVM algorithm was applied to the KOMPSAT-2 image and than the result of land cover performed the analysis using the checkpoint. Also, we carried out the analysis for selected the SVM kernel function from the land cover of the target region. As a result, the polynomial kernel function is demonstrated about the highest overall of classification. And that we know that the polynomial kernel and RBF kernel function is the best kernel function about each classification category. Keywords : High Resolution Satellite Image, KOMPSAT-2, Land-cover Classification, SVM, Kernel Function 1. 서론 1.1 연구배경및목적초기의원격탐사 (Remote Sensing) 는환경탐사등과같은목적보다는군사적목적으로주로이용되었으나영상자료의민간보급으로토지의활용계획, 환경문제에대한모니터링및관리, 지도제작의이용과같이사회적문제와환경적문제등의다양한연구가진행되고 있다. 이는복잡하고다양한정보와직접적취득이어려운정보를신속하게수집가능하고활용을다양하게할수있기때문이다. 또한빠르게발전해가는위성기술로인한 1m 이하의공간해상도를가진영상의획득으로원격탐사의관심은더욱높아지고있으며토지피복도제작외에도다양한분야의활용에대한연구가끊임없이진행되고있다 (Richards, 1994; Schowengerdt, 1983). 2013 년 1 월 29 일접수, 2013 년 4 월 9 일수정, 2013 년 4 월 25 일채택 * 정회원ㆍ전북대학교토목공학과석사 (Member, Department of Civil Engineering, Chonbuk National University, namyi86@jbnu.ac.kr) ** 정회원ㆍ전북대학교토목공학과박사과정 (Member, Department of Civil Engineering, Chonbuk National University, gosinqqq@jbnu.ac.kr) *** 교신저자ㆍ전북대학교토목공학과교수 (Corresponding author, Department of Civil Engineering, Chonbuk National University, gscho@jbnu.ac.kr) 19
20 강남이ㆍ고신영ㆍ조기성 우리나라의경우 1992 년우리별 1 호를발사후계속된발전을통하여 2006 년 KOMPSAT-2 를발사하였다. 이는공간해상도 1m 급의우리나라최초의고해상도위성이다. 이를바탕으로국내에서 KOMPSAT-2 의영상자료를활용하기위한연구가계속해서진행되어왔다. 그러나위성의발달과함께고해상도위성영상에대한수요가증가하였지만이를토지피복분류등에실용화하기까지는많은과정을거쳐야한다. 초기의토지피복분류알고리즘은영상자료에대한통계학적분석을하는무감독분류, 감독분류가주로적용되었으며, 이후통계적분석의한계점을극복하기위한신경망알고리즘, 의사결정트리기법등이있으며, 최근다양한방면에서이용되고있는 SVM(Support Vector Machine) 이개발되었다. SVM 분류기법의경우분류항목에대한선정뿐만아니라적용되는커널함수및매개변수에의해결과정확도가다르게나타날수있으므로분류결과물에대한실용화를위해선알고리즘에대한일반적인선택기준이필요하다 (Kang, Nam Yi, 2012). 기존의연구에서는 Carl Staelin(2003) 의다양한문제를효율적으로해결할수있는 DOE(Design of Experiments) 기반의 SVM 매개변수알고리즘을제시하였고, 커널폭에민감하여 Over-fitting 또는 Under-fitting 이발생하는가우시안 RBF 커널에관한연구도진행되었다 (Chang, 2005). SVM 분류기법은전통적인 SVM 알고리즘이외에도커널함수의역할이중요시되고있으나현재연구에서는 Hyperion 영상에 SVM 을대표적인커널함수인 polynomial, RBF 를적용하여토지피복분류를시행하고분석하였으며 (Choi, Jae Wan, 2006), Navie Bayes classifier 와 SVM 을사용하여성능을비교한영상분류연구가있었다 (Lee, Min Hoon, 2006). 이연구역시 polynomial 및 RBF 커널함수를적용하여영상분류를실시하였다. 이러한 SVM 의적용에관한연구는꾸준하게진행되어지고있지만영상분류에대한적절한커널함수선택및비교, 매개변수의선정에관한연구가필요하다. 따라서본논문에서는 KOMPSAT-2 영상자료에 SVM 알고리즘의대표적커널함수를적용하여토지피복분류를실시하고토지피복결과를검사점을이용하여분류정확도를분석고자한다. Fig.1 은연구흐름도를나타낸것으로선정된대상지역에맞는위성영상을취득한후 RPC 을이용한기하보정을실시하였다. 감독분류시필요한 Training data 을선정하여각커널함수를적용한 SVM 분류를실시하고이에따른정확도분석후적절커널함수를유추하고자하였다. Figure 1. The flowchart of the study 1.2 고해상도위성영상고해상도위성은높은해상도기능을가진센서를탑재한위성을의미하는것으로취득된영상을지상국으로전송하는역할을하고있다 (Han, Seung Hee, 2010). 고해상도위성영상은일반적으로 1m 급이하의공간해상도를가지고있어지표속성에대한특성을자세하게나타낼수있어다양한분야에서활용할수있다. 고해상도위성영상의공간해상도는최근크게향상되어항공영상과유사한공간해상도를나타내고있어세밀한지도제작기술에접목할수있게되었다. 또한촬영계획부터영상자료의취득까지시간이걸리는항공영상보다는일정궤도를따라위성이운행하며주기적으로지표면에대한영상자료의취득이가능하여다양한분야에빠르게적용이가능하다는장점을가지고있다. 우리나라는 KOMPSAT-2 의성공적인발사로세계 7 번째고해상도위성을보유한국가가되었다. KOMPSAT-2 는저궤도지구관측위성으로고해상도광학카메라 (Multi-spectral Camera; MSC) 를탑재하여 1m 급의 Panchromatic 영상및 4m 급 Multispectral 영상을제공한다. KOMPSAT-2 의주요목적으로는전자지도제작, 불법적인토지이용탐지, 도로와같은대규모시설관리등의지리정보시스템의구축및자연환경변화를감시하며재난재해지역을탐지하여피해규모산출및예방 제 21 권제 2 호 2013 년 6 월
KOMPSAT-2 영상의토지피복분류에적합한 SVM 커널함수비교연구 21 Table 1. KOMPSAT-2 specifications Sensor MSC(Multi-spectral Camera) Imaging mode Panchromatic Multispectral Spatial Resolution 1m 4m Swatch Width 15km 15km Panchromatic-0.5 ~ 0.71μm Multispectral Spectral Resolution band 1 : 0.45 ~ 0.52μm band 2 : 0.52 ~ 0.60μm band 3 : 0.63 ~ 0.69μm band 4 : 0.769 ~ 0.9μm 과예측에이용한다. 현재는국토관리및자연재해감시등을위한정보수집을위하여 685km 의저궤도에서지구를하루 14 번돌며전세계를촬영하고이를지상국으로전송하고있다. Table 1 은 KOMPSAT-2 의제원을나타낸것이다. 2. Support Vector Machine 2.1 SVM SVM은 1995년 Vapnik에의해구체적으로제안되었으며기존의다중신경망방법과비교하여구조적오류를최소화시킨다 (Vapnik, 1995). SVM 분류기법은가능한다양한데이터들을최대한의거리로분리시키는최적의초평면 (Hyperplane) 을찾는것이목적이다. 이때분류항목간의초평면과가장가까운값을 Support Vector라고하며, Support Vector와초평면사이의최대거리를마진 (Margin) 이라고한다 (Foody, 2004; Prasad, 2011). 선형 SVM을선형분리가불가능한문제에적용하면최적의해를찾지못하는데이는최적의해가존재하지않기때문이다. 주어진문제를해결하기위해서는조건을유연하게확장하여선형분리불가능문제를선형분리가능문제로변화시켜야한다. 다음식 (1) 의 는비선형 SVM의목적함수이다. 여기서다차원공간상에서의훈련데이터가 이며, 는 Lagrange Multiplier를의미한다 (Kim, Hyo Mi, 2002; Lee, Chang Seok, 2011). (1) 2.2 Kernel Function SVM 분류기법을다양한분류항목과많은자료에적용하기위해서는커널함수 (Kernel function) 를사용하여분류작업을수행할수있다. 커널함수의선택과매개변수의변화에의해분류결과가달라진다 (Kim, Gi Sung, 2003). 비선형자료를특정한함수를이용하여자료를고차원으로사상시킨다면특징공간에서의함수 의내적 으로표현하게된다. 이러한내적을계산할수없기때문에, 을만족하는커널함수 K를이용한다 (Choi, Jae Wan, 2006). (2) (3) 대표적인커널함수로는 Linear, Polynomial, RBF (Radial Basis Function), Sigmoid가있다. 커널함수는 Support Vector와 Input Vector의관계를반영하는것으로커널함수에따른그래프형태는다음 Fig. 2와같다. Polynomial 커널함수의위쪽그래프는두개의벡터의내적의상관관계를나타내며아래의그래프는서로다른매개변수선정으로인해나온유사성을측정한결과이다. RBF 커널함수는벨모양의함수형태로두벡터사이의관계가밀접하며, Sigmoid 함수는매개변수, 가그래프형태를조정하는데이용된다 (Vapnik, 1995; Schölkopf, 2002; Muller, 2001). Figure 2. The graph form according to the kernel function(l-polynomial, C-RBF, R-Sigmoid) Table 2. Type of kernel function Function Linear Polynomial RBF Sigmoid Formula 한국지형공간정보학회지
22 강남이ㆍ고신영ㆍ조기성 본연구에서는 Table 2 에나타난커널함수를적용하여영상분류를실시하였다. 3. 적용및고찰 3.1 대상지선정연구대상지역은대전광역시유성구엑스포과학공원부근지역 ( 좌상단 352916.18, 4028546.51; 우하단 355962.69, 4025616.27; UTM WGS84) 으로다양한인공지형지물및하천, 임야가포함될수있는지역으로선정하였다. 대상지역의면적은약 8.953 km2이며, KOMPSAT-2 영상은 2009 년 4 월 12 일촬영된영상을사용하였다. 3.2 자료분석 3.2.1 Training Data 선정일반적으로토지피복분류작업시분류항목은미국의 USGS 의분류항목선정기준을따르고있으며현재우리나라의경우에는환경부와국토지리정보원에서선정한분류항목기준을따라토지피복분류를실시하고있다. 본연구의경우대상지역인대전광역시는도심지뿐만아니라하천과임야등과같은다양한환경적공간이존재하고있다. 최근도시개발등다양한분야에환경적요소를적극반영하고있는추세이기때문에본연구에서의분류항목은도심지의주요구조물인건물, 도로, 기타대지와환경적요소인하천, 임야등으로선정하였다. Table 3 은선정한 Training data 의영상위치및선정한픽셀수를나타낸것이다. Figure 3. The study area Table 3. The training data selection and number of pixels Class Forest River Road Bar Land Building Shadow Location Pixel 91 51 93 51 55 107 49 3.2.2 영상분류연구대상지역에대한영상분류는 SVM 기법을이용하여실시하였으며 SVM 분류기법은다양한커널함수에따라초평면의형태가달라지므로적절한커널함수의선택이이루어져야높은정확도의결과를얻을수있다 (Kim, Gi Sung, 2003). 현재이용되는커널함수 Figure 4. The class percentage of kernel function 제 21 권제 2 호 2013 년 6 월
KOMPSAT-2 영상의토지피복분류에적합한 SVM 커널함수비교연구 23 Table 4. Parameter of test Kernel Function Linear - - - Polynomial 1 1 2 0.25 Polynomial 2 2 3 0.25 Polynomial 3 2 5 0.25 Polynomial 4 3 3 0.25 Polynomial 5 3 5 0.25 Polynomial 6 4 1 0.25 Polynomial 7 4 5 0.25 Polynomial 8 5 1 0.25 Polynomial 9 5 4 0.25 Polynomial 10 6 2 0.25 Polynomial 11 6 4 0.25 RBF - - 0.25 Sigmoid 1-2 0.25 Sigmoid 2-3 0.25 의선택은사용자에의한임의의선택이므로특별한기준이없다는단점이있다. 따라서본연구에서는 SVM 분류기법에서주로이용되는 Linear, Polynomial, RBF, Sigmoid 함수를적용하여커널함수의선택기준을모의실험을통해서제시하였다. 커널함수에따른매개변수의변경은기존의연구결과물및실제자료에입력하여영상분류에오류로나타나지않는최대값과최소값을찾아내어범위를산정하고이를대상지역에적용하였다. gamma 매개변수의경우기본적으로위성영상의 Band 수의영향을받는다는연구결과에따라선정하였다 (Chang, 2005). 그외의매개변수는반복적인적용을통하여선정하였다. 적용된매개변수의값을다음 Table 4와같으며, 는 gamma 매개변수, 는 bias 매개변수, 는 degree 매개변수를의미한다. 대상지역의크기는총 490,000화소로분류결과를정량적으로확인하면대상지에서임야부분이약 38% 정도로가장큰영역을차지하였으며도로및건물지역이도심지의특성상많은비율을차지하였다. 그림자의경우도토지피복속성에는포함되지않지만고층건물이존재하는도심지역에서는무시할수없는속성이며, 차후연구에서는그림자영역에대한보정작업등과같은전처리과정이필요로할것으로보인다. 3.2.3 정확도분석토지피복분류결과에대한정확도분석을위하여이용하는기준자료는원래의영상자료를고급전문가가디지타이징하여제작한주제도를이용한다. 그러나본연구에서는전문적기술이필요로하는디지타이징된 Figure 5. Reference point of study area 주제도를대신하여임의의검사점을선정하여원영상에서의분류항목과토지피복분류결과에서의분류항목을비교하여정확도를분석하고자하였다. 임의의검사점은영상자료의전체에균등하게분포시키기위하여 100m 간격으로격자구조를제작하였고, 검사점은한개의격자의중앙지점으로정하였다. 대상지역내의격자구조는 29 29 로제작하였으며검사점의총수는 841 개를선정하였다. Fig. 5 는선정된검사점및격자구조를나타낸것이다. 각검사점은개별분류작업을시행하여정확도분석에필요한값을입력하였으며검사점의분류항목과 SVM 분류결과를비교하여정확하게분류된값과오류가발생한값을계산하여각지점에대한정확도분석을하였다. 분석시검사점은픽셀혹은격자형태의값이아닌포인트값으로분류항목의중첩에대한오류를최소화하고자하였다. Fig. 6 은각커널함수에따른분류항목별정확도를나타낸그래프이다. 각분류항목별로정확도를분석한결과임야에대한정확도는 Sigmoid 커널함수를제외한다른커널함수에대해서 90% 정도의정확도를나타냈으며그중에서도 RBF 함수가가장높은정확도를나타내었다. 하천의경우하천에형성된사주와일부하천지역에대한오류가발생하여비교적낮은정확도인 60% 를나타내었다. 그러나사주가존재하지않는인공적수계인연못등에서는 Sigmoid 커널함수를제외하고는분류가하천에비해비교적정확하게이루어진것을확인할수있었다. Sigmoid 커널함수의경우그림자영역에대한정확도가 100% 가나왔지만실제적인분류결과물을확인하였을때는그림자영역에대한과도한영역분리 (over-fitting) 로인하여발생된결과물이었다. 그림자영역의경우차후보정작업등에관한연구를통하여보완가능할것이라고사료된다. 한국지형공간정보학회지
24 강남이ㆍ고신영ㆍ조기성 Figure 6. The class of kernel function 도로와건물은도심지의특성상복잡하고세세하게혼합되어있어일부구별이불가능한경우가발생되었다. 이에도로의경우는가장높은정확도는 65.152% 였으며건물은 74.051% 였다. 다음 Table 5 는결과에따른 kappa 계수를나타낸것으로 Sigmoid 함수를제외한모든커널함수에서 0.6 이상의양호한결과를얻을수있었다. 각커널함수별전체정확도를계산한결과는다음 Table 6 와같다. Sigmoid 커널함수의경우 50% 대의분류정확도를나타내고있어영상분류결과물에대한신뢰도가떨어짐을확인할수있었다. 그외의커널함수는약 70% 정도의정확도를나타내었다. 각분류항목별정확도및전체정확도에서가장높은분류정확도를나타낸커널함수는다음 Table 7 과같다. Polynomial 커널함수의경우전반적으로모든분류항목에대해높은정확도를나타내고있었으며임야의경우 RBF 가약 93% 정도의가장높은정확도를나타내고있었다. 그밖에도심지의가장큰특성인밀 Table 5. The kappa coefficient of kernel function Liner Polynomial 1 Polynomial 2 Kappa 0.612 0.660 0.620 Polynomial 3 Polynomial 4 Polynomial 5 Kappa 0.622 0.652 0.652 Polynomial 6 Polynomial 7 Polynomial 8 Kappa 0.640 0.688 0.654 Polynomial 9 Polynomial 10 Polynomial 11 Kappa 0.670 0.670 0.668 RBF Sigmoid 1 Sigmoid 2 Kappa 0.634 0.453 0.390 Table 6. The total of kernel function Liner Polynomial 1 Polynomial 2 70.749% 74.316% 71.225% Polynomial 3 Polynomial 4 Polynomial 5 71.225% 73.603% 73.603% Polynomial 6 Polynomial 7 Polynomial 8 72.533% 76.338% 73.722% Polynomial 9 Polynomial 10 Polynomial 11 75.030% 74.911% 74.911% RBF Sigmoid 1 Sigmoid 2 71.700% 58.859% 53.627% Table 7. The class maximum of kernel function Class Kernel Function Accuracy Forest RBF 93.289% River Polynomial 2 65.789% Road Polynomial 9 65.152% Bar Polynomial 7, 10 83.333% Land Polynomial 1 73.134% Building Polynomial 1 74.051% Shadow Sigmoid 2 (over-fitting) 100% Polynomial 7 76.338% 집되어있는도로와건물의경우 Polynomial 커널함수가다른커널함수에비해우위의결과를나타냄을확인할수있었다. 제 21 권제 2 호 2013 년 6 월
KOMPSAT-2 영상의토지피복분류에적합한 SVM 커널함수비교연구 25 4. 결론 본연구에서는도심지인대전광역시를대상지역으로 KOMPSAT-2 영상을다양한커널함수의 SVM 분류기법을적용하여토지피복분류를실시한결과다음과같은결론을얻을수있었다. SVM 분류적용결과로부터각커널함수의분류항목별면적을확인할수있었으며, 대상지역영상내균등하게분포된검사점을선정하여토지피복분류결과에대한정확도를분석함으로서분류항목에따른대상지역의적합한 SVM 커널함수및매개변수를도출할수있었다. 대상지인대전지역의영상에서의전체정확도는 Polynomial 커널함수에 degree 매개변수 4, bias 매개변수 5 를적용한결과약 76% 로서가장높은정확도를나타냈다. 분류항목별정확도에서는 Polynomial, RBF 커널함수가전반적으로높은정확도를보임을확인할수있었다. 결과에대한명확한결론을위하여향후대상지역에대한다른시기의위성영상의분석을통한분석이실시하여커널함수및매개변수에관한추가적인분석이필요하다고사료된다. 또한다른분류항목에비해임야지역은뚜렷한분광특성을나타내고있어전체적으로약 90% 이상의높은정확도를나타내고있다. 따라서향후본연구로부터얻어진토지피복결과를임야도에적용한다면효과적일것으로사료된다. References 1. Carl Staelin, 2003, Parameter selection for SVMs, Hewlett-Packard Company. 2. Chang, Q., Chen, Q., Wang, X., 2005, Scaling gaussian RBF kernel width to improve SVM classification, ICNN&B 05` International Conference, Vol. 1. 3. Chi, M., Feng, R., Bruzzone, L., 2008, Classification of hyperspectral remote-sensing data with primal SVM for small-sized training dataset problem, Advances in Space Research, Vol. 41, No. 11, pp. 1793 1799. 4. Choi, Jae Wan, Byun, Young Gi, Kim, Yong Il, Yu, Ki Yun, 2006, Support vector machine classification of hyperspectral image using spectral similarity kernel, The Korean Society for Spatial Information system, Vol. 14, No. 4, pp. 71-77. 5. Foody, G.M., Mathur, A., 2004, A relative evaluation of multi-class image classification by SVMs, IEEE Transactions on Geoscience and Remote Sensing, Vol. 42, No. 6, pp. 1335 1343. 6. Han, Seung Hee, 2010, Spatial Information engineering, Goomi Book. 7. Kang, Nam Yi, Pak, Jung Gi, Cho, Gi Sung, Yeu, Yeon, 2012, An analysis of land cover classification methods using IKONOS satellite image, The Korean Society for Spatial Information system, Vol. 20, No. 3, pp. 65-70. 8. Kim, Gi Sung, 2003, Classification using support vector machine, Thesis, Inha University. 9. Kim, Hyo Mi, 2002, Classification of multi-class micro array gene expression data using SVM, Thesis, Yonsei University. 10. Lee, Chang Seok, 2011, Adult image detection based on the skin region distribution using SVM, Thesis, Hanbat National University. 11. Lee, Min Hoon, 2006, Study on classification of object and non-object images based on the color and texture significance, Thesis, Kumoh national Institute of Technology. 12. Muller, K., Mika, S., Ratisch, G., Tsuda, K., Scholkopf, B., 2001, An introduction to kernel-based learning algorithms, IEEE Transactions On Neural Networks, Vol. 12, NO. 2. 13. Prasad, S.V.S., Satya Savitri, T., Murali Krishna, I.V., 2011, Classification of multispectral satellite images using clustering with SVM classifier, International Journal of Computer Applications, Vol.35, No. 5, pp. 32-44. 14. Richards, John A., 1994, Remote sensing digital image analysis : An introduction, second, Revised and Enlarged Edition, pp.229-262, Springer-Verlag. 15. Schölkopf, Bernhard., Smola, Alexander J., 2002, Leaning with kernels, The MIT Press, London. 16. Schowengerdt, R., 1983, Techniques of image processing and classification in remote sensing, 1st Ed, pp. 1-58, Academic Press. 17. Vapnik, Vladimir N., 1995, The nature of statical learning theory, Springer-Verlag, NewYork. 한국지형공간정보학회지