농어촌지역의다양한특성을반영한유형화방법 김서영 정동명 김경미
목 차 제 1 절서론 1 1. 농어촌유형화배경 1 2. 연구목적및필요성 2 3. 연구범위와방법 4 4. 연구의한계 4 제 2절통계적분석방법 5 1. 요인분석 6 2. 군집분석 8 가. 계층적군집 9 나. 분할적방법 1 3. 군집개수선정기준 12 가. CCC 12 나. pseudo F 12 제 3 절농어촌지역유형분석 13 1. 자료와변수설명 13 2. 분석절차 14 3. 분석결과 16 가. 도시와농어촌구분 16 나. 요인분석결과 17 다. 군집분석결과 19
3 라. 군집에의한유형화결과해석 3 제 4 절결론및논의 35 < 부록 > 39 1. K-means 결과 mapping : 4개군집 39 2. 계층적군집결과 mapping : 5 개군집 4
표목차 < 표 3-1> 변수유형별변수설명 3 < 표 3-2> 도시화율에의한도시와농어촌의구분 17 < 표 3-3> 요인특성 18 < 표 3-4> 주성분방법에의한요인분석결과 19 < 표 3-5> 군집방법별 CCC와 psf 2 < 표 3-6> 군집방법별군집분포 22 < 표 3-7> 군집1에할당된 91개지역들의각요인구간별분포 24 < 표 3-8> 군집2에할당된 31개지역들의각요인구간별분포 25 < 표 3-9> 군집3에할당된 39개지역들의각요인구간별분포 25 < 표 3-1> 군집4에할당된 5개지역들의각요인구간별분포 26 < 표 3-11> 군집1에할당된 194개지역들의각요인구간별분포 28 < 표 3-12> 군집2에할당된 43개지역들의각요인구간별분포 28 < 표 3-13> 군집3에할당된 483개지역들의각요인구간별분포 29 < 표 3-14> 군집4에할당된 145개지역들의각요인구간별분포 29 < 표 3-15> 군집5에할당된 48개지역들의각요인구간별분포 3 < 표 3-16> K-means에의한 4개군집별평균, 표준편차 31 < 표 3-17> 계층적방법의 5개군집별평균, 표준편차 32 < 표 3-18> K-means 군집들에대한군집특성요약 33 < 표 3-19> 계층적군집들에대한군집특성요약 34
그림목차 [ 그림 2-1] 군집방법분류도 8 [ 그림 2-2] 계층적방법의군집화과정 9 [ 그림 2-3] 비계층적방법의군집화과정 11 [ 그림 3-1] 계층적군집방법의덴드로그램 21
1 1. 농어촌유형화배경 제 1 절서론 국가적차원에서작은지역 (localities) 단위의경제 사회적성과가점점세분화되어나타나고있다. 오늘날지역 ( 또는영역 ) 은그지역만의잠재적발전경로를형성하게되면서지역간에서로다른특성을지니게되었다. 따라서정책을집행함에있어이러한지역별다양한조건들이반영되어야한다는인식이확산되고있다. 작은지역단위를겨냥한정책과관련하여한가지중요한것은각지역형태를고려하여발전전략과정책이어느정도수행가능한지의여부이다. 결과적으로이는동일지역 (homogeneous regions) 들의구조와특성에관한많은문제점들을낳게하였다 (Alasia, 24). 특히 WTO 체제하에서농산물시장이개방되고전통적인농업보호정책이축소됨에따라농업선진국가들의농정이분야 (sector) 별관점에서지역 (territory) 별관점으로바뀌어가고있다 ( 임석회, 25). 우리나라는 FTA 체결등으로인해농어업및농어촌을둘러싼환경이크게변하고있는상황에서농수산정책또한농어업과관련하여많은변화를꾀하고있다. 최근농수산정책이농어업구조개선에서농어업또는농어촌종합정책으로전환되면서이를뒷받침하기위한새로운농어촌지표개발에대한필요성이증대되고있다. 현행농어업관련통계는농어가및작물생산중심의통계로서농어업및농어가의실태를파악하는데유용하게활용되고있다. 그러나이러한통계들은복합적이고다양한농어촌지역의실태를파악하는데는다소부족하다는것이사용자와농어촌전문가들의일반적인견해이다. 물론농촌의생활환경적측면을반영한통계로서농촌진흥청에서작성되고있는농촌생활지표가있다. 그러나이또한전국평균적인도시 농촌지표만을제공하고있어다양한농어촌의특성을파악하는데는여전히한계가있다는지적이다. 예컨대
2 농어촌으로통칭되는읍면지역들은도시접근성, 자연 지리적환경및타산업발달정도등여러요인들에의해복합적인속성을지니기때문에지금과같이획일적인속성에의해농어촌을이해하는것은바람직한현상이라할수없다. 이처럼농어촌으로통칭되는지역들이사실상지역별로다양한특성을지니고있음에도불구하고, 행정구역에의한도시 농촌구분과같은단순구분만으로는실질적농업정책입안및실행등탄력적운영면에서비효율적인측면이있다. 따라서농어촌의지표별격차와추이를다양하게파악하고, 지역사회발전을위한정부정책이보다효과적으로실현될수있도록하기위해서일률적으로적용되었던농어촌을세분화하고, 이세분화된유형별로농어촌특성을반영하는지표를제공할필요성이제기되고있다. 2. 연구목적및필요성 다른나라의경우대규모적차원에서는동일한특성을가진영역이라하더라도동일지역내의다양한특성을반영하고정책지향적인정보를제공하기위해대규모형태의지역을보다세분화된몇개의유형으로구분하여탄력적으로운용하고있다. 우리나의농어촌지역은현재행적구역단위에의해통상읍면지역을농어촌으로구분하고있다. 그러나실제읍면지역은단순한농어촌의특성이외에도복합적인특성을지니고있기때문에행정구역에의한도시 농어촌의 2분법적구분만으로는다양한정책수립및집행상의한계에직면하고있는것이현실이다. 따라서사회기반시설이취약하다거나고령인구증가등취약한농어촌지역에대한각종정책이보다효율적으로구현되기위해서는다양한농어촌의특성을반영할수있는농어촌구분하여, 이를바탕으로세분화된유형별로필요한통계를작성하여제공할필요성이제기되고있다. 각국가별로농어촌을세분화하는방법은다양하다. 미국은경제적, 정책적관점에서 6개또는 7개범주로미국전역을카운티단위로나누고있다 ( 통계청, 27). 프랑스는깐똥 (canton) 1) 을기준으로비도시지역
3 의공간변화추이및지역별차이를평가하여취약지역들과발전지역들에관해서세분화를수행하였다. 캐나다는농촌의정의및지역유형분류는 OECD의정의및분류체계를적용하여기초행정단위에서인구밀도가 당 15명이하인지역을농촌으로규정하고, 캐나다통계구역인 CD(Census Division: 주정부와자치시의중간정도 ) 수준에서도시와농촌지역비율에따라유형화하고있다 ( 통계청, 27). 한편, 농촌을유사한특성을갖는세부단위로유형화하는작업은농어촌전문가들에게있어서중요한관심사이며지금까지많은연구들이있었다. 많은연구에서지역의다양한특성을파악하기위해통계적기법이자주활용되었다 ( 이원섭,23; 임석회,25; 성주인과송미령, 23). 그러나이처럼다변량통계분석기법을활용하여지역을세부유형으로분류할경우, 분석에사용된변수와분석기법선택에따라유형화결과가달라질수있기때문에매우신중해야함을미리언급해둔다. 이런이유에서인지국가통계기관에서이러한통계적분석기법에의해농어촌을유형화한사례는아직까지없다. 단, 캐나다통계청의경우, OECD기준에따라농어촌을몇개의유형으로분류한후, 이들유형들의속성을파악하기위해통계적요인분석 (factor analysis) 결과를통계청내부자료로활용한바있다 (Alasia,24). 최근통계청에서도전국농어촌지역에대해서보다작은지역단위의통계를제공할목적으로농어촌유형화에착수하였다. 현재우리나라의경우농어촌유형화에대한특정한기준이마련되어있지않기때문에다양한전문가의의견과경험적기술과통계적방법을통해농어촌유형화를시도하였다. 그과정에서유형화분석에사용된통계적절차에대한과학적진단이필요하게되었다. 따라서본연구의주요목적은다변량통계분석방법을활용하여전국농어촌지역을몇개의작은단위로세분화하는데있다. 본연구는연구목적달성을위해통계적분석기법을적용하는데있어서핵심적으로고려되어야할점들을체계적으로설명하는데초점을둔다. 특히, 농어촌을유형화하는다양한방 1) 프랑스행정구역의일종으로프랑스전역에서 4, 개정도이며 departement 의지방의회선거시에만선거단위로서주로활용됨. 깐똥의평균인구는 13,998 명 ( 언제기준 ) 이며 commune 과 departement 의중간규모를지니고있음
4 법가운데통계적방법론에관해서중점적으로검토하고방법론의특성을설명함으로써실무적용에도움을주고자하는것이본연구의최종목적이라하겠다. 3. 연구범위와방법 본연구의주요내용은통계적방법을통하여우리나라전국적으로분포되어있는농어촌에대해서다양한농어촌의특성을반영할수있는몇개의유형으로세분화하는것이다. 따라서본연구는농어촌유형화를위한방법론적인측면에서접근하되, 세분화결과에의한농어촌특성을규명하고해석하는것은고려대상으로삼지않았다. 또한본유형화결과는실무자의판단에도움을주기위한연구자개인의판단에의한것으로서통계청의의견과는무관함을미리밝혀두고자한다. 농어촌지역의유형화대상지역은 25년행정구역구분에의한전국 3,573개동읍면으로, 이들의지역적다양한특성을고려하기위해인구, 가구, 지역, 산업및생활여건부문에서통계청조사를통해얻을수있는변수범위내에서모두 52개변수를고려하였다. 52개관련변수들은전문가의견및통계적분석결과를토대로농어촌유형에깊은연관성이있을것으로판단되는 2개변수를최종분석변수로사용하였다. 분석방법은 1차적으로전국 3,573개동읍면에대해서 2년도시화율을기준으로도시와농촌으로구분하고, 이구분에의한농어촌지역을다시통계적군집방법에의해몇개의농어촌지역단위로세분화하였다. 즉, 본연구는주어진자료에기반한탐색적연구로그범위를제한하고자한다. 4. 연구의한계 본연구는크게두가지측면에서근본적인한계를지니고있다. 첫째는우리나라행정구역단위인동읍면과같이매우작은지역단위를사용하여전국의농어촌지역을유형화한다는것이다. 일반적으로지역유형을세분화하는작업은분석의공간단위가작을수록더욱정밀하기
5 는하지만, 분석자료의획득이어렵다는특징이있다. 둘째는분석에사용될변수가상당히제한적이라는것이다. 통계적방법을이용하여보다작은단위로세분화하는데있어서가장중요한것은분석에유용한변수를선정하는것이다. 통계적방법에의한유형화작업의경우, 유형화목적에가장부합되는변수가사용되었을때, 그결과에대한신뢰를확보할수있다. 결국이는통계분석을통한지역의유형화는변수선정과밀접한관련이있음을나타낸다. 그러나본연구는통계청조사를통해얻어지는변수를활용해야한다는측면에서통계청조사외의변수가지니는농어촌의특성은반영하기어렵다는제약이있다. 특히, 농어촌의경제적특성을파악할만한변수가사용되지않았다는점은매우아쉬운점중의하나라할수있다. 제 2 절통계적분석방법 본장에서는연구에사용된자료와분석방법을설명하였다. 목적은이연구에사용된분석적논리와통계적개념을명확히하는데있다. 요인분석과군집분석과같은다변량통계분석 (multivariate statistical analysis) 에관한보다자세한내용은 Donald(25) 등을참고할수있다. 연구의접근방법은농어촌의기능적관계보다는지형적 (territorial) 단위의특성과관련하여유사한지역으로구분하는데있다. 즉, 유형화의넓은의미는보다넓은시각에서인구 사회적지표와통계분석의탐색적속성을활용하자는것이다. 접근방법에대해서는다음절에서간략하게설명하였다. 먼저, 이연구에서강조하는것은행정구역상동읍면들의인구 사회적수행능력을비교하는데있다. 이것은분석결과가받아들일만한동읍면의수행능력인지아닌지에관한표준을정하지는못한다는것을의미하기도한다. 분석결과를비교 해석하는데있어서사용된지표들의범위는각지표 (indicator) 들이갖는변동범위를기초로구분한것으로사용된지표들에대해사전경계값을미리정하고있는것은아니다. 이러한의미에서보면이결과를이용한비교는읍면동단위에서만의
6 미가있을뿐, 시도등의보다넓은영역단위에서수행된분석결과와는다른결과를갖기때문에시도단위별비교에는사용될수없다. 또한통계적분석방법을적용한농어촌유형구분이라는점에서이분석결과는자료에기반한탐색적분석결과를의미한다. 따라서자료에따라또는사용된방법및정의기준에따라서약간씩차이를보일수있다. 그렇지만사전에알려진도시 농어촌간구분및다양한농어촌지역의세분화에대한정의가어려운상황에서통계적접근에의한유형화시도가향후지역특성을반영한세분화연구에많은도움이될것으로기대한다. 1. 요인분석 요인분석은크게두가지목적에서사용되고있다. 하나는관측가능한변수로부터관측가능한변수들의변동을설명할수있는소수의관측불가능한잠재적변수 ( 요인 ) 를찾는것이다. 다른하나는서로상관관계가높은관측가능한변수들에대해서서로독립적인잠재변수를찾고자하는데있다. 경우에따라서는상관관계가높은변수들이분석변수로적당하지않은때가있다. 대표적인예가회귀분석에서설명변수들끼리상관관계가높을때발생하는다중공선성 (multicolinearity) 문제를들수있다. 이런경우에요인분석을통해서로독립적인요인들을찾은후, 이를회귀분석의설명변수로활용함으로써다중공선성의문제를극복할수있다. 그렇다하더라도원변수의정보는사용된요인에그대로함축되어있기때문에분석하는데는지장이없다. 요인모형에서관측변수들은각요인들과어느정도의상관성을유지해야한다. 통계적절차는서로강한상관관계를갖는변수그룹과그렇지않은그룹들로나누는방법이다. 이러한일반적수리적모형은다중회귀방정식 (multiple regression) 과유사하다. 각변수는요인들의선형결합으로표현될수있고, 이때요인들은관측불가능한것으로구체적인식은다음과같다.
7 여기서, 는 번째관측 ( 우리의경우 읍면 ) 에대한 번째변수값으로표준화된값을나타낸다. 는 번째관측에대한 번째요인값으로보통요인점수 (factor score) 를나타낸다. 는 번째공통요인에대한 번째변수의표준화회귀계수 (standardized regression coefficient) 로서보통요인적재 (factor loading) 값이라부른다. 마지막으로 는변수 에대해유일한요인특성으로그변수가갖는오차를의미한다. 본연구에서사용된 2개변수를, 라하면요인모형은다음과같다. 이때요인점수, score는평균, 분산 1이되도록표준화되었고, 그값의범위는약 -3에서 +3의값을갖는다. 따라서요인점수는요인이라는잠재적변수의상대적능력을나타내고, 요인과연관된관측변수들의행위 (behavior) 를보여준다. 요인적재값 는관측변수와요인간의밀접한관계정도를설명하다. 변수들은모두표준화되었기때문에요인적재값은각요인에할당된가중치 (weight) 가어느정도인가를나타낸다. 특히, 본연구에서는요인분석방법으로주성분방법을사용하였다. 주성분방법에의해요인적재값을계산할경우, 요인적재값은요인과변수간의상관성을나타내고, 요인적재값의절대값이클수록더밀접한상관관계를갖는다. 요인개수를선정하는방법은요인분석에서계산되는고유값 (eigenvalue) 을이용할수있다. 개의관측변수들의상관계수행렬로부터 개의고유값이얻어지는데크기순서대로 라고하면 가된다. 즉, 가장작은고유값 은정수 1 기준으로아주큰값이고, 가장작은 는 에가까운아주작은값을취한다, 이때 1보다큰고유값의개수 ( ) 만큼의요인들을선정하면이요인들을이용하여전체 개의변수가지니는변수들의정보를설명하는데큰문제가되지않는다는원리이다. 또한편으론추출된요인들은전체자료들의 만큼의정보를유지하는데이비율이.7이
8 상이되면통계분석하는데크게문제가되지않는다고볼수있다. 물론.7은이론적근거보다는통계전문가들의경험적근거에의한것이고, 분야에따라서는다른기준을적용할수도있다. 본연구에서는고유값 1 기준에의해 1보다큰요인의개수를선정하였다. 2. 군집분석 통계적군집방법은넓게는 [ 그림 2.1] 과같이계층적방법 (hierarchical clustering) 과분할적방법 (partitioning clustering) 으로분류되고있다. 계층적방법은다시병합적방법 (bottom-up) 과분리적방법 (top-down) 으로나눈다. 병합적방법에는최단연결법, 최장연결법, 워드 (ward) 방법등다양한방법이있고, 분리적방법에는 Diana 방법등이있다. 분할적방법에는 K-means, Pam(partitioning around medoids), Fuzzy 방법등이있다. [ 그림 2.1] 군집방법분류도 군집방법 계층적 분할적 - 병합적 - 분리적 K-means, PAM 이중에서상용패키지 (SAS, SPSS 등 ) 를통해서통상적으로널리활용되고있는방법은계층적방법으로병합적방법, 분할적방법으로 K-means를들수있다. 본연구에서도방법의상용성과사용자의용이성측면에서 ward 방법에의한계층적방법과 K-means에의한분할적방법을사용하였다. 각방법들은군집을할당하는방법에있어서구조적으로군집알고리즘이다르기때문에방법에따라다른결과를제시
9 하고있다. 따라서어떤방법이획일적으로좋다고단언할수있는문제는아니고, 주어진자료의성격이나연구목적및연구자의사전경험에따라군집방법이선택될수있다. 그렇다고무작정선택하는것은아니고각방법에대한충분한검토와장단점이파악된후분석에사용될자료에가장적합하다고판단되는방법을선택하는것이바람직하다하겠다. 가. 계층적군집 계층적군집방법중 ward 방법을사용하였다. 계층적군집방법은아래의그림의덴드로그램과같이단계적으로군집을형성해가는방법이다. [ 그림 2.2] 계층적방법의군집화과정 비유사성 개체 ( 읍면동 ) ward 방법은계층적군집방법가운데가장보편적으로사용되는방법중하나이다. 자료의구조가특별한경우가아니라면 ward 방법은안정적인군집결과를주는것으로알려져있다. 위그림에서와같이 ward 방법은각개체를병합하는단계에서잔차제곱합 (Error Sum of Squares) 의증분을최소화하도록군집들을병합시키는방법이다. 이때개체들간의거리는유클리드 (euclid) 거리를사용하였다. 예를들어 번째군집내의잔차제곱합을 라하면, 그식은아래와같이표현된다.
1, 여기서 는개체수, 는변수를나타낸다. 그러면전체 c 개군집에 대한잔차제곱합은 과같다. 군집이병합될때마다잔차제곱합은증가하며 ward 방법에서두군집 과 가병합될때에잔차제곱합의증분은다음과같이두군집사이의거리를나타낸다. 군집간거리 ward방법을포함한계층적군집방법은개체를군집에할당함에있어서반복계산을하지않기때문에한번임의의군집에할당된개체는다음단계에서바뀌지않고고정된다는단점이있다. 또한일반적인계층적군집방법의경우, 단계별로개체또는군집을병합하는과정에서개체수가작은군집들을병합하는경향이있기때문에개체수가비슷한군집을상위단계의군집으로병합하는과정에서강한편의가발생할수있다. 또한개체간또는군집간거리정보를이용하여군집을병합하기때문에이상치 (outlier) 에민감하다는특성을지니고있다 (Milligan 198). 나. 분할적방법 분할적방법은비계층적방법으로서단계적방법에의해군집을형성하지않는다. 즉계층적방법과같이덴드로그램을작성하지않는다. 분할적방법에서는보통개체들을몇개의군집으로나누기위해주어진판정기준을최적화하는최적분리기법을사용한다. 분할적방법에서는보통군집의개수와군집의반경을사전에미리정하고다음과같이군집을형성한다. 먼저초기군집의군집중심값에의해초기군집을만
11 들고, 각개체를군집중심으로부터가까운군집에할당한다. 그다음각군집의일부또는전부를판정기준에의해재할당하는방법을사용한다. 개체들간의거리는유클리드거리를사용한다. 초기군집은관측값들을기초로군집의중심을선택하고, 각개체를중심이가까운군집으로할당한다 [ 그림 2.3]. [ 그림 2.3] 비계층적방법의군집화과정 Group A Group B 1 2 3 (1, 2) 가 (1, 3) 보다더유사 초기군집의개체를재할당하는방법은각군집의중심을다시계산하고, 군집내제곱합 (within sum of squares) 이최소가되도록각개체를가까운중심으로재할당한다. 이러한재할당에의한변화가적어서군집이안정될때까지이과정을반복한다. 재할당기준인군집내제곱합 는다음과같다. K-means방법은 1개이상의개체수가많은경우의군집분석에유리한반면에개체수가작을경우에는오히려개체들의순서에매우민감하게작용하는단점을지니고있다. 또한사전의군집의개수가미리정해져야하고, 최종군집결과는초기군집중심설정에상당히의존하는경향이있다.
12 3. 군집개수선정기준 군집개수선정은 CCC(Cubic Clustering Criteria; Sarle,1983) 와 pseudo F(Milligan and Cooper, 1985) 값을사용하였다. 이방법은 SAS 패키지의 'proc cluster' 와 'proc fastclust' 를통해쉽게구할수있다. 가. CCC CCC는자료가균등분포 (uniform distribution) 를따른다는가정하에서이자료들의기대분포와군집들의편향정도를비교하는측도이다. 여기서 은 의기댓값, 는관측된결정계수, K는분산안정화변환 (Sarle, 1983) 을나타낸다. CCC가양의큰값을가질때보다좋은군집결과를나타낸다. 더큰값의 CCC는군집이 1개인균등분포와해당군집개수일때군집간분리가더큰차이를보인다는것을의미한다. 보통 CCC는 CCC>2이면서국소최대값 (local maximum value) 을취할때의군집의개수를선택한다. 그러나 CCC는군집분석에사용된변수들간에강한상관관계가있을때에는부정확할수있기때문에사용하는데주의해야한다. 나. pseudo-f pseudo F(psF) 는군집의밀집정도를측정하는통계량으로서, 군집간분산과군집내분산의비를사용한다 (Milligan and Cooper, 1983). psf는다음과같이계산된다.
13 여기서, 는군집개수, 는결정계수루서군집간분산을의미하고, 은총개체수를나타낸다. 이때 psf 값이클수록좋은군집결과를나타낸다. 제 3 절농어촌지역유형분석 1. 자료와변수설명 본연구는우리나라 25년행정구역구분에의한전국 3,573 동읍면을지역유형화의대상으로하였다. 농어촌지역유형화에필요한변수를총 57개변수를고려하여, 최종적으로 2개변수를분석대상으로하였다. 2개변수에대한설명은 < 표3.1> 과같다. < 표 3.1> 변수유형별변수설명 변수명 변수설명 인구인구밀도읍면동별인구 ( 명 )/ 읍면동별면적 ( ) 노령화지수 ( 읍면동별 65 세이상인구 /~14 세인구 )*1 연평균인구증가율 ((25 년 /2 년 )1/5-1)*1 농림어업인구비율 읍면동별농림어업인구 / 읍면동별총인구 가구농가율읍면동별농가수 / 읍면동별총가구수 전업농가율 읍면동별전업농가수 / 읍면동별농가수 2 종겸업농가율읍면동별 2 종겸업농가수 / 읍면동별농가수 어가율 전업어가율 읍면동별어가수 / 읍면동별총가구수 읍면동별전업어가수 / 읍면동별총가구수 2 종겸업어가율읍면동별 2 종겸업어가수 / 읍면동별어가수
14 < 표 3.1> 변수유형별변수설명 ( 계속 ) 변수명 변수설명 지형 평야지대비율 산간지역비율 해안지역비율 해당지역읍면동별기초단위구수 / 읍면동별기초단위구수합계 산업 섬지역비율제조업종사자수비율도소매 음식숙박업종사자수비율 읍면동별해당업종종사자수 / 읍면동별전산업종사자수 생활수세식화장실수비율읍면동별수세식화장실수 / 화장실수합계 여건아파트수비율읍면동별아파트수 / 읍면동별전체주택수 노후주택비율 전작가구수비율 읍면동별노후주택수 / 읍면동별전체주택수 읍면동별전작가구수 / 읍면동별총가구수 2. 분석절차 전국 3,573 동읍면지역을대상으로먼저도시와농어촌을구분하였다. 이들중에서농어촌으로분류된지역에대해유사한농어촌특성을갖는몇개의농어촌지역으로유형화하였다. 분석절차를설명하면다음과같다. Step1. 25년행정구역단위를기준으로 3,573 전국동읍면에대해서우선도시와농촌을구분하였다. 이때구분변수로 2년기준도시화율 2) 을사용하였다. K-means 군집방법에의해 2개의군집 2) GIS도시화율이란, 해당지역전체인구에서도시화지역인구가차지하는비율로서해당지역 ( 도시화지역인구 / 해당지역전체인구 ) 1. - 도시화지역 : 동읍면내기초단위구가 1인구밀도 3,명 / 이상 2 지목기준도시
15 으로나누고읍면지역이많이포함된그룹을농어촌지역그룹이라하였다. 이때농어촌그룹에서 동 에해당되는지역은따로구분하여농어촌에준하는그룹으로명명하고, 유사한개념으로도시그룹에포함된읍면지역또한준도시적성격을지닌그룹으로명명한다. 이렇게해서최종적으로 1,3개의읍면지역을순수농어촌지역으로구분하고이를다음단계의분석대상으로하였다. Step2. 분석에사용된변수는 2단계에걸쳐선정하였다. 1차적으로원래총 52개변수에대해서전문가와실무담당자의의견을반영하여 25개를선정하였다. 이 25개변수를 Step1에서선정된 13개분석대상에대해서요인분석을수행한후, 각변수간상관관계와각변수의요인들에대한통계적기여도 ( 공통성.5이상 ) 를고려하여농어촌지역을세분화하는데중요도가높을것으로예상되는 2개변수를최종적으로선정하였다. Step3. 선정된 2개변수는서로상관관계가높은변수들로써변수간에서로중복된정보를포함하고있다. 따라서 2개의변수정보를최대한활용하되, 서로중복된정보활용을피하기위해요인분석을수행하여서로독립된새로운변수를구성하였다. 요인분석결과에의해고유값 1 기준으로총 5개의요인을선택하고, 이를추후군집분석의입력변수로활용하였다. Step4. Step3의 5개요인에대해 1,3개읍면지역을대상으로군집분석을수행하였다. K-means 와계층적방법을적용하여각각 4개와 5개의군집을최종군집개수로정하고, 각방법에의한군집결 토지이용면적비율이 5% 이상중최소한어느하나를충족시키면서공간상에서인접한기초단위구들에둘러싸인구역을포함하되총인구가 3, 명이상인지역을말한다. - 기초단위구란지도상에준항구적인지형지물 ( 도로, 하천, 산능선등과같이변화가적고식별이확실한인공물또는자연물 ) 을이용하여구획한최소단위구역을말한다 ( 단, 뚜렷한지형지물이없는경우는통 / 리경계를보조적으로활용한다 )
16 과를비교하였다. 군집선정기준은 CCC와 pseudo F값을사용하였다. Step5. 마지막으로, 군집결과는각군집에대한요인점수의구간별분포 (7개구간 ) 와 2개변수의평균을이용하여군집의특성을설명하고자하였다. 또한각군집에포함된지역을 mapping 하여 2 차적으로분류된결과에대한타당성을확인하였다. 위의 Step1 에서 Step5 까지의절차를요약하면 [ 그림 3.1] 과같다. [ 그림 3.1] 농어촌유형화를위한분석과정 도 / 농구분 농촌지역대상요인분석 군집분석 결과해석 - 도시화율변수 -Kmeans 이용 (k=2) 대상선정 -13 읍면지역 -2 개최종변수 사용변수 -5 개요인 - kmeans 방법 군집특성파악 - 요인점수구간별분포 / 평균 변수선정방법 - 요인분석 - 경험적 / 전문가 군집개수선정 - CCC -pseudo F 실무적차원검증필요 3. 분석결과 가. 도시와농어촌구분 25년기준행정구역단위 3,573 동읍면지역에대해서도시와농어촌두그룹으로분류하기위해군집의수를 2로하여 K-means 군집방법을수행하였다. 2년도시화율변수를사용하여분석한결과가 < 표 3.2> 과같다. < 표 3.2> 에서두그룹을구분짓는도시화율의경계값은농어촌지역그룹은최대값.4861이고, 도시지역그룹은최소값.498
17 이다. 도시화율경계값에의해 2분법적도시 농어촌을적용하면 1,432 개농어촌과 2141 도시지역으로구분된다. 그러나 2분법적도시와농어촌구분은다양한지역적특성을반영하기어렵다는실무자와전문가의견을반영하여 4분법적구분에의한도시 농어촌구분법을적용하였다. < 표 1> 에의하면농어촌지역 1,432개중에서읍면지역은 1,3개, 행정구역상도시로분류되어진 동 은 132개이다. 도시지역으로분류된 2,141개동읍면지역가운데 동 은 2,31개이고, 읍면 은 11개로나타났다. 따라서농어촌지역의 1,3개읍면을 순수농어촌 과 132개동을 준농어촌 이라편의상명명한다. 도시지역도마찬가지로 11개읍면을 도시적농어촌, 231개동을 순수도시 라명명한다. 4분법구분에의한 1,3개읍면지역인 순수농어촌 ( 이하농어촌 ) 을농어촌유형의분석대상으로하였다. < 표 3.2> 도시화율에의한도시와농어촌의구분 2분법적구분 4분법적구분 지역분포 도시화율최소값최대값 농어촌지역 순수농어촌 읍 119 면 1181.4861 준농어촌 동 132 총 1432 도시지역 도시적농어촌 읍 91.498 1 면 19 순수도시 동 231 총 2141 나. 요인분석결과 요인분석변수로서농어촌유형분석대상이되는 52개변수를우선적으로고려하였다. 이중에서실무적특성과또는농어촌지역분석연구자들의의견을반영하여 35개의변수를 1차적으로선정하고, 이를통계적요인분석에의해요인추출을위한영향력정도를고려하여최종
18 2개변수를선정하였다. 요인분석에서는초기공통성 (community) 이약.5이상이면서요인적재값이.5이상인변수를대상으로하였다. 2개변수에대해서주성분 (principal component) 방법에의한요인분석을수행하고, 베리맥스 (varimax) 회전하여고유값 1 기준에의해요인 5개를최종선정하였다. 요인 5개는전체분산에대해약 72.4% 의설명력을갖는다. 이 72.4% 의의미는요인분석에사용된 2변수들의 72.4% 가 5개의요인에의해설명되어진다는것이다. 5개요인은주어진자료를에대한결과는 < 표 3.4> 와같다. < 표 3.4> 는요인적재값의절대값이각요인별로.5이상인경우만나타내었다. 요인명은각요인들에강하게연관된변수들을기초로명명되어지게된다. 따라서요인에명명된요인명은다소주관성이개입될수는있지만, 그요인명은각요인에강하게연관되어진원변수들의특성을반영하는경향이있다. 5개요인명은다음과같다. < 표 3.3> 요인특성 요인요인 1 요인 2 요인 3 요인 4 요인 5 요인특성고령전업농촌해안겸업농어촌섬중심전업어촌산간전작농어촌도소매숙박업종사자비율이높은지역 일반적으로요인은해석상측면에서보면, 개념적으로일치해야하고, 의미있고적절한특성을나타낼수있어야한다. 각요인은몇개의변수와매우강한연관성을갖고있지만여전히나머지변수들에대해서도상당한효과를포함하고있다. 이러한변수들의결합때문에어떤요인들은설명되어지는변수들이바람직하든그렇지않든또는국소적특성이거나지시적이라는점에서진단에더많이도움을주게되고, 다른요인들은설명되어지는변수들이강한함축성을갖지않는다는의미에서더탐색적인경향이있다.
19 < 표 3.4> 주성분방법에의한요인분석결과 변수 요인1 요인2 요인3 요인4 요인5 농리어업인구비율.91 농가율.89 노령화지수.81 노후주택율.66 2종겸업농가율 -.64 연평균증가율 -.68 수세식화장실비율 -.72 인구밀도 -.73 아파트수비율 -.81 해안지역비율.83 2종겸업어가율.76 어가율.7.65 전업농가율.52 -.56 섬지역.9 전업어가율.79 산간지역.81 전작생산가구비율.54 평야지대비율 -.83 도소매숙박업종사자수비율.87 제조업종사자비율 -.85 고유값 5.78 2.54 2.47 1.99 1.69 총분산비율 (%) 3.4 19.2 1.7 6.6 5.5 다. 군집분석결과 계층적방법과 K-means 방법에의해군집분석을수행하고두결과를비교하였다. 군집분석에서가장우선적으로결정되어야할것은군집의개수이다. 군집의개수가결정되어지면, 각개체는군집중심에가까운군집으로할당되게된다. 각군집방법에따른 CCC와 psf값은 < 표
2 3.5> 과같다. K-means 방법은 CCC와 psf의큰값기준에의해군집수를 4개로선정하였다. 계층적방법은 CCC기준으로 5개, psf로 5개또는 6개가가능하다. 계층적방법의 psf값을값을보면, 군집수가 5일때는 3, 6일때는 39로그증가폭이그다지크지않다. 따라서분석에사용된변수가제한적이라는점을고려하여가능하면적은수의군집수를선택하는방법을사용하였다. 최종적으로 K-means는 4개, 계층적방법은 5개를최종군집개수로선정하였다. < 표 3.5> 군집방법별 CCC와 psf, 군집방법 군집수 CCC psf K-means 2-11.279 162.3 3 2.347 25. 4 7.54 283.7 5-15.377 196.85 6-5.195 253. 계층적 2 3.2 25. 3 3.24 255. 4 7.68 284. 5 8.83 3. 6 7.83 39. [ 그림 3.1] 은계층적방법에의해각개체간또는군집간의병합과정을보여주는덴드로그램이다. [ 그림 3.1] 에서 x축은개체 ( 지역 ), y축은해당군집수에대해결정계수값을나타낸다. 일반적으로군집개수를정하는데있어서덴드로그램을참고하는경우가많다. 덴드그램에의존하여군집개수를정하는것은매우시각적이고주관적일수있기때문에사용에있어서주의를기울일필요가있다. 그렇지만덴드로그램은군집형성에대한탐색적기능을한다는점에서군집의개수를정하는데좋은참고가될수있다. 본자료의경우계층적방법에의해군집
21 개수를 5개로정할때아래의점선의형태로구분지울수있으며각그룹에할당되는개체들의규모를예측할수있다. [ 그림 3.1] 계층적군집방법의덴드로그램 K-means와계층적방법에의한군집별개체분포는 < 표 3.6> 와같다. < 표 3.6> 에서군집1부터군집5라는군집명자체는군집방법과는무관하고, 단지군집의개수가 4개또는 5개로나뉘었다는것만을의미할뿐이다. 각군집의특성을고려한작명과관련한내용은뒤에서설명하기로한다. K-means는군집개수가 4개로전체 1,3읍면지역중 91개 (7%) 지역이군집1 에할당되었다. 즉, 91개지역은서로유사한특성을지닌지역들로이군집에할당된농어촌지역들은 5개요인에대해서매우유사한특성을갖는다는것을볼수있다. 군집수를 5개를사용한계층적방법은군집개수가 4개인 K-means 보다는한군집에집중되는양상은나타나지않았다. K-means와계층적방법은군집을형성하는알고리
22 즘자체가다르기때문에군집의분포만으로군집결과에대해직접적인비교는할수없다. 군집수또는군집방법선택에있어서의타당성문제는추후다양한검증작업을거쳐판단하는것이바람직할것이다. < 표 3.6> 군집방법별군집분포 지역개수 (%) 군집방법군집 1 군집 2 군집 3 군집 4 군집 5 K-means, c=4 91(7.) 31(23.2) 39(3.) 5(3.8) - 계층적, c=5 194(14.9) 43(33.1) 483(37.2) 145(11.1) 48(3.7) 군집명은각군집에포함된지역들의특성을반영할수있어야한다. 또한이러한명명작업은자료분석결과를토대로농어촌전문가들의전문적지식을바탕으로이루어져야한다. 그럼에도불구하고본연구는통계적해석에초점을두었기때문에농어촌전문가들의의견은반영하지않기로한다. 가장일반적인접근방법은분석에사용된변수와군집간의연관성정도를고려할수있다. 게다가각군집별로원변수들의정보 ( 평균을포함한기초통계 ) 를이용하는것도군집의특성을파악하는데도움이될수있다. 이연구에서는 2개의원변수들을 5개의요인으로축약하여분석에사용하였기때문에우선적으로이요인들과군집에속한개체들과의관련성을파악하고, 원변수들의평균을추가적으로해석해보았다. 이를위해 5개의요인점수 ( 양적변수 ) 를 7개의범주를갖는구간으로변환하였다. 이때요인점수는평균, 분산 1이되도록표준화되었기때문에약 +3과 -3사이의값을취한다. 이때요인점수를표준화하는이유는요인별상대적비교를할수있다는장점이있기때문이다. 또한요인점수를범주화하는특별한기준은없다. 다만, 양적자료인요인점수를세분화시킴으로써요인점수구간별농어촌지역의분포를파악하고자하였다. 이때, 7개구간 3) 에대한근거는경험적판단에따르되, 7개보다 3) 구간범위 : 구간 1-3, -3< 구간 2-2, -2< 구간 3-1, -1< 구간 4, < 구간 5 1, 1< 구
23 더많으면구간화의의미가상쇄될수있고, 더작은경우구간별분포를파악하는데한계가있다는점을고려하였다. 구간번호가클수록요인점수가높다. < 표 3.7> 에서 < 표 3.1> 는 K-means 군집결과를 4개군집별로각요인구간에해당하는지역분포를나타낸것이다. 군집1: 이군집에속한지역들의 63.63% 가요인 1인고령전업농촌의특성을강하게반영함과동시에산간전작요인과도소매숙박종사자요인을골고루지녔다. 반면에해안겸업관련요인과섬전어업요인에대해서는전체지역중약 71.54% 와 75.38% 가요인점수구간 4에분포되어이두요인의성격은대체로낮게반영되었음을알수있다. 군집2: 대부분의지역들은도소매숙박종사자특성이강한요인에대해서는요인점수구간에고루분포하면서나머지요인들의특성에대해서는대부분낮은구간에분포되어있다. 따라서이군집은농어촌의특성이약한지역들이포함되었을가능성이높다. 군집3: 군집 3에속한지역들의 1% 가섬지역전어업요인에대해가장높은요인구간에속하면서고령전업농촌요인과산간전작농촌및도소매숙박종사요인의특성에대해서 5% 이상지역이 5이상구간에분포되었다. 따라서이군집은어업을주로하는섬지역특성과농촌과도소매음식숙박업이다소발달되어있는지역들의특성을반영한다고볼수있다. 군집4: 이군집에속한 1% 지역이요인 2인해안겸업요인에대해요인점수구간 7에포함되었고, 대부분은지역들은고령전업농촌요인과도소매숙박종사요인에대해서요인구간 5이상에 간 6 2, 구간 7>2
24 속하였다. 반면에섬전어업요인과산간전작요인에대해서는이군집에속한지역들의 5% 이상이낮은요인구간 ( 구간4이하 ) 에포함되었다. 이에군집4 는해안지역특성이강하고농업과어업을겸하는지역으로서도소매음식숙박업등서비스업이발달된지역특성을가졌다고볼수있다. 그러나요인구간별분포만에의해서군집의특성을규명하는것은정확성측면에서신뢰성이축소될가능성이있기때문에이를보완하기위해각군집별로분석에사용된 2개변수들의평균값 ( 표준편차 ) 를살펴보았다. < 표 3.7> 군집 1 에할당된 91 개지역들의각요인구간별분포 요인점수구간 1 2 3 4 5 6 7 요인 1 189 579 139 3 고령전업 (2.77) (63.63) (15.27) (.33) 요인 2 19 651 187 45 8 해안겸업 (2.9) (71.54) (2.55) (4.95) (.88) 요인 3 1 686 213 1 9 섬전어업 (.11) (75.38) (23.41) (.11) (.99) 요인 4 13 176 283 257 156 25 산간전작 (1.43) (19.34) (31.1) (28.24) (17.14) (2.75) 요인 5 35 11 286 385 89 5 도소매숙박 (3.85) (8.46) (31.43) (42.31) (9.78) (.55)
25 < 표 3.8> 군집 2 에할당된 31 개지역들의각요인구간별분포 요인점수구간 1 2 3 4 5 6 7 요인 1 15 44 142 1 고령전업 (4.98) (14.62) (47.18) (33.22) 요인 2 5 214 64 18 해안겸업 (1.66) (71.1) (21.26) (5.98) 요인 3 1 215 82 3 섬전어업 (.33) (71.43) (27.24) (1.) 요인 4 25 141 9 38 7 산간전작 (8.31) (46.84) (29.9) (12.62) (2.33) 요인 5 8 62 66 85 65 15 도소매숙박 (2.66) (2.6) (21.93) (28.24) (21.59) (4.98) < 군집 3.9> 군집 3 에할당된 39 개지역들의각요인구간별분포 요인점수구간 1 2 3 4 5 6 7 요인 1 1 15 2 3 고령전업 (2.56) (38.46) (51.28) (7.69) 요인 2 7 12 11 5 4 해안겸업 (17.95) (3.77) (28.21) (12.82) (1.26) 요인 3 39 섬전어업 (1) 요인 4 7 24 8 산간전작 (17.95) (61.54) (2.51) 요인 5 3 11 22 3 도소매숙박 (7.69) (28.21) (56.41) (7.69)
26 < 표 3.1> 군집 4 에할당된 5 개지역들의각요인구간별분포 요인1 고령전업요인2 해안겸업요인3 섬전어업요인4 산간전작요인5 도소매숙박 요인점수구간 1 2 3 4 5 6 7 16 33 1 (32.) (66.) (2.) 5 (1) 2 31 12 4 1 (4.) (62.) (24.) (8.) (2.) 6 25 17 2 (12.) (5.) (34.) (4.) 2 6 7 22 1 3 (4.) (12.) (14.) (44.) (2.) (6.) < 표 3.11> 에서 < 표 3.15> 는계층적법에의한 5개군집결과를나타낸다. 군집1: 군집1에할당된 194개지역은 5개요인모두에대해서대체로낮은요인점수구간에대부분의지역들이분포되어있다. 따라서군집1 은일반적인농어업의특성을반영하고있지않은지역으로비농어업적지역특성을반영한다고볼수있다. 군집2: 군집2에할당된 43개지역은고령전업농촌요인과도소매음식숙박업종사비율이높은요인에대해서는 5% 이상의지역들이요인점수가높은구간에속하는반면, 해안겸업과섬전어업요인에대해서는대부분의지역들이구간4 인낮은구간에분포되어있다. 따라서이지역은산촌과어촌의특성을보이지않는전형적인평야지대를많이포함하는고령농촌의특성을반영하는경향이있다. 군집3: 군집3에할당된 483개지역은고령전업농촌요인과산간전작요인에대해서 7% 이상지역들이요인점수구간5에포함되
27 었다. 반면에해안겸업과섬전어업요인에대해서는각각 7% 또는 8% 이상이구간 4이하에포함되면서이요인들의특성을낮게반영하고있다. 도소매음식숙박업종사비율이높은요인에대해서는전구간에걸쳐지역들이골고루분포되어있다. 따라서이군집은전형적인산간지역을포함한전형적인농촌의특성을반영하는경향이있다. 군집4: 군집4에할당된 145개지역은해안겸업요인에대해약 8% 지역들이요인점수구간 6과 7에속하면서이요인의특성을매우높게반영하고, 또한고령전업농촌과도소매숙박종사요인의특성도어느정도반영되어있다. 반면에섬전어업과산간전작요인에대해서는낮은요인점수구간에많은지역들이분포함으로써이요인들의특성은대체로낮게반영하고있다. 이군집은해안지역중심으로농업과어업을겸하거나도소매음식숙박업등이발달한지역일가능성이높다. 군집5: 군집5에할당된 48개지역은섬전어업요인에대해서 1% 에해당하는지역들이요인점수구간 7에포함되어있고, 나머지요인들의특성도어느정도는반영하고있는것으로나타났다. 따라서이군집은섬지역으로농업과어업및서비스업등이발달한지역들이포함되었을가능성이있다.
28 < 표 3.11> 군집 1 에할당된 194 개지역들의각요인구간별분포 요인점수구간 1 2 3 4 5 6 7 요인 1 14 3 46 47 55 2 고령전업 (7.22) (15.46) (23.71) (24.23) (28.35) (1.3) 요인 2 1 134 56 3 해안겸업 (.52) (69.7) (28.87) (1.55) 요인 3 14 54 섬전어업 (72.16) (27.84) 요인 4 12 118 56 8 산간전작 (6.19) (6.82) (28.87) (4.12) 요인 5 29 11 52 3 도소매숙박 (14.95) (56.7) (26.8) (1.55) < 표 3.12> 군집 2 에할당된 43 개지역들의각요인구간별분포 요인점수구간 1 2 3 4 5 6 7 요인 1 1 13 8 9 24 42 고령전업 (.23) (3.2) (18.6) (2.93) (47.44) (9.77) 요인 2 4 385 41 해안겸업 (.93) (89.53) (9.53) 요인 3 284 146 섬전어업 (66.5) (33.95) 요인 4 12 164 195 43 13 3 산간전작 (2.79) (38.14) (45.35) (1.) (3.2) (.7) 요인 5 3 15 26 3 1 도소매숙박 (6.25) (31.25) (54.17) (6.25) (2.8)
29 < 표 3.13> 군집 4 에할당된 483 개지역들의각요인구간별분포 요인점수구간 1 2 3 4 5 6 7 요인 1 11 116 262 91 3 고령전업 (.) (.) (2.28) (24.2) (54.24) (18.84) (.62) 요인 2 12 344 124 3 해안겸업 (.) (.) (2.48) (71.22) (25.67) (.62) (.) 요인 3 423 6 섬전어업 (.) (.) (.) (87.58) (12.42) (.) (.) 요인 4 1 61 22 172 29 산간전작 (.) (.) (.21) (12.63) (45.55) (35.61) (6.) 요인 5 11 46 155 199 66 6 도소매숙박 (.) (2.28) (9.52) (32.9) (41.2) (13.66) (1.24) < 표 3.14> 군집 4 에할당된 145 개지역들의각요인구간별분포 요인점수구간 1 2 3 4 5 6 7 요인 1 1 5 52 83 4 고령전업 (.) (.69) (3.45) (35.86) (57.24) (2.76) (.) 요인 2 3 57 58 해안겸업 (.) (.) (.) (.) (2.69) (39.31) (4.) 요인 3 4 85 47 8 1 섬전어업 (.) (.) (2.76) (58.62) (32.41) (5.52) (.69) 요인 4 1 3 67 44 3 산간전작 (.) (.69) (2.69) (46.21) (3.34) (2.7) (.) 요인 5 4 9 15 8 28 9 도소매숙박 (.) (2.76) (6.21) (1.34) (55.17) (19.31) (6.21)
3 < 표 3.15> 군집 5 에할당된 48 개지역들의각요인구간별분포 요인1 고령전업농업요인2 해안겸업요인3 섬전업어업요인4 산간전작요인5 도소매숙박 요인점수구간 1 2 3 4 5 6 7 (.) (.) 1 (2.8) 14 (.) (.) (29.17) (.) (.) (.) (.) (.) (.) 3 (.) (.) (6.25) 15 (31.25) 28 (58.33) 4 (8.33) 14 11 5 (29.17) (22.92) (1.42) (.) (.) (.) 15 25 8 (31.25) (52.8) (16.67) 15 26 3 (31.25) (54.17) (6.25) (.) 4 (8.33) 48 (1) (.) 1 (2.8) 라. 군집에의한유형화결과해석 < 표 3.16> 과 < 표 3.17> 는각군집에포함된읍면지역들의 2개변수들에대한평균과표준편차를나타낸다. 그리고두표에서 1,3개전체지역에대한각변수별평균값을기준값으로설정하고, 각군집에서전체평균보다높으면그군집에서해당변수의특성이높게반영되는것으로판단한다. 이는변수특성에대한반영정도를측정할만한기준을정하기가어렵고, 각군집별특성이전체평균을기준으로높거나낮으면어느정도그변수의특성을반영한다고볼수있기때문이다. 또한군집별평균값수준이대체로높은경우는각군집의평균값이전체평균값과동일한수준이라도어느정도의특성을지니는것으로해석하였다. 지금까지살펴본요인과군집특성과의관계그리고분석에사용된 2개변수와군집특성과의관계를정리하면 < 표 3.18> 과 < 표 3.19> 와같다. 이들결과들은각군집의특성을명명하는데중요한정보가될수있다. 이미앞에서언급한바와같이본연구는농어촌지역유형화를위한통계적측면을다루는데초점을두었고, 정확한명명을위해서는농어촌지역연구에대한전문적지식을요하기때문에각군집에대한정확한명명은하지않을것이다.
31 < 표 3.16> K-means 에의한 4 개군집별평균, 표준편차 분석변수 인구밀도 노령화지수 연평균증가율 농림어업인구율 농가율 전업농가율 2 종겸업농가율 어가율 전업어가율 2 종겸업어가율 제조업종사자율 도소매종사자율 평야지대비율 산간지역비율 해안지역비율 섬지역비율 전체평균 ( 표준편차 ) 95.7 (121.5) 2.9 (1.7) -2.6 (2.8).5 (.2).5 (.2).7 (.2).2 (.1). (.1)...3 (.2).3 (.1).4 (.3).3 (.3).1 (.1). (.2) 수세식화장식비율.7 (.2) 아파트수비율 노후주택수비율.1 (.1).3 (.1) 전작생산가구비율.1 (.1) 군집 1 (91 개 ) 58.3 (36.7) 3.5 (1.6) -3.4 (1.5).6 (.1).6 (.1).7 (.1).1 (.1)....3 (.2).3 (.1).4 (.3).4 (.3). (.1). (.1).6 (.2)..4 (.1).1 (.1) 각군집별평균 ( 표준편차 ) 군집 2 (31 개 ) 21.4 (24.6) 1.1 (.5).1 (4.1).3 (.1).3 (.1).6 (.1).3 (.1)....3 (.3).3 (.2).3 (.2).2 (.2). (.1)..8 (.1).3 (.2).2 (.1).1 (.1) 군집 3 (39 개 ) 89.3 (55.2) 3.2 (1.6) -3.5 (2.4).6 (.1).4 (.2).4 (.2).4 (.2).3 (.2).1 (.1).1 (.1).1 (.1).3 (.2)... (.1) 1. (.1).8 (.1)..5 (.2).3 (.3) 군집 4 (5 개 ) 91. (35.4) 2.6 (.1) -3.2 (1.6).6 (.1).5 (.1).4 (.2).3 (.1).3 (.1)..1 (.1).2 (.2).4 (.2).2 (.2).1 (.1).6 (.2). (.1).8 (.1). (.1).3 (.1).1 (.1)
32 분석변수전체평균 ( 표준편차 ) 각군집별평균 ( 표준편차 ) 군집 1 (194) 군집 2 (43) 군집 3 (483) 군집 4 (145) 군집 5 (48) 인구밀도 95.7 (121.5) 226.2 (236.7) 99.9 (77.3) 42. (29.8) 91.8 (61.9) 83.7 (51.6) 노령화지수 2.9 (1.7) 1.6 (1.2) 2.8 (1.6) 3.5 (1.9) 2.7 (1.1) 3.1 (1.5) 연평균증가율 -2.6 (2.8) -.4 (4.2) -2.6 (2.8) -3.2 (1.6) -3.2 (1.8) -3.5 (2.2) 농림어업인구율.5 (.2).4 (.2).5 (.2).6 (.1).6 (.1).6 (.1) 농가율.5 (.2).4 (.2).5 (.2).6 (.1).5 (.2).4 (.2) 전업농가율.7 (.2).6 (.1).7 (.1).7 (.1).6 (.2).5 (.2) 2 종겸업농가율.2 (.1).3 (.1).2 (.1).2 (.1).2 (.1).4 (.2) 어가율. (.1)....2 (.1).3 (.2) 전업어가율......1 (.1) 2 종겸업어가율.....1 (.1).1 (.1) 제조업종사자율.3 (.2).6 (.1).2 (.2).2 (.2).2 (.2).1 (.1) 도소매종사자율.3 (.1).1 (.1).3 (.1).3 (.1).3 (.1).3 (.2) 평야지대비율.4 (.3).5 (.2).6 (.3).2 (.2).3 (.2). 산간지역비율.3 (.3).2 (.2).2 (.2).6 (.2).1 (.1). 해안지역비율.1 (.1)....4 (.2). (.1) 섬지역비율. (.2).... (.1) 1. (.1) 수세식화장식비율.7 (.2).8 (.1).7 (.2).6 (.2).8 (.1).7 (.1) 아파트수비율.1 (.1).2 (.2).1 (.1).. (.1). 노후주택수비율.3 (.1).2 (.1).3 (.1).4 (.1).3 (.1).5 (.2) 전작생산가구비율.1 (.1).1 (.1).1.1 (.1).1 (.1).3 (.2) < 표 3.17> 계층적방법의 5 개군집별평균, 표준편차
33 K-means 방법 : 4개그룹특성 / 군집군집1 군집2 요인특성 - 고령농촌형지역 - 농어촌특성미약 - 인구밀도매우낮음 - 인구밀도 / 연평균인구 - 노령지수 / 연평균인구증가율매우높음인구감소율높음 - 노령지수매우낮음 - 농림어업인구비율매우 변수특성 < 표 3.18> K-means 군집들에대한군집특성요약 높음 가구 - 농가율 / 전업농가율높음 - 2종겸업농가율높음 지형 - 평야지대율보통 - 산간지대율약간높음 - 특색없음 산업 - 제조업. 도소매보통 - 특색없음 생활 여건 - 노후주택비율높음 - 수세식 / 아파트수비율매우높음지역수 91 31 < 표 3.18> K-means 군집들에대한군집특성요약 ( 계속 ) 특성 / 군집 K-means 방법 : 4개그룹군집3 군집4 요인특성 -섬/ 어업 / 농업 / 관광 -해안/ 농어업겸업 / 관광 인구 -노령지수/ 연평균인구감소율매우높음 -연평균인구감소율매우높음 -농림어업인구비율높음 -겸업농가율/ 어가율 -전업농가율낮음가구 / 전업어가율매우높음 -겸업농가율/ 어가율높음변수 -전작가구율높음 특성 -평야/ 산간지대율낮음지형 -섬비율 1% -해안지대율매우높음 산업 -제조업종사비율낮음 -제조업낮음 -도소매숙박종사높음 생활 -수세식화장실율/ 노후여건주택비율높음 -수세식화장식율높음 지역수 39 5
34 특성 / 군집 계층적방법 : 5개그룹군집1 군집2 군집3 요인특성 -비농업적특성 -평야고령농촌 -산간형고령농촌 -인구밀도매우낮음 인구 < 표 3.19> 계층적군집들에대한군집특성요약 -인구밀도/ 인구증가 감소율낮음 - 인구밀도 약간높음 - 노령화지수 / 연평균 인구감소율매우 높음 - 농림어업인구비율 높음가구 -겸업농가율높음 -특색없음 -농가율높음변수 -평야지대율높음특성 -평야지대율약간 -산간지역비율지형 -산간/ 해안비율높음매우높음낮음 -제조업종사율매우산업 -특색없음 -특색없음높음 -수세식화장실/ 아파트 -노후주택율높음생활비율높음 -특색없음 -수세식화장실비율여건 -노후주택율낮음낮음지역수 194 43 483 특성 / 군집 계층적방법 : 5개그룹군집4 군집5 요인특성 -해안농어업겸업 / 관광 -섬 / 전어업 / 관광 -연평균인구감소율 -노령화지수/ 농림어업인구비율 인구 < 표 3.19> 계층적군집들에대한군집특성요약 ( 계속 ) 매우높음 - 농림어업인구율높음 높음 - 연평균인구감소율매우높음 -겸업농가율/ 어가율 변수가구특성 -어가율/ 겸업어가율높음 / 겸업어가율매우높음 -전작가구비율매우높음 지형 -해안지역비율매우높음 -섬비율 1% 산업 -특색없음 -제조업비율낮음 생활 여건 -수세식화장실비율높음 -노후주택비율매우높음 지역수 145 48
35 제 4 절결론및논의 지금까지전체 3,573 동읍면중심의농어촌지역을대상으로통계적기법을적용하여유사한특성을갖는소수개의농어촌그룹으로분류해보았다. 전체적인연구의흐름이나분석과정은통계학적이론측면보다는실무차원의의견을충분히반영하고자하였다. 전체 3,573 동읍면은도시화율기준에의해도시와농촌을구분하고, 최종적으로행정지역구분을고려한순수농어촌지역인 1,3 읍면을분류대상으로삼았다. 통계적분류방법으로 K-means 와계층적방법을사용하였다. 군집수결정은 CCC와 pseudo F를사용하였고, 이기준에의해 K-means와계층적방법은각각 4개와 5개를최적군집수로선택하였다. 본연구에서는유형화분석결과를토대로몇가지사실을찾을수있다. 첫째, 분석에사용된 2개변수중에서수세식화장실비율이나농림어업인구비율은농어촌구분변수로서크게의미가없어보인다. 수세식화장실비율의경우, 현재우리나라농어촌의수세식화장실비율이높기때문에농어촌구분변수로서크게변별력이없는것으로예상된다. 또한현재사용된변수는통계청에서전수조사가가능한변수로만한정했기때문에그외의농어촌유형화에필요한중요한변수들이상당부분배제되었을가능성이높다. 실제로, 농어촌의경제적수준을측정할수있는변수라든가발전정도면에서전체농어촌평균수준보다낙후된지역을구분할수있는변수들은농어촌유형구분에상당한영향력을미칠수있다. 통계학적측면에서도분석결과가사용된변수에따라다를수있다는점을감안하면변수선정이유형화에있어서얼마나중요한지를짐작할수있다. 둘째, K-means 군집에서군집은지형적요소에크게영향을받는다는것을알수있다. 4개의군집은지형적측면에서보면, 평야산간형 ( 내륙 ), 해안 ( 내륙과섬의경계 ), 섬, 그리고도시근교또는소재지인접지역형태로분류된다. 더구나 4개군집에속한지역들이매우편중되
36 어나타난다. 평야 산간지역의고령농촌형은전체 1,3개읍면지역중 7%(91개 ) 를포함하고있다. 이유형이우리나라대부분의농촌의성격을잘반영한다고짐작할수있다. [ 그림 4.1] 에서알수있듯이 K-means 군집들은지형적특성을매우강하게반영하는섬 해안과내륙형태로확실하게양분화되는경향이있다. 따라서내륙특성을강하게지닌전형적인농촌지역이라할수있는 91개군집과 31개군집에대해세분화하는것이오히려농촌유형화에유익한작업이될것이다. 이는 91개또는 31개지역을분류할수있는새로운변수선정이중요한출발점이되어야한다. 순수농촌의특성을변별할수있는포괄적인변수선정만이농촌이라는유사한특성을지닌지역들을제대로분류할수있을것이다. 셋째, 계층적방법도 K-means와마찬가지로지형적요인이 5개유형을분류하는데크게작용하였다. K-means방법과군집화방법론적측면에서다르기때문에두방법의직접적인비교는의미가없다. 단, 독자들의이해를돕기위해서굳이비교설명을한다면, [ 그림 4.2] 에나타난바와같이계층적방법의 5개군집은 K-means의 91개유형이다시재분류되는효과를갖는다고볼수있다. 전형적인농촌유형이평야지대비율이높거나농촌특성이강한유형과산간지대비율이높거나농촌특성을지닌유형으로구분된다. 그러나두유형에대한구분점이명확하지않기때문에이유형구분에대해서는신중하게검토할필요가있다. 또한해안 겸업유형으로분류된지역들도현재사용된변수정보만으로는그경계점을찾기가어렵기때문에위험한구분결과를가져올수있다는것을인지할필요가있다. 본연구에서는요인분석을통해얻어진요인들을군집변수의입력변수로사용한만큼, 유형화에유리한정보, 즉변수를선정하는것이무엇보다중요하다하겠다. 이를위해서는우선지역을유형화하는목적이명확해야하고, 전문가적또는실무적차원에서그목적에맞는타당한변수를선정할수있어야한다. 또한통계적군집방법을사용하여개체를분류할경우, 어떤분류방법을사용하느냐는전적으로연구자의몫이다. 그렇다고전혀기준이없는것은아니다. 연구목적, 자료크기, 사용할변수의특성에대한정확한이해는통계분류방법선택에중요
37 한요인이된다. 결론적으로, 연구자의판단은방법론적측면에서는우리나라농어촌지역을유형화하는데있어서 K-means방법이계층적방법보다더적합한군집결과를준다고볼수있다. 이론적측면에서도분류할개체수가많을경우에는계층적방법보다분할적방법이더유리한것으로알려져있다. 또한분석에사용된변수가다소제한적이고, 특정지표 ( 지형, 인구등 ) 에치우쳐있다는것을감안하면매우타당한결과라고판단된다. 한편, 본연구에사용된변수만을활용하여지역을더세분화하고자하는것에대해서는좀더신중할필요가있다. 우선 K-means 방법으로 4개이상의군집으로분류하는것은통계적측면에서바람직하지않다. 또한계층적방법으로세분화하고자할경우, 세분화는가능하지만주어진변수의정보가매우제한적이기때문에군집결과를해석하는데매우신중해야한다. 특히, 계층적방법은한번어떤군집으로분류가되면절대바뀔수없다는원리를사용하기때문에많은개체를분류하고자할경우상당히불리하게작용할수있다. 분석에사용된변수가지형적특성과가구특성이매우강하기때문에주어진변수로는최소한의유형화를시도하는것이바람직할것으로생각된다. 더세분화가필요할경우, 1차유형화결과를토대로 2차적으로유형화에적합한농어촌특성들을활용하여재분류하는것도하나의대안이될수있겠다. 그렇지않으면통계적방법이아닌, 농어촌유형에필요한객관적기준을마련하여몇개의유형으로구분하는것도방법이될수있을것이다. 객관적기준에의해유형을구분하고, 구분된유형은구체적속성은통계적요인분석등을통해파악하는것도좋은대안이될수있다. 마지막으로지역유형결과가국가정책의기반이되거나장기적으로활용될가능성이있다면, 농어촌유형화에사용된변수들은시간에따라가변적일수있기때문에농어촌지역유형화는최소한의시간간격을두고새로운기준에의해재분석이이루어져야할것이다. 이에본연구는유형화할대상이많고, 변수선정및통계분석방법선택기준이없는경우에좋은참고자료가될수있을것으로기대한다.
38 참고문헌 [1] Alasia, A. (24). Mapping the socio-economic diversity of rural Canada: A multivariate analysis, Agriculture and Rural Working Paper Series Working Paper No. 67. [2] Milligan, G.W. and Cooper, M.C. (1985). An examination of procedures for determining the number of clusters in a data set, Psychometrika, 5, 159-179. [3] Sarle. W.S. (1983). Cubic clustering criterion, SAS Technical Report A-18, Cary, NC: SAS Institute Inc. [4] 이원섭 (23). 국가자원의지역간차등화를위한지역유형구분방안에관한연구, 국토연구 36권, 19-35. [5] 임석회 (25). 농촌지역의유형화와특성분석, 한국지역지리학회지 11권 2호, pp. 211-232. [6] 성주인, 송미령 (23). 지역유형구분과농촌지역의유형별특성, 농촌경제 26권, 1-22. [7] 통계청 (27). 농어촌지표개발추진결과.
39 부록 1. K-means 결과 mapping : 4 개군집 군집 개수 군집특성 1( 노랑 ) 91 전형적고령농촌지역 2 31 도시근교 / 소재지인근지역또는발달된농촌지역 3 39 섬지역 / 전어업비율이높은지역 4( 갈색 ) 5 해안지역 / 겸업비율이높은지역
4 부록 2. 계층적군집결과 mapping: 5 개군집 군집 개수 군집특성 1( 노랑 ) 194 비농업특성이강한지역또는도시근교 / 소재지인근 2 43 평야지역또는고령농촌특성이강한지역 3 483 산간지대및고령농촌이강한지역 4 145 해안지역 / 겸업비율이높거나서비스업발달지역 5( 진갈 ) 48 섬지역의전어업비율이높은지역