3 주성분분석 3.1 주성분분석이란? 주성분분석이란서로연관이있는변수들이관측되었을때, 이변수들이가지고있는정보들을최대한확보하는적은수의새로운변수들을생성하는방법입니다. 즉, 서로연관이있는변수들에대하여주요한관심사중의하나는이변수들이가지고있는변이를측정하는것입니다. 변이란이변수들이가지고있는정보의양이라고할수있는데, 주성분분석에서는원래의변수들이가지고있는변이의양을가장많이확보하는순서대로변수들의성형결합을이용하여새로운변수를구하는과정입니다. 주성분분석은자양한변수들에대해분석하는소위다변량분석인데, 많은변수들로부터몇개의주성분들을추출하는방법입니다. 즉, 주성분분석은차원축소를위한것입니다. 여기서주성분이라는것은많은변수들을설명하는주된관점에서는변수들의변동을설명하는것입니다. 이를간단히요약하자면변수정보를축약한변수를주성분변수라하고원변수를축약할수있는지알아보는것을주성분분석이라합니다. 주성분분석의목적은공분산행렬의구조를파악하여다변량자료를분석하는탐색적자료분석이고다차원의자료를소수몇개의주성분으로축약또는요약하는것이며구해진주성분을통해원래변수들을식별하고해석하는것입니다. 또처음몇개주성분을원래자료에대한정규성을검토하고이상값을발견하는것이며구해진주성분점수는추가적인통계분석의입력자료로활용되는것입니다. 변수들이전체분산대부분을소수의주성분을통하여설명하는것이주목적이라할수있습니다. 주성분개수의결정은상관행렬의고유값이 1 이상이되는고유값의개수나고유값에의한누적설명비율이일정한값이상에도달할때의고유값개수또고유값의상대적크기가급격히작아지는고유값번호를기준으로결정합니다. 이러한주성분분석으로인자분석에서인자공간의차원결정을할수있고, 회귀분석에서독립변수들사이에존재할수있는심각한다중선성문제를해결할수있으며다변량자료를그래프로표시하게되어쉽게이상치를발견할수있습니다 3.2 주성분분석결과주성분변수는선형결합에의해서생성되고모든값들이다표현될수없기때문에고유치중에서 1이넘는값을선택하거나 80% 가넘는것을선택하여야한다. 두가지중에서고유치가 1이넘는것을선택하여주성분1, 주성분2, 주성분3 이렇게 3개를선택하였습니다. 1
선형계수값이크거나선형계수값이작은것을기준으로취업현황, 직업만족도, 연령층 취업현황이라이름을지었습니다. 그이유로첫번째로주성분 1 인취업현황은취업률, 실업률, 여성취업률, 청년실업률을보았을때취업률이높을때와여성취업률이양의값 으로높을때취업현황은좋다고판단할수있고실업률과청년실업률이음의값으로 낮을때에는반대로취업현황은나쁘다고판단할수있기에취업현황이라이름지었습니 다. 두번째로주성분 2 인직업만족도는실업률, 노동시간, 안정성을보았을때노동시 간이음의값으로적을때그회사의만족도는늪을것이라판단되고안정성이높을때 에도직업의만족도는높을것이라판단되었습니다. 반대로실업률이높을수록기존의 노동자들의자리를위협받지않기에만족도가좋을것이라판단되었습니다. 세번째로 주성분 3 인연령층취업현황은고령자의취업류, 청년층의실업률임금을보았을때고 령자의취업률과청년층의실업률은연령별취업현황을말해주고있고나머지임금값 은가장작은값이지만연령층취업현황과연관성을찾지못했기에추후분류할예정입 니다. 임금값외에높은값인고령자의취업률, 청년층의실업률이주성분변수를잘설 명할수있기에결론적으로이름을연령층취업현황이라지었습니다. 취업률 실업률 고령자취업률 임금 노동시간 알바 안정성 여취업률 < 표 3.1 > 직업분야주성분분석결과 직업연령층취업현황만족도취업현황 0.42 0.14 0.17-0.35 0.32 0.28 0.34-0.05 0.35 0.22 0.29-0.59-0.25-0.55-0.15 0.33 0.17-0.27-0.25 0.50-0.16 0.37 0.25 0.29 청년실업소득세금고유치변동비율 -0.35 0.32 0.36 0.22-0.20 0.30 4.84 1.57 1.06 48.35 15.68 10.65 2
주성분분석을실시하고고유치중에서 1이넘는것만을선택하여주성분1, 주성분2, 주성분3, 주성분4으로 4개를선택하였습니다선형계수의값이크거나작은값을기준으로학업성취도, 교육여건, 교육지출, 교육급여량이라이름을지었습니다. 첫번째로주성분1인학업성취도는문해율과학업점수, 교사 1인당학생수를보았을때학업에대한성취정도가높게되면학업점수는높을것이고글을알고있는문해율도증가하게될것입니다. 이러한학업성취를높이기위해교사 1인당학생수가적을수록소수의인원으로학업에더열중할수있을거라판단되어학업성취도라고이름을지었습니다. 두번째로주성분2인교육여건은교사1인당학생수와 GDP대비공교육비지출, 신문수를보면교사 1인당학생수가적을수록소수의인원에게교사가더집중하여가르칠수있기에교육여건은좋다고볼수있고우리나라에서공교육비지출이많을수록더좋은환경에서공부할수있으며신문수가많을수록정치적이슈등의정보를더손쉽게얻어학업에도움이되는환경이라생각되기에교육여건이라이름지었습니다. 세번째로주성분3인교육지출은기본교육급여, 고등취학률, 초등학생 1인당공교육비를보았을때기본교육급여와초등학생 1인당연간공교육비가많을수록교육에대한개인의지출이높다고판단할수있고고등취학률은연관성을찾지못하여추후분류할예정입니다. 고등취학률외의기본교육급여, 초등학생1인당공교육비의값이높은값이므로주성분변수를잘설명한다고판단되었기에교육지출이라이름지었습니다. 네번째로주성분4인교육급여량은기본교육급여, 문해율, GDP 대비공교육비지출을봤을때기본교육급여와 GDP대비공교육비지출이높을수록양의값으로나타날때교육급여량이늘어난다고판단했고문해율은교육급여량과의관계성을찾지못하여추후분류할예정입니다. 문해률이외의높은값인기본교육급여와 GDP대비공교육비지출이주성분변수를잘설명한다는의미이기에교육급여량이라이름지었습니다. < 표 3.2 > 교육분야주성분분석결과 학업성취도교육여건교육지출교육급여량 기본교육급여삼차졸업률문해율고등취학률 -0.25 0.20 0.42 0.52 0.38 0.33 0.16 0.27 0.40-0.06 0.04-0.42 0.38 0.02-0.31 0.31 3
학업점수 교사 1 학생 교육기간 초등학생 1 인 연간공교육비 공교육비지출 GDP 신문수 고유치 변동비율 0.44 0.11-0.03-0.21-0.28 0.51-0.27 0.00 0.33 0.07-0.03 0.21 0.13 0.27 0.75-0.24 0.28-0.30 0.07 0.49 0.10 0.64-0.26-0.01 3.85 1.80 1.17 1.08 38.48 17.97 11.73 10.79 3.3 OECD 국가특성분석 2 4
( 그림 1) 연령층취업현황과취업현황의산점도 연령층취업현황과취업현황의산점도를그려본결과국가별로크고작음이나타났습니다. 먼저터키는취업현황이가장작은값으로나타났는데이는조사에따르면터키의여성취업률이다른나라들에비해현저히떨어져있고취업을위해많은사람들이대학에진학하고그인원들이한꺼번에취업에뛰어들기에취업현황이낮다고볼수있습니다. 이탈리아와벨기에는연령층취업현황이낮게나타났는데이탈리아의경우남녀차별의정통이아직남아있고남녀차별의전통이남아있는나라는자연스럽게취업률이낮아진다는조사에따라서낮은수치를나타난것으로보이고벨기에의경우는주로지식집약적산업분야에서만고용창출이이루어져취업률이낮게나타나는것을알수있습니다. 스위스와네덜란드의경우는두나라모두학비와같은국가의지원이많아취업률이높게나타났습니다. 노르웨이의경우는여러명문학교등의질높은교육등으로높은취업현황을나타내는것으로알수있습니다. ( 그림 2) 직업만족도와취업현황의산점도 5
직업만족도와취업현황의산점도를그려본결과크고작음이나타났습니다. 터키의경우취업현황이가장작은값으로나타났는데이는조사에따르면터키의여성취업률이다른나라들에비해현저히떨어져있고취업을위해많은사람들이대학에진학하고그인원들이한꺼번에취업에뛰어들기에취업현황이낮다고볼수있습니다. 멕시코와한국의경우일하는시간이많고직업의안정성이떨어져잦은직장의움직임을보이기에직업만족도가가장낮은값으로나타났습니다. 네덜란드, 스위스, 노르웨이의경우취업현황이높게나타났는데이는네덜란드와스위스는높은국가지원으로인한취업률이상승되었고노르웨이는질높은교육으로인해취업률이높은수치를가지기에높은취업현황을나타내는것을알수있습니다. 스페인, 아일랜드독일이직업만족도나타났는데조사결과기업의지원이많아직업의복지수준이높은값으로나타났기에높은직업만족도를갖는것으로판단됩니다. ( 그림 3) 교육여건과학업성취도의산점도 6
교육여건와학업성취도의산점도를그려본결과크고작음이나타났습니다. 터키의경우학업성취도가가장낮게나타나는데이는교육의질의큰편차가있는터키가극소수만이높은질의교육을받고있기에학업성취도가가장낮은것으로나타났습니다. 멕시코와한국의경우에는교육여건이가장낮게나타났는데멕시코의경우교육개혁반대운동으로교사노조의과격시위들이발생하고있고이는교육여건이가장낮은값을나타내는데기여한다고볼수있고한국의경우서울의비싼학원이나고액과외등으로소수만이누릴수있는혜택이므로낮은값을나타낸다고볼수있습니다. 네덜란드스위스노르웨이의경우학업성취도가높게나타났는데학업성취도국제비교연구에서높은순위를기록하여학업성취도가높다고판단됩니다. 스페인, 아일랜드의경우교육여건이높은수준으로나타났는데두국가의대학들을예로들자면개개인의능력향상을위한맞춤형프로그램이다양하고전문적으로구성되어있기에교육여건이높은것으로판단됩니다. ( 그림 4) 교육급여량과교육지출의산점도 7
교육급여량과교육지출의산점도를드려본결과높고낮음이나타났습니다. 스위스, 네덜란드, 벨기에, 이탈리아의경우교육지출이낮다고나타내고있는데이는공교육비의지출이높기때문에개인이교육에투여하는지출은적은것으로판단되어낮은값으로나타나고있습니다. 노르웨이의경우교육지출이가장높고교육급여량이가장낮게나타나는데이는대학들의맞춤형프로그램등여러교육의학습을위하여그만큼많은교육적지출을하고있기때문에높은교육지출을나타낸다고볼수있고많은지출이필요하지만국가에서의지원이적기때문에교육지출은높고교육급여량은낮은것으로알수있습니다. 아이슬란드의경우는교육급여량이가장높게나타났는데아이슬란드는대학까지모두국가에서지원하기때문에국가의교육급여량이높게나타났습니다. 8