1 - PDF 무료 다운로드

. 척도 (Scale) 척도는질적인대상을양적인대상으로전환해주는도구로써, 관찰대상을측정하기위하여대상의속성을일련의기호나숫자로나타내는것을의미한다. () 명목척도 (Nominal scale) : 명목척도는숫자자체로써크기를나타내는양적인의미는없다. 그래서관찰대상을구별하거나확인하기위하여주로사용된다. 예 ) 귀하의성별은? () 남자 (2) 여자 위의경우, 남자, 여자간숫자,2 에대한의미는없다. 숫자 2 가 보다 2 배가크다거나하지않다. 단지남자는, 여자는 2 로표기한것일뿐이다. (2) 서열척도 (Ordinal scale): 관찰대상의순서적인특성만을나타낸것으로, 관찰대상의비교우위를결정할뿐, 순서간차이는의미가없다. 예 ) 가장좋아하는음식을좋아하는순서대로세가지만적으세요..( ), 2. ( ), 3. ( ) 음식을좋아하는순서가중요한것이지, 순서간차이는별의미가없다. 마치마라톤에서 위, 2 위, 3 위결정하는데있어서,2,3 위간시간차이가중요한것이아니라, 순서가중요한것과비슷한이치이다. (3) 등간척도 (Interval scale): 관찰대상의속성에대한차이를균일한간격으로나누어서측정하는척도이다. 그래서척도간차이는같다고할수있다. 리커트척도 (Likert scale) 가이에해당한다. 예 ) 다음신상품에대하여귀하께서는어느정도만족하고계십니까? () 매우불만족한다 (2) 불만족한다 (3) 그저그렇다 (4) 만족한다 (5) 매우만족한다 만약소비자만족도조사에 5 점척도가설문지에서사용되었다면, -2 사이의간격은, 4-5 사이의간격과같아야한다. (4) 비율척도 (Ratio scale): 등간척도와같은개념이지만, 절대적인 0 을가지고있는척도이다. 그래서거리, 무게, 시간등측정에사용된다. 예 ) 귀하의나이는? ( ) 혹은귀하의수입은? ( ) 나이혹은수입의경우 0 이라는절대값이존재하게된다. 하지만위의등간척도에서 소비자만족 의경우절대값 0 이존재하지않으므로등간척도와는차별이된다. Copyright[C] by Sejong University. All right reserved 2

2. 빈도분석 (Frequency Analysis) Analyze Descriptive Statistics Frequencies 빈도분석은도수분포표혹은막대그래프를이용하여변수의분포특성을나타내는통계기법이다. 연령 Valid Missing Total 20 23 24 27 29 3 32 33 34 35 36 37 38 39 40 4 42 43 44 45 46 48 49 50 5 52 54 56 58 59 Total Sys tem Cumulative Frequency Percent Valid Percent Percent 2.0 2.0 2.0 2.0 2.0 4. 4 8.0 8.2 2.2 2.0 2.0 4.3 2 4.0 4. 8.4 3 6.0 6. 24.5 2.0 2.0 26.5 2.0 2.0 28.6 2.0 2.0 30.6 2 4.0 4. 34.7 2.0 2.0 36.7 3 6.0 6. 42.9 2 4.0 4. 46.9 2.0 2.0 49.0 2 4.0 4. 53. 2 4.0 4. 57. 2 4.0 4. 6.2 2.0 2.0 63.3 2.0 2.0 65.3 2.0 2.0 67.3 2 4.0 4. 7.4 2 4.0 4. 75.5 2 4.0 4. 79.6 2.0 2.0 8.6 4 8.0 8.2 89.8 2.0 2.0 9.8 2.0 2.0 93.9 2.0 2.0 95.9 2.0 2.0 98.0 2.0 2.0 00.0 49 98.0 00.0 2.0 50 00.0 도수분포표 위에표에서, Valid 는나이 (20~59 세 ) 를나타내며, Frequency 는나이를나타내는빈도를나타낸다. Percent 는각나이별백분율을나타내고있고, Valid Percent 는 Missing value ( 무응답, 여기서는 명 ) 를제외한나머지 ( 여기서는 49 명 ) 를유효한수로간주하여그것을기본으로나타낸백분율이고, Cumulative Percent 는각나이당누적백분율을나타낸다. Copyright[C] by Sejong University. All right reserved 3

히스토그램 (histogram) 2 연령 0 8 6 Frequency 4 2 0 20.0 30.0 40.0 50.0 60.0 25.0 35.0 45.0 55.0 연령 Std. Dev = 0.0 Mean = 39.7 N = 49.00 위의그림은도수분포표에나타난연령을막대그래프로나타낸것으로전체응답자 (N = 49) 는 49 명이고, 평균 (Mean) 은 39.7 이고, 표준편차는 (Std. Dev) 0.0 세이다. 여기에서곡선은정규곡선이다. 일반적으로기술통계에서아래의 Descriptive Analysis 에서는디폴트로최소값 (minimum), 최대값 (maximum), 평균 (mean), 표준편차 (standard deviation), 합계 (sum) 나타나지만 Frequency analysis 의통계량 option 에서는해당하는값을산출할수있다. 그리고여기에서는 Descriptive Analysis 에서는산출이불가능한사분위수및백분위수을산출가능하다. Copyright[C] by Sejong University. All right reserved 4

3. 기술통계분석 (Descriptive Analysis) Analyze Descriptive Statistics Descriptives 기술통계분석은빈도분석에서볼수있는통계량뿐만아니라, 기타다른여러가지통계량을쉽게나타내어준다. 기술통계분석결과표 Des criptive Statis tics 연령 Valid N (listwise) N Range Minimum Maximu Mean Std. Variance Skewness Kurtosis Statis tic Statis tic Statis tic Statis tic Statis tic Statis tic Statis tic Statis tic Std. Error Statis tic Std. Error 49 39 20 59 39.69 0.0 02.092 -.055.340 -.84.668 49 위의표에서는, 빈도분석에서보여주었던, 전체응답자 (N = 49), 평균 (39.69), 표준편차 (0.0) 이외에도, 나이의최대값 (Maximum), 최소값 (Minimum), 분산 (Variance), 왜도 (Skewness), 첨도 (Kurtosis) 등다양한통계량을제공하고있다. 왜도 (Skewness): 왜도는분포의치우침을나타내는것으로, 오른쪽꼬리분포는 + 값을, 왼쪽꼬리분포는 값을보인다.( 대칭분포의왜도 =0) 첨도 (Kurtosis): 첨도는평균값을중심으로어느정도밀집 ( 뾰족하거나무딘형태 ) 되어있는지를보여준다. 뾰족한형태일수록 +, 그반대는 이다.( 표준정규분포의첨도 =0). 또한여기에서는표준화된 Z 값을저장할수있다. Copyright[C] by Sejong University. All right reserved 5

3. 카이스퀘어 ( 교차분석 ) Analyze Descriptive Statistics Crosstabs Option: Statistics Chi-square Cells Row, Column, Total 독립변수 : 명목, 서열척도, 종속변수 : 명목, 서열척도 카이스퀘어검정은두변수가상호독립적인지아니면관련성 (association) 이있는지여부를알아보는방법이다. 사용되는척도는모두명목척도이거나서열척도이며, 등간이나비율척도는변수값의가지수가몇안되거나코딩변경 (recoding) 을통한그룹화한변수로이용가능하다. 교차분석은독립성검정 (Test of Independent) 과동질성검정 (Test of Homogeneity) 로구분하고있으나여기에서는독립성검정으로함께취급한다. 귀무가설 (H0) : 두변수는서로독립적이다. 대립가설 (H) : 두변수는연관성이있다. 혹은한변수값에따라다른변수값의패턴이다르다. 로설정된다. 즉, 귀무가설이사실이라면관측빈도와기대빈도가대부분이비슷하게예측되는것을의미한다 예를들어서학력과담당업무에대해서로연관이있는지없는지를알아보기위하여다음과같은분석을실시하였다. ( 표는다음페이지 ) Copyright[C] by Sejong University. All right reserved 6

학력 * 담당업무교차표 학력 전체 고졸이하전문대졸 4년재대졸대학원졸이상 빈도기대빈도학력의 % 담당업무의 % 전체 % 빈도기대빈도학력의 % 담당업무의 % 전체 % 빈도기대빈도학력의 % 담당업무의 % 전체 % 빈도기대빈도학력의 % 담당업무의 % 전체 % 빈도기대빈도학력의 % 담당업무의 % 전체 % 담당업무 강의 행정관리 프로그램개발 전체 0 4 0 4.4 3.0.6 4.0.0% 00.0%.0% 00.0%.0% 0.8%.0% 8.0%.0% 8.0%.0% 8.0% 0 3 0 3.3 2.2.5 3.0.0% 00.0%.0% 00.0%.0% 8.%.0% 6.0%.0% 6.0%.0% 6.0% 0 6 4 20 2.0 4.8 3.2 20.0.0% 80.0% 20.0% 00.0%.0% 43.2% 50.0% 40.0%.0% 32.0% 8.0% 40.0% 5 4 4 23 2.3 7.0 3.7 23.0 2.7% 60.9% 7.4% 00.0% 00.0% 37.8% 50.0% 46.0% 0.0% 28.0% 8.0% 46.0% 5 37 8 50 5.0 37.0 8.0 50.0 0.0% 74.0% 6.0% 00.0% 00.0% 00.0% 00.0% 00.0% 0.0% 74.0% 6.0% 00.0% 각셀당통계수치는위에서부터순서대로빈도수, 행 %, 열 %, 전체 % 순으로수치를나타내고있다. 예로써, 대학원졸이상이면서행정관리인응답자는 4 명으로, 대학원졸업이상의학력자 23 명중 4 명이되어 60.9% 이고, 행정관리직 37 명중 4 명이되어 37.8% 가된다. Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases Chi-Square Tests Asymp. Sig. Value df (2-sided) 8.490 a 6.204.458 6.075.289.59 50 a. 0 cells (83.3%) have expected count less than 5. The minimum expected count is.30. 위의표에서보여주듯이 Pearson Chi-Square 값이 8.490 이고자유도가 6 일때, Sig (P) = 0.204 <0.05 이므로유의수준 5% 에서유의하지않으므로학력과담당업무가상호독립적이라는귀무가설이채택된다. 다시말해서, 위의연구에서는학력과담당연구간관련성이없다고말할수있다. 따라서위의예를보면측정빈도와기대빈도가각셀마다유사함을알수있다. Copyright[C] by Sejong University. All right reserved 7

5. 표본평균의검정 (T-test) () 단일모집단평균검증 Analyze Compare means One-Sample T-test 독립변수 : 명목척도, 종속변수 : 등간, 비율척도 표본평균의검증은일정한기준을바탕으로평균에대한가설을채택할것인지아니면기각을판단하는절차이다. 우선표본평균의가설검정은단일모집단평균검증과두모집단평균차이검증으로나누어진다. Test value 란에기준치입력 단일모집단평균검증은하나의모집단에서추출된표본에대해서검정하는방법으로써아래와같은예를들수있다. 일반적으로한국성인남성의몸무게가 70 kg 이되는것으로알려져있다. 이를바탕으로서울시내의성인남성의평균몸무게가 70kg 이라고할수있는지알아보기위하여서울시내에거주하는성인남성 50 명을대상으로몸무게를측정하였다. 그렇다면과연이결과로써서울시내성인남성의평균몸무게가 70kg 이라고말할수있는가? One-Sample Statistics 몸무게 Std. Error N Mean Std. Deviation Mean 50 7.6600 9.4752.3400 위의표는샘플크기, 평균, 표준편차, 표준오차에대한값을보여주고있다. One-Sample Test 몸무게 Test Value = 70 95% Confidence Interval of the Mean Difference t df Sig. (2-tailed) Difference Lower Upper.239 49.22.6600 -.0328 4.3528 위의결과로보아서, Sig. (2-tailed) = 0.22 > 0.05 이므로귀무가설이채택된다. 다시말해서응답자의평균몸무게는 70 이라고할수있다. 또한귀무가설의수치인 70kg 과표본평균간의차이는.660 이되겠다. 95% 신뢰구간을보더라도신뢰구간인.0328 ~ 4.3528 이 0 을포함하므로귀무가설이채택된것이다. Copyright[C] by Sejong University. All right reserved 8

(2) 두모집단의평균차이검증 Analyze Compare means Independent-Samples T test 기본가정두모집단의분포는각각정규분포를따른다는가정하에서분석을하며소표본인경우는반드시모집단의정규성을검토한후정규분포를만족하지못하는경우는독립표본 t 검정을이용할수없으며이경우는비모수검정중 Mann-Whitney U test 를통하여분석가능하다. 그러나대표본 ( 일반적으로 n>30) 인경우는모집단의분포에관계없이적용가능하다. 두모집단의평균차이검증은말그대로하나의모집단이아니다른두모집단의평균에대한차이를검증하는방법으로써, 가장보편적으로많이사용되는기법이기도하다. 예를들자면아래와같다. 초등학교영재들을대상으로새롭게두가지교육방법이개발되었다. 두가지방법중어느방법이더효과가있는지알아보기위하여초등학교영재학생 40 명을무작위로 20명씩두그룹으로나누어서각각 A 방법과 B 방법으로나누어교육을시작하였다. 새교육방법으로학생들을교육한후, 학생들의시험성적결과를측정하였다. 시험성적결과를바탕으로새로이개발된 A, B 방법은학생들간시험성적차이를만들었다고할수있는가? ( 단두그룹에무작위로나뉘어진학생들의기본능력은동일하다고가정한다 ) Gr ou p S ta tis tics 시험결과 학생그룹.00 2.00 Std. Error N Mean Std. Deviation Mean 20 79.000 7.9532.7784 20 68.500 9.2978 2.079 Independent Samples Test 시험결과 Equal variances assumed Equal variances not assumed Levene's Test for Equality of Variances t-test for Equality of Means 95% Confidence Interval of the Mean Std. Error Difference F Sig. t df Sig. (2-tailed) Difference Difference Lower Upper.35.557 4.002 38.000 0.9500 2.7359 5.45 6.4885 4.002 37.09.000 0.9500 2.7359 5.407 6.4929 위의표를바탕으로, 두모집단평균차이검증에서는두모집단의분산이같다는가정하에 t-test 를실시한다. 두모집단의분산의동질성가정을위해 Levene s test 를사용한다. 이때 F=.35, P (Sig) =0.557)>0.005 이므로두모집단의분산이동일하다는가정을한다. 또한분산이같다는가정하에 (Equal variances assumed ) t-value 가 4.002 이고, P (Sig, 2-tailed) = 0.000 < 0.005 으로나타나귀무가설 ( 두방법에차이가없다 ) 은기각된다. 다시말해서두가지교육방법에는차이가있다라고말할수있다. A 그룹과 B 그룹의평균차이는 0.95 이며통계적으로차이가있고, 신뢰구간이 0 을포함하지않고있다 ( 귀무가설기각 ). Copyright[C] by Sejong University. All right reserved 9

(3) 동일모집단으로부터두표본 Analyze Compare means Paired-Sample T test 이기법은위의두모집단의평균차이검증기법과비슷하나, 표본들의값들이짝을이루고있고, 이러한짝 (Pair) 들에대한비교를하는경우가있다. 단, 이러한짝들은서로독립적이지않으면반드시하나의모집단에서나온것이다. 즉, 동일집단에서다른변수나동일한변수를여러번 ( 일반적으로실험효과를보기위한사전, 사후검사 ) 측정한것을이용한다. 이경우는두변수의데이터에상관관계가존재하기때문에평균을비교하기위해서독립표본 t 검정을이용할수없다. 마찬가지로모집단이정규본포를따른다는가정하에서분석을하기때문에소표본이거나정규본포를따르지않는경우는비모수검정인윌콕슨 (Wilcoxon) 의부호순위검정이나부호 (sign) 검정을이용하여분석한다. 예를들면아래와같다. 어느회사에서개발한다이어트신약이환자들에게효과가있는지알아보기위해서 20 여명의지원자를선발하였다. 20 여명의지원자를대상으로다이어트신약을사용하였고, 사용전과사용후결과를얻었다. 과연이다이어트신약이효과가있을까? P a ir e d S a mple s S ta tis tics Pair 사용전사용후 Std. Error Mean N Std. Deviation Mean 62.4000 20 5.865.3006 62.7000 20 5.7225.2796 Paired Samples Test Pair 사용전 - 사용후 Paired Differences 95% Confidence Interval of the Std. Error Difference Mean Std. Deviation Mean Lower Upper t df Sig. (2-tailed) -.3000 2.2266.4979 -.342.742 -.603 9.554 위의표에나타났듯이, 다이어트신약을사용하기전평균몸무게와이후의평균몸무게의차이가 0.3kg 이며, 표준편차는 2.23, 표준오차는 0.4979 이다. 평균의차이의 95% 신뢰구간 (-.342 ~ 0.742) 이 0 을포함하므로다이어트신약은효과가없는것으로나타났다. 또한 t-value 는 0.603, P (Sig. 2-tailed) = 0.554 로나타나, 유의수준 0.05 에서두집단간의평균차이는유의하지않는것으로나타났다. 여기에서 t 검정통계량의부호가음수가나오는것은 t 검정통계량을산출할때사용전의평균에서사용후의평균값을빼어서산출되기때문이며즉양수인경우는사용전의평균이다소높음을인식할수있고음수인경우는사용후의평균이높음을암시한다. Copyright[C] by Sejong University. All right reserved 0

6. 일원분산분석 (One-Way ANOVA) Analyze Compare means One-Way ANOVA Dependent List: 종속변수, Factor: 독립변수, Contrast: Polynomial Post Hoc: Scheffe Options: Descriptive, Homogeneity-of-variance 독립변수 : 명목척도, 서열척도종속변수 : 등간, 비율척도 앞에서두개의독립모집단평균차이검증을위해서 t-test 가사용될수있음을알아보았다. 단일변량분산분석은 (analysis of variance, ANOVA) 은세개이상의모집단의평균값을비교할때사용하는기법이다. 특히분산분석은실험계획 (experimental Design) 에의해얻어진데이터분석에많이이용된다. 따라서실험계획법에따라서달리적용가능하지만여기에서는일반적인경우 ( 완전랜덤계획법 ) 에분산분석만언급한다. 독립변수 ( 요인변수 ) 는명목, 서열척도가사용되며, 종속변수는등간, 비율척도가사용된다. 여기에서도표본은정규분포를따르는것을가정하며이조건을만족하지못하는경우는비모수적인방법인크루스칼 - 왈리스검정 (Kruskal-Wallis) 을사용한다. 다른가정으로등분산의가정이존재한다. 이는 levene 의등분산의검정으로확인가능하다. 예를들어서, 회사사원들의 전공 이회사 총근무년수 와관계있는지알아본다면, 총근무년 인문계자연계사범계예체능계 Total Descriptives 95% Confidence Interval for Mean N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum 25.56 9.20.84 7.76 5.36 34 5 7.00 8.67 2.24 2.20 2.80 30 4 8.00 7.35 3.67-3.69 9.69 2 8 4 2.25 0.87 5.44-5.05 29.55 23 48 3.02 9.22.33 0.34 5.70 34 위의표는각집단간총케이스수, 평균, 표준편차, 표준오차, 95% 신뢰구간등을나타내고있다. Test of Homogeneity of Variances 총근무년 Levene Statistic df df2 Sig..45 3 44.743 Copyright[C] by Sejong University. All right reserved

위의표는분산분석을나타낸표로써, 모집단의분산이동일한분산을가지고있다는가정하에서실시된다. 표에는 Levene 통계량이제시되어있는데, Levene 통계량이 0.45 이며 P (Sig) = 0.743 > 0.005 으로써모집단의분산이동일하다는귀무가설이채택된다. 그러므로다음의분석이가능한것이다. 총근무년 Between Groups Within Groups Total ANOVA Sum of Squares df Mean Square F Sig. 394.069 3 3.356.606.202 3598.90 44 8.793 3992.979 47 위의표에서 F =.606, P (Sig.) =0.202 로써그룹간평균이동일하다는귀무가설은채택된다. 다시말해서회사원들의 전공 은회사 총근무년수 에차이가없다고볼수있다. 그러나독립표본과는달리 3 개이상의표본간의평균차이비교를하는관계로분산분석에서통계적으로유의한차이가나타난경우에는다중비교를통하여각집단간의유의한차이를구체적으로확인을할필요가있다. 이때여러가지방법을이용하지만가장간단한방법으로독립표본 t 검정을거듭실시한효과를나타내는 LSD(Least Significant Difference) 이있으며그외 Bonferroni, Scheffe, Tukey, Duncan 을일반적으로많이이용한다. 그러나등분산이가정되지않은경우에는다른방법으로다중비교를실시해야한다. Post Hoc Tests Dependent Variable: 총근무년 Scheffe Multiple Comparisons (I) 전공인문계 자연계 사범계 예체능계 (J) 전공자연계사범계예체능계인문계사범계예체능계인문계자연계예체능계인문계자연계사범계 Mean Difference 95% Confidence Interval (I-J) Std. Error Sig. Lower Bound Upper Bound -5.44 2.95.347-4.03 3.5 3.56 4.87.9-0.60 7.72 -.69 4.87.999-4.85 3.47 5.44 2.95.347-3.5 4.03 9.00 5.09.383-5.79 23.79 4.75 5.09.832-0.04 9.54-3.56 4.87.9-7.72 0.60-9.00 5.09.383-23.79 5.79-4.25 6.40.93-22.84 4.34.69 4.87.999-3.47 4.85-4.75 5.09.832-9.54 0.04 4.25 6.40.93-4.34 22.84 위의표는 Scheffe 방법으로계산된사후검증을보여주는것으로유의수준 0.05 에서전공간유의한차이가있는것을보여주는부분은없다. Copyright[C] by Sejong University. All right reserved 2

Scheffe a,b 전공사범계인문계예체능계자연계 Sig. Homogeneous Subsets 총근무년 Subset for alpha =.05 N 4 8.00 25.56 4 2.25 5 7.00.364 Means for groups in homogeneous subsets are displayed. a. Uses Harmonic Mean Sample Size = 6.593. b. The group sizes are unequal. The harmonic mean of the group sizes is used. Type I error levels are not guaranteed. 위의표에서는평균차이가없는동일한집단을나타내고있는데, 각각 4 개의전공이모두동일한집단이라는결과를보여주고있다 (Subset 그룹이 개 ). Copyright[C] by Sejong University. All right reserved 3

7. 이원분산분석 (Two-Way ANOVA) General Linear Model Univariate Dependent Variable: 종속변수, Fixed Factor(5): 개이상독립변수 Post Hoc: Scheffe (Bonferroni, Tukey 는옵션 ) 이원분산분석 (Two-Way ANOVA) 이일원분산분석 (One-Way ANOVA) 과다른점은독립변수가 2 개이상이란점이다. 만약회사사원들의 담당업무 와 대학유형 이회사 총근무년수 와관계있는지알아본다면, 담당업무 대학유형 Between-Subjects Factors 2 3 2 3 Value Label N 부서A 5 부서B 36 부서C 8 4년제대학 20 2년제대학 8 기타 ( 각종학 교, 대학원 대학등 ) 위의표는담당업무및학력변수에따른케이스들의수를보여주고있다. Tests of Between-Subjects Effects Dependent Variable: 총근무년 Type III Sum Source of Squares df Mean Square F Sig. Corrected Model 946.633 a 8 8.329.422.27 Intercept 548.57 548.57 65.07.000 담당업무 793.69 2 396.584 4.766.04 대학유형 22.948 2 6.474.739.484 담당업무 * 대학유형 28.327 4 70.332.845.505 Error 3328.755 40 83.29 Total 303.000 49 Corrected Total 4275.388 48 a. R Squared =.22 (Adjusted R Squared =.066) 위의표는총근무년수에대한담당업무와대학별유형, 그리고두변수의상호작용효과를나타내고있다. 우선담당업무의경우 F=4.766, P (Sig) = 0.04 < 0.05 로써귀무가설이기각되었다. 즉, 담당업무와총근무년수는차이가있는것으로나타났다. 대학유형의경우 F=0.739, P (Sig) = 0.484 > 0.05 로써귀무가설이채택되었다. 즉, 대학유형과총근무년수는차이가없는것으로나타났다. 담당업무, 대학유형상호작용의경우 F=0.845, P (Sig) = 0.505 > 0.05 로써귀무가설이채택되었다. 즉, 상호작용과총근무년수는차이가없는것으로나타났다. Copyright[C] by Sejong University. All right reserved 4

사후검정 ( 담당업무 ) Multiple Comparisons Dependent Variable: 총근무년 Scheffe (I) 담당업무부서 A 부서 B 부서 C (J) 담당업무부서B 부서C 부서A 부서C 부서A 부서B Based on observed means. *. The mean difference is significant at the.05 level. Mean Difference 95% Confidence Interval (I-J) Std. Error Sig. Lower Bound Upper Bound 0.7 4.35.060 -.36 2.77 3.27* 5.20.049 5.34E-02 26.50-0.7 4.35.060-2.77.36 2.57 3.57.773-6.50.63-3.27* 5.20.049-26.50-5.34E-02-2.57 3.57.773 -.63 6.50 위표는담당업무부서간총근무년수에대한사후검증결과를보여주고있다. 부서 A 와부서 C 가유의적인차이가있는것으로나타났다 (P = 0.049 < 0.05). 이곳에서는 Scheffe 방법만을사용했으나 Tukey 혹은 Bonferroni 방법등도좋은기법중하나라고할수있다. Scheffe a,b,c 담당업무부서C 부서B 부서A Sig. 총근무년 Subset N 2 8 0.3 36 2.69 2.69 5 23.40.845.065 Means for groups in homogeneous subsets are displayed. Based on Type III Sum of Squares The error term is Mean Square(Error) = 83.29. a. Uses Harmonic Mean Sample Size = 8.504. b. The group sizes are unequal. The harmonic mean of the group sizes is used. Type I error levels are not guaranteed. c. Alpha =.05. * 대학유형별사후검정은동일한분석방법이므로생략되었음. 위의표에서는통계적으로동일한집단을보여주고있다. Subset 에서는부서 C 와부서 B, 그리고 Subset 2 에서는부서 B 와부서 A 의평균차이가없다는것을보여주고있다. 위의에에서는상호작용효과가나타나지않았지만실제적으로이원변량분석의경우는상호작용효과에대한관심을더욱강하게나타낸다. 이경우에통계적으로유의한상호작용효과가존재한다고분석된경우에는연구의목적에따라서위의예에서나타난대학유형별담당업무간의차이와담당업무별대학유형의차이에대한추가적인분석이동반된다. Copyright[C] by Sejong University. All right reserved 5

8. 다변량분산분석 (MANOVA) General Linear Model Multivariate Dependent Variables: 종속변수, Fixed Factor(5): 개이상독립변수 Covariate(s): 통제변수 Post Hoc: Scheffe (Bonferroni, Tukey 는옵션 ) 독립변수 : 명목척도, 종속변수 : 등간, 비율척도 다변량분산분석 (Multivariate Analysis of Variance: MANOVA) 는종속변수의수가 2 개이상인경우집단평균벡터 (vector) 비교하는데이용하는통계기법이라할수있다. SPSS 에서는공분산분석 (ANCOVA), 반복측정분산분석 (Repeated Measure ANOVA) 이많이이용된다. 그래서지금까지의분석들의특징을보면, 두집단간평균의비교는 t-test, 두집단이상의평균을비교하는데는 ANOVA, 그리고종속변수가 2 개이상인경우는 MANOVA 를사용하게된다. 그렇다면왜 MANOVA 를사용하나? () 만약종속변수간강한상관관계가있을경우, ANOVA 를이용해서는밝혀낼수없는결합차이들을알수있다. (2) ANOVA 를사용했을경우에비해오차 ( 종오차 ) 의확률을줄일수있다. 또한 MANOVA 의가정을보면 () 관측치들이서로독립적이여야되고 (2) 변수들이다변량정규분포성 (Multivariate normal distribution) 을충족해야하며 (3) 각집단간분산 - 공분산행렬이동일해야한다. 예를들어서회사사원들의 대학유형 이회사 총근무년수 와 월수입 (2 개의종속변수 ) 관계있는지알아본다면, General Linear Model Between-Subjects Factors 대학유형 2 3 Value Label N 4년제대학 20 2년제대학 8 기타 ( 각종학 교, 대학원 대학등 ) 위의표는대학유형별표본의수를나타내고있다. Copyright[C] by Sejong University. All right reserved 6

Multivariate Tests c Effect Intercept 대학유형 Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root Value F Hypothesis df Error df Sig..775 77.493 a 2.000 45.000.000.225 77.493 a 2.000 45.000.000 3.444 77.493 a 2.000 45.000.000 3.444 77.493 a 2.000 45.000.000.00.20 4.000 92.000.975.990.8 a 4.000 90.000.976.0.6 4.000 88.000.977.00.234 b 2.000 46.000.792 a. Exact statistic b. The statistic is an upper bound on F that yields a lower bound on the significance level. c. Design: Intercept+ 대학유형 위의표는대학유형의다변량검증에대한결과를보여주고있다. Source Corrected Model Intercept 대학유형 Error Total Corrected Total Dependent Variable 총근무년수입총근무년수입총근무년수입총근무년수입총근무년수입총근무년수입 Tests of Between-Subjects Effects a. R Squared =.003 (Adjusted R Squared = -.04) b. R Squared =.000 (Adjusted R Squared = -.043) Type III Sum of Squares df Mean Square F Sig..93 a 2 5.966.064.938 202.375 b 2 0.87.008.992 8045.952 8045.952 86.8.000 884957.83 884957.83 53.370.000.93 2 5.966.064.938 202.375 2 0.87.008.992 4263.457 46 92.684 565352.727 46 2290.277 303.000 49 2577900.000 49 4275.388 48 565555.02 48 위의표에서는대학유형에대한총근무년수와수입에대한결과가제시되어있다. 우선대학유형에대한총근무년수의경우 F=0.064, P (Sig) = 0.938 > 0.005 이므로, 총근무년수는대학유형별 (2 년제, 4 년제, 기타 ) 로차이가있다고할수없다. 또한, 우선대학유형에대한수입의경우 F=0.008, P (Sig) = 0.992 > 0.005 이므로, 수입은대학유형별 (2 년제, 4 년제, 기타 ) 로차이가있다고할수없다. Copyright[C] by Sejong University. All right reserved 7

Post Hoc Tests 대학유형 Scheffe Multiple Comparisons Dependent Variable 총근무년 수입 (I) 대학유형 4 년제대학 2 년제대학 기타 ( 각종학교, 대학원대학등 ) 4 년제대학 2 년제대학 Based on observed means. 기타 ( 각종학교, 대학원대학등 ) (J) 대학유형 2 년제대학기타 ( 각종학교, 대학원대학등 ) 4 년제대학기타 ( 각종학교, 대학원대학등 ) 4 년제대학 2 년제대학 2 년제대학기타 ( 각종학교, 대학원대학등 ) 4 년제대학기타 ( 각종학교, 대학원대학등 ) 4 년제대학 2 년제대학 Mean Difference 95% Confidence Interval (I-J) Std. Error Sig. Lower Bound Upper Bound.68 3.3.977-7.23 8.59.26 3.6.94-7.88 0.4 -.68 3.3.977-8.59 7.23.59 3.68.987-8.73 9.9 -.26 3.6.94-0.4 7.88 -.59 3.68.987-9.9 8.73 4.0000 36.08.994-87.36 95.36 -.5455 4.650.000-05.872 04.7263-4.0000 36.08.994-95.36 87.36-4.5455 42.4275.994 -.8724 02.785.5455 4.650.000-04.7263 05.872 4.5455 42.4275.994-02.785.8724 위의표는각종속변수별로집단간의차이의유무를사후검증한결과표이다. 예를들어서총근무년수에서 4 년제와 2 년제간에유의한차이가없는것으로나타내고있다. p=.977 > 0.005). 마친가지로모든집단에서유의한차이가없는것으로나타나고있다. 결과적으로대학유형과회사내총근무년수그리고수입간에는차이가없는것으로나타났다. 총근무년 Scheffe a,b,c Subset 대학유형 N 기타 ( 각종학교, 대학원대학등 ) 2.64 2년제대학 8 3.22 4년제대학 Sig. 20 3.90.936 Means for groups in homogeneous subsets are displayed. Based on Type III Sum of Squares The error term is Mean Square(Error) = 92.684. a. Uses Harmonic Mean Sample Size = 5.270. b. The group sizes are unequal. The harmonic mean of the group sizes is used. Type I error levels are not guaranteed. c. Alpha =.05. 위의표에서는총근무년에대한대학유형이통계적으로동일한집단을보여주고있다. 대학유형에대한수입부분역시같은내용으로써본내용에서삭제됨 Copyright[C] by Sejong University. All right reserved 8

9. 상관분석 (Correlation Analysis) Analyze Correlate Bivariate 상관분석은두변수가어느정도밀접한관계를가지고있는분석인지를나타내주는기법이다. 예를들어서, 고등학교학생들의키와체중사이의관계를알고싶어하는경우상관분석이사용되어야한다. 키와체중은서로간독립적이기보다서로영향을주고받는관계이다. 키가크기때문에체중이많이나간다고할수있지만, 역으로체중이많이나가는학생들의키가또한크기때문이다 ( 다시말해서회귀분석의경우처럼한변수가다른변수에영향을주기보다서로밀접한상호작용을하는것이다.) 상관관계의종류상관관계에는세가지종류로구분될수있다. () 단순상관계수 (Simple correlation coefficient): 두변수사이의상관관계를의미한다. (2) 다중상관관계 (Multiple correlation): 하나의변수와다른두개변수이상의변수사이의상관관계를의미한다. (3) 부분상관관계 (Partial correlation): 다른변수의상관관계를통제한상태에서, 두변수간의순수한상관관계를의미한다. 상관계수 (correlation coefficient) 는두변수사이에관계가얼마나강한지혹은약한지를나타내주는지수가되겠다. 우선 + 숫자는양의방향의관계를나타내며, - 숫자는음의방향의관계를나타낸다. 또한지수에대한해석은아래와같다..0 ~ 0.7: 매우강한양의관련성, -.0 ~ -0.7: 매우강한음의관련성 0.7 ~ 0.4: 강한양의관련성, -0.7 ~ -0.4: 강한음의관련성 0.4 ~ 0.2: 약한양의관련성, -0.4 ~ -0.2: 약한음의관련성 0.2 ~ 0.0: 거의관련이없음, -0.2 ~ -0.0: 거의관련이없음 Copyright[C] by Sejong University. All right reserved 9

우선조사한고등학생의키와체중그리고나이에관한상관관계를조사한다고가정할경우, 단순상관분석결과 키 체중 나이 Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Correlations 키 체중 나이.000.763**.530**..000.000 50 50 50.763**.000.603**.000..000 50 50 50.530**.603**.000.000.000. 50 50 50 **. Correlation is significant at the 0.0 level (2-tailed). 위에표에서보는바와같이, 키와체중의상관계수는 0.763 으로써, 강한양의상관관계보여주고있으며, 통계적으로도매우유의한것으로나타났다유의수준.00). 또한키와나이의경우 0.530, 나이와체중의경우 0.6 으로써, 나이역시키와체중에상당한상관관계가있음을보여주고있다. 0. 부분상관분석 Analyze Correlate Partial 만약조사자가학생들의나이를통제하고, 순수하게키와체중만의상관관계를알고싶어할경우, 다음과같은결과를얻을수있다. 부분상관분석결과 - - - P A R T I A L C O R R E L A T I O N C O E F F I C I E N T S - - - Controlling for.. 나이 키 체중 키.0000.6558 ( 0) ( 47) P=. P=.000 체중.6558.0000 ( 47) ( 0) P=.000 P=. (Coefficient / (D.F.) / 2-tailed Significance) ". " is printed if a coefficient cannot be computed 위에서보는바와같이, 나이를통제한상태에서키와체중의상관관계는 0.6558 로써강한상관관계를나타내고있다. 또한통계적으로도매우유의한관계 (P =.000) 를보여주고있다. Copyright[C] by Sejong University. All right reserved 20

. 회귀분석 (Regression) Analyze Regression Linear Dependent: 종속변수, Independent: 독립변수 독립변수 : 등간, 비율척도, 종속변수 : 등간, 비율척도 회귀분석 (Regression) 은독립변수와종속변수간인과관계 (Causal relationship) 를알아보는기법이라고할수있겠다. 독립변수 (Independent Variable) 는다른변수에영향을주는변수이며, 종속변수 (Dependent Variable) 는이와반대로영향을독립변수에영향을받는변수이다. 회귀분석은단순회귀분석 (Simple regression analysis) 와중회귀분석 (Multiple regression analysis) 으로크게분류되는데, 단순회귀분석의경우는독립변수와종속변수가각기하나씩인경우이며, 중회귀분석은여러개의독립변수와하나의종속변수가사용된경우이다. 결국회귀분석과중회귀분석의차이점은독립변수의수에그차이가있다고할수있다. () 단순회귀분석 (Simple regression analysis) 예를들어서, 조사자가신상품에대한만족도를조사하려고한다고가정하자. 이럴경우신상품에대한브랜드인지도, 디자인, 가격, 성능, 품질이전반적인만족에영향을미치는지알아보기위해서회귀분석을실시하였다. 위의경우에서는브랜드인지도, 디자인, 가격, 성능, 품질이독립변수가되며, 전반적인만족이종속변수가되겠다. 설문문항예제가아래와같을경우 설문문항브랜드인지도본상품의브랜드에대해서어느정도알고계십니까? () 전혀모른다 (2) 잘모르겠다 (3) 그저그렇다 (4) 잘안다 (5) 매우잘안다디자인본상품의디자인에대해서어떻게생각하십니까? () 전혀맘에들지않는다 (2) 맘에들지않는다 (3) 그저그렇다 (4) 맘에든다 (5) 매우맘에든다. 가격본상품의가격에대하여어떻게생각하십니까? () 매우비싸다 (2) 비싸다 (3) 그저그렇다 (4) 비싸지않다 (5) 전혀비싸지않다성능본신상품의성능 (Function) 에대해서어떻게생각하십니까? () 전혀맘에들지않는다 (2) 맘에들지않는다 (3) 그저그렇다 (4) 맘에든다 (5) 매우맘에든다. 품질본신상품의품질대해서어떻게생각하십니까? () 전혀맘에들지않는다 (2) 맘에들지않는다 (3) 그저그렇다 (4) 맘에든다 (5) 매우맘에든다. 전반적만족신상품에대하여귀하께서는어느정도만족하고계십니까? () 매우불만족한다 (2) 불만족한다 (3) 그저그렇다 (4) 만족한다 (5) 매우만족한다 Copyright[C] by Sejong University. All right reserved 2

단순회귀분석결과표 ( 종속변수, 독립변수는각기하나씩 ) Model Summary Model R R Square Adjus ted R Square Std. Error of the Estimate.346 a.20.0.86 a. Predictors: (Constant), 브랜드 위의표에서는브랜드인지도 ( 브랜드 ) 가독립변수, 전반적만족 ( 만족 ) 이종속변수임을나타내고있다. Variables Entered/Removed b Model Variables Entered Variables Removed Method 브랜드 a. Enter a. All requested variables entered. b. Dependent Variable: 만족 위의표에서는 R Square (R 2 ) 값을보여주고있다. R 2 ( 결정계수 ) 는회귀선에의해서설명이되어지는비율을나타나는것으로, 브랜드에의해서신상품의전반적인만족의 2.0% 설명이되어진다는것을보여주고있다. R 2 의범위는 0 과 사이의값을가지게된다. R 2 값이 에가까운수록회귀선을설명하는데유용하다고할수있다. Model Regression Residual Total a. Predictors: (Constant), 브랜드 b. Dependent Variable: 만족 ANOVA b Sum of Squares df Mean Square F Sig. 4.805 4.805 6.520.04 a 35.375 48.737 40.80 49 위의표는회귀식이얼마나통계적으로유의한지검정하는표로써, Sig = 0.04 < 0.05 이므로본회귀식이통계적으로유의하다고할수있다 ( 일반적으로 Sig 가 0.005 보다작을경우통계적으로유의하다고본다 ). Coeffic ie n ts a Standardi zed Unstandardized Coefficients Coefficie nts Model B Std. Error Beta t Sig. (Cons tant) 2.263.530 4.268.000 브랜드.388.52.346 2.553.04 a. Dependent Variable: 만족 Copyright[C] by Sejong University. All right reserved 22

위의표는회귀계수를보여주는중요한표로써, 회귀식의상수값은 2.263 이고, Sig =.000 <.005 로써통계적으로유의함을보여주고있다. 또한브랜드인식도에대한회귀계수는 0.388 이며 Sig =.04 <.005 이므로통계적으로유의하다고할수있다. 본테스트에대한회귀식은다음과같다. Y = 2.263 ( 상수 ) + 0.388 X Y = 전반적만족도 X = 브랜드인지도 결론적으로, 브랜드인지도가통계적으로전반적인소비자만족도에영향을미치지만그영향력은매우작다고할수있다 (R 2 = 0.20) (2) 중회귀분석 (Multiple regression analysis) 중회귀분석은다수의독립변수가하나의종속변수에미치는영향을나타내는것으로, 단순회귀분석 (Simple regression analysis) 보여준것과달리독립변수에브랜드인지도외에, 디자인, 가격, 기능, 품질모두가전반적인만족에영향을미치는지알아보기위해서실시되는분석이라고할수있겠다. Variables Entered/Removed b Model Variables Entered 기능, 브랜 Variables Removed Method 드, 디자인, 품질, 가격 a. Enter a. All requested variables entered. b. Dependent Variable: 만족 위의표에서는기능, 브랜드, 디자인, 품질, 가격이독립변수, 전반적만족 ( 만족 ) 이종속변수임을나타내고있다. Model Summary Adjusted Std. Error of Model R R Square R Square the Estimate.790 a.625.582.59 a. Predictors: (Constant), 기능, 브랜드, 디자인, 품질, 가격 위의표에서는 R Square (R 2 ) 값을보여주고있다. R 2 ( 결정계수 ) 는회귀선에의해서설명이되어지는비율을나타나는것으로, 기능, 브랜드, 디자인, 품질, 가격에의해서신상품의전반적인만족의 62.5% 설명이되어진다는것을보여주고있다. 단순회귀분석에서브랜드만에의해서설명되어지는설명량보다휠씬높음을보여주고있다. Copyright[C] by Sejong University. All right reserved 23

Model Regression Residual Total ANOVA b Sum of Squares df Mean Square F Sig. 25.05 5 5.02 4.655.000 a 5.075 44.343 40.80 49 a. Predictors: (Constant), 기능, 브랜드, 디자인, 품질, 가격 b. Dependent Variable: 만족 위의표는회귀식이얼마나통계적으로유의한지검정하는표로써, Sig = 0.000 < 0.05 이므로본회귀식이통계적으로유의하다고할수있다 Model (Constant) 브랜드가격디자인품질기능 a. Dependent Variable: 만족 Coefficients a Unstandardized Coefficients Standardi zed Coefficie nts B Std. Error Beta t Sig. -.372.58 -.78.477.238.7.22 2.042.047.06.09.2.97.337.07.097.0.05.275.304..32 2.747.009.393.20.40 3.270.002 위의표에서알수있듯이, 브랜드인식도에대한회귀계수는 0.047 이며 Sig =.04 <.005 이므로통계적으로유의하다. 이러한방법으로품질및기능이통계적으로유의함을알수있다. 따라서전반적인만족도는기능에대한만족도가가장강한영향력을주며다음으로품질, 브랜드이미지의순으로향상효과가있는것으로나타났다. 본테스트에대한다중회귀식은다음과같다. Y = -0.372 ( 상수 ) + 0.238 X + 0.06 X 2 + 0.07 X 3 + 0.304 X 4 + 0.393 X 5 Y = 전반적만족도 X = 브랜드 X 2 = 가격 X 3 = 디자인 X 4 = 품질 X 5 = 기능 그러나이모형에서는전반적인만족도에유의한영향력을미치지못하는변인또한독립변인으로포함하여분석한모형이므로최종적인모형을산출하기위해서는단계적인방법 (Stepwise method) 나전진선택법, 후진선택법등을이용하여최종모형을산출할수있다. Copyright[C] by Sejong University. All right reserved 24

3. 신뢰성분석 (Reliability) Analyze Scale Reliability Statistics Descriptives for: Item, Scale, Scale if item deleted Statistics Inter item: corrleation 신뢰성은동일한개념을대상으로반복적인측정을했을경우나타나는측정값들의일관된정도를나타낸다. 신뢰성을측정하는방법에는재측정신뢰도 (test-retest reliability), 반분신뢰도 (split-half reliability), 문항분석 (item-total correlation), Chronbach alpha 등여러가지기법들이있다. 우선기본적으로신뢰성분석은측정문항이 2 개이상이여야한다. 예를들어서, 회사내사원들의 자율성 를측정하기위해서 5 문항이측정되었는데, 이문항들의신뢰성을알아보기로했다. 결과는다음과같다. R E L I A B I L I T Y A N A L Y S I S - S C A L E (A L P H A) Mean Std Dev Cases. 자율 3.6400.727 50.0 2. 자율2 3.800.8003 50.0 3. 자율3 3.4000.7284 50.0 4. 자율4 3.6400.9424 50.0 5. 자율5 3.4000.7284 50.0 위의표는자율문항의평균, 표준편차, 그리고케이스개수를보여주고있다. Correlation Matrix 자율 자율 2 자율 3 자율 4 자율 5 자율.0000 자율2.7506.0000 자율3.553.504.0000 자율4.4957.5206.0654.0000 자율5.590.6092.6538.2438.0000 위의표는자율문항간상관관계를보여주고있다. 자율성을측정한 번문항과 2 번문항의상관관계 (0.7506) 가높은것으로나타나고있다. Copyright[C] by Sejong University. All right reserved 25

N of Cases = 50.0 N of Statistics for Mean Variance Std Dev Variables Scale 7.2600 9.0535 3.0089 5 위의표는 5 문항을하나로가정한상황에서평균, 분산, 표준편차, 문항의수를보여주고있다. Item-total Statistics Scale Scale Corrected Mean Variance Item- Squared Alpha if Item if Item Total Multiple if Item Deleted Deleted Correlation Correlation Deleted 자율 3.6200 5.794.7892.6420.737 자율2 4.0800 5.4629.7886.6446.7304 자율3 3.8600 6.578.5224.520.8099 자율4 3.6200 6.282.3988.3803.866 자율5 3.8600 6.637.6523.5392.7752 위의표에서가장중요한부분은 Alpha if item deleted 로써각문항을제거했다고가정했을경우 Chronbach a 값이되겠다. 다시말해서수치가높으면높을수록그문항을제거할경우 Chronbach a 값이높아지는것이다. 예를들어서자율4번을제거하면 Chronbach a 값은 0.866 으로올라가고, 반대로자율2 번을제거하면 Chronbach a 값은 0.7304 로떨어지게된다. Reliability Coefficients 5 items Alpha =.8205 Standardized item alpha =.8325 위의표를보아서자율 5 문항의 Chronbach a (Alpha) 값은 0.8205 이며, 표준화된각문항으로신뢰성분석을했을경우 Chronbach a (Standardized item alpha) 값은 0.8325 임을알수있다. 일반적으로 Alpha 의사용이보편화되고있으나, 문항의척도가큰분산을이루고있는경우 Standardized item alpha 를사용해야된다. 일반적으로 cronbach s Alpha 의값이 0.6 이상이면신뢰성이높은것으로판단한다. Copyright[C] by Sejong University. All right reserved 26

4. 요인분석 (Factor Analysis) Analyze Data Reduction Factor Variables: 측정항목변수 Rotation: Varimax Extraction: Scree Scores: Save as variables ( 요인을변수로만들고싶을때 ) 요인분석은여러측정문항들의상관관계를바탕으로, 측정문항의공통차원 (common underlying dimension) 을통해문항의수보다적은요인 (factor) 을만들어내는통계기법이다. 요인분석을실시하기위해서는문항이간격척도나혹은비율척도이여야하며, 표본의크기는최소 50 개에서 00 개정도는되어야한다. 요인추출방법에는주로주성분분석 (Principle Component Analysis) 와공통요인분석 (Common Factor Analysis) 등이사용되지만, 보편적으로주성분분석이주로많이사용된다고할수있다. 요인의수결정에관해서는여러가지방법이사용되는데 () 고유치 (Eigenvalues) 기준 : Eigenvalue 는 요인적제값의제곱의합 을나타내는데, 고유치가 이상인경우를기준으로요인수를결정한다. (2) 요인수의사전결정 : 이방법은요인분석전, 요인의수를미리조사자가결정하는방법으로써, 원하는수의요인을얻을수있다. (3) 스크리검정 (Scree test): SPSS 에서는스크리도표 (Scree table) 을제공하다. 세로축은각요인의고유치를나타내고가로축은요인의개수를나타내는데, 감소폭이갑자기줄어드는부분의전까지요인의수를기준으로요인을추출할수있다. (4) 공통분산의총분산에대한비율 : 이방법은요인들의설명력의합을사전에어느정도결정한후지정하는방법으로써, 보통사회과학분야에서는 60% 정도를기준으로삼고있다. 어떤문항이특정요인에높게관계되는지알아보기위해서요인을회전하게된다. 회전방식에는직각회전방식 (Varimax, Quartimax, Equimax) 과사각회전 (Oblimin, Promax) 등이있는데 Varimax 방식이가장보편적인방법이다. Copyright[C] by Sejong University. All right reserved 27

예를들어서회사낸직원들에대한만족도를측정하기위해서여러가지문항 (X~X9) 을만들어서조사한후요인들알아보기위해실시한요인분석결과는아래와같다 (Options: Coefficient Display Format: suppress 0.50) Factor Analysis X X2 X3 X4 X5 X6 X7 X8 X9 Communalities Initial Extraction.000.720.000.690.000.580.000.79.000.637.000.547.000.720.000.470.000.702 Extraction Method: Principal Component Analysis. 위의표는공통성 (Communalities) 을보여주고있는데, 공통성은 0 과 사이에값을갖는다. 예를들어서 X 의경우추출된요인들에의해서 72% 가설명되고있음을알수있다. Component 2 3 4 5 6 7 8 9 Total Variance Explained Initial Eigenvalues Extraction Sums of Squared Loadings Rotation Sums of Squared Loadings Total % of Variance Cumulative % Total % of Variance Cumulative % Total % of Variance Cumulative % 4.555 50.60 50.60 4.555 50.60 50.60 3.274 36.382 36.382.230 3.670 64.280.230 3.670 64.280 2.5 27.898 64.280.978 0.863 75.43.69 6.879 82.022.42 4.675 86.696.409 4.547 9.243.34 3.490 94.733.259 2.880 97.63.25 2.387 00.000 Extraction Method: Principal Component Analysis. 위의표는 9 개문항이 9 개요인으로추출되는고유치 (Eigenvalue) 와설명력을보여주고있다. 고유치 을이용하였을경우, 요인 3 의고유치가 0.979 (Total) 이므로, 요인 2 개만이추출이된다. X X2 X3 X4 X5 X6 X7 X8 X9 Component Matrix a Component 2.626.573.83.54.536.780.75.730.764.592.754 Extraction Method: Principal Component Analysis. a. 2 components extracted. 위의표는요인행렬이회전되기전의요인부하량을보여주고있다. Copyright[C] by Sejong University. All right reserved 28

Rotated Component Matrix a X X2 X3 X4 X5 X6 X7 X8 X9 Component 2.838.529.64.756.745.756.646.828.678.88 Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. a. Rotation converged in 3 iterations. 위의표는회전후의요인부하량을나타내고있다. 요인회전전과많은차이를보여주고있는데, 요인 에는 X5, X6, X7, X8, X9 그리고요인 2 에는 X, X2, X3, X4 의요인이높게걸려있다. X2 의경우두요인모두 0.5 이상의요인부하량을보여주고있으나요인2에좀더높은요인부하량을보여주고있다. 5 Scree Plot 4 3 2 Eigenvalue 0 2 3 4 5 6 7 8 9 Component Number 위의표는스크리도표로써, 가로축이요인수, 그리고세로축이고유치가된다. Component Transformation Matrix Component 2.784.62 2 -.62.784 Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. 위의값은요인회전시사용된성분변환행렬값을보여주고있다. Copyright[C] by Sejong University. All right reserved 29

5. 판별분석 (Discriminant Analysis) 통계분석 -> 분류분석 -> 판별분석집단변수 -> variety, 독립변수 -> x, x2, x3, x4 통계량 : 평균, 일변량분산분석, Box 의 M, Fisher 의방법, 표존화하지않음분류 : 결합 - 진단, 영역도 판별분석은한개체가어느집단에속하는가를예측하는분석으로한개이상의설명 ( 독립 ) 변수를가지고집단 ( 종속 ) 변수에대한판별모형을만든다. 예를들면, 은행에서신용도를가지고도산위험이높은집단과낮은집단으로분류된다. 즉, 기존에있는데이터를바탕으로관찰되어지는개체들을몇개의그룹으로분류하는경우사용된다. 특히독립변수는등간척도나비율척도가사용되며종속변수로는명목, 서열척도가사용된다. 그러나범주형자료를이용하는경우에는반드시더미변수로변환하여이용하여야한다. 다음의자료는 Fisher 의붓꽃자료이며세가지품종 (setosa, Versicolor, Virginica) 의붓꽃으로부터각각 50 개씩추출하여꽃받침조각의길이 (x), 꽃받침조각의폭 (x2), 꽃잎의길이 (x3), 꽃잎의폭 (x4) 을각각측정한자료이다. 분석결과는다음과같다. 먼저집단변수의각집단 ( 품종 ) 에대한독립변수들의기술통계량이며집단평균의동질성에대한검정을보면 p=.000 으로네가지품종에대해서 4 개의측정치에차이가있는것으로나타났다. 즉네가지독립변수는품종을판별할수있는판별변수로서적합하다고판단할수있다. 집단통계량 품종 setosa versicolor virginica 합계 sepal length sepal width petal length petal width sepal length sepal width petal length petal width sepal length sepal width petal length petal width sepal length sepal width petal length petal width 유효수 ( 목록별 ) 평균 표준편차 가중되지않음 가중됨 5.006.3525 50 50.000 3.428.379 50 50.000.462.737 50 50.000.246.054 50 50.000 5.936.562 50 50.000 2.770.338 50 50.000 4.260.4699 50 50.000.326.978 50 50.000 6.570.602 50 50.000 2.974.3225 50 50.000 5.552.559 50 50.000 2.026.2747 50 50.000 5.837.862 50 50.000 3.057.4359 50 50.000 3.758.7653 50 50.000.99.7622 50 50.000 Copyright[C] by Sejong University. All right reserved 30

집단평균의동질성에대한검정 sepal length sepal width petal length petal width Wilks 람다 F 자유도 자유도2 유의확률.377 2.652 2 47.000.599 49.60 2 47.000.059 80.6 2 47.000.07 960.007 2 47.000 BOX M 은집단간공분산행렬이동일성에대한검정결과 p=.000 으로집단간공분산행렬이동일하다고볼수없기때문에분류방법적용시개별집단공분산행렬을사용하여야한다. 품종 setosa versicolor virginica 집단 - 내통합값 공분산행렬의동일성에대한 Box 의검정 로그행렬식 순위 로그행렬식 4-3.067 4-0.874 4-8.884 4-9.930 인쇄된판별값의순위와자연로그는집단공분산행렬의순위및자연로그를나타냅니다. Box의 M F 검정결과 근사법자유도 자유도 2 유의확률 48.697 7.43 20 77566.75.000 모집단공분산행렬이동일하다는영가설을검정합니다. 아래의결과에서는판별분석에서구한 2 개의정준판별함수 (canonical discriminant function) 에대한표로함수 의고유값은 32.325 이고, 전체판별력의 99.% 를설명하며, Wilks 람다값과카이제곱의유의확률이 0.000 이므로함수 의판별력과함수 2 의판별력을추가함으로써판별력이모두유의하다고할수있다. 정준판별함수의요약 고유값 함수 고유값 분산의 % 누적 % 정준상관 32.325 a 99. 99..985 2.285 a.9 00.0.47 a. 첫번째 2 정준판별함수가분석에사용되었습니다. Wilks 의람다 함수의검정 에서 2 2 Wilks의람다 카이제곱 자유도 유의확률.023 546.697 8.000.778 36.530 3.000 Copyright[C] by Sejong University. All right reserved 3

다음의표준화정준판별함수계수와각독립변수와판별함수의통합 (pooled) 상관계수이다. 즉, 판별함수 은꽃잎의길이와가장상관성이높으며, 다음으로꽃잎의폭이며, 판별함수 2 는꽃받침조각의폭과가장상관이높으며다음으로꽃잎의폭이다. 표준화정준판별함수계수 sepal length sepal width petal length petal width 함수 2 -.425 -.04 -.532.746.940 -.386.586.575 petal length sepal width petal width sepal length 구조행렬 함수 2.705*.65 -.9.864*.632.734*.225.294* 판별변수와표준화정준판별함수간의집단 - 내통합상관행렬. 변수는함수내상관행렬의절대값크기순으로정렬되어있습니다. *. 각변수와임의의판별함수간의가장큰절대상관행렬 이때정준판별함수의계수를통하여판별점수를산출하면, D=-.933-0.842*x-.566*x2+2.83*x3+2.862*x4 D2=-6.560-0.027*x+2.97*x2-0.897*x3+2.82*x4 이며이경우각집단에서독립변수자리에독립변수의중심값을넣고계산한판별점수의값이집단중심점이다. 즉, setosa 품종은함수 의값이 -7.6 에가깝다는것을의미한다. sepal length sepal width petal length petal width ( 상수 ) 정준판별함수계수 표준화하지않은계수 품종 setosa versicolor virginica 함수 2 -.842 -.027 -.566 2.97 2.83 -.897 2.862 2.82 -.933-6.560 함수의집단중심점 함수 2-7.622.25.826 -.728 5.797.53 표준화하지않은정준판별함수가집단평균에대해계산되었습니다. Copyright[C] by Sejong University. All right reserved 32

6. 군집분석 () 계층적군집분석 다음의예는 9 개국의경제상태에따른군집분석자료로계층적으로분석한경우에는다음과같은결과가나타난다. 분석 -> 분류분석 -> 계층적군집분석변수 : gnp, trade, defense, gdp 케이스설명기준변수 : nation( 문자타입 ) 통계량 : 군집화일정표, 해법범위 (3 에서 5) 도표 : 덴드로그램방법 : 군집방법 - 가장가까운항목 ( 최단연결법 ), 측도의간격 ( 제곱유클리디안거리 ), 값변환 (Z 점수 ) 군집분석은실험의결과나표본에서얻어진대상들을다양한특성의유사성을바탕으로동질적인몇개의군집 (cluster) 으로분류하는방법이다. 예를들어심리학에서성격유형에따라서몇개의그룹으로구분하거나의학에서환자의증상에따라서몇개의그룹으로구분하는방법이이애해당한다. 군집의유형은크게계층적군집과상호배반적군집으로나누며, 계층적군집은한군집이다른군집의매부에포함되나군집간에는중복이허용하지않는형식을취하며, 상호배반적군집은각개체가상호배반적인여러군집들중하나에만속하는유형이다. 각케이스의유사성을측정하기위해거리행렬을이용하여상대적인거리가가까운개체들끼리같은군집을이루게하는방법으로유클리드거리와유클리드제곱거리, 체비쉐프거리등을이용한다. 계층적군집분석을실시한경우에군집을 3 개로추출할경우에는 (~7) (8) (9) 로분류되며, 군집을 4 개로하는경우에는 (, 3, 6) (2, 4, 5, 7) (8) (9) 로분류되고, 군집을 5 개로분류하는경우에는 () (2, 4, 5, 7) (3, 6) (8) (9) 로분류된다. Copyright[C] by Sejong University. All right reserved 34

군집화일정표 단계 2 3 4 5 6 7 8 처음나타나는군집의 결합군집 단계 군집 군집 2 계수 군집 군집 2 다음단계 2 5.058 0 0 2 2 7.088 0 3 2 4.99 2 0 6 3 6.263 0 0 5 3.605 0 4 6 2.059 5 3 7 8 3.559 6 0 8 9 3.553 7 0 0 소속군집 케이스 :china 2:cuba 3:Egypt 4:India 5:Israel 6:Netherla 7:Poland 8:U.K 9:U.S 5 군집 4 군집 3 군집 2 2 3 2 2 2 2 3 2 2 4 3 2 5 4 3 수직고드름도표 케이스 군집의수 2 3 4 5 6 7 8 9:U.S 8:U.K 4:India 7:Poland 5:Israel X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X 2:cuba 6:Netherla 3:Egypt :china * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * Dendrogram using Single Linkage Copyright[C] by Sejong University. All right reserved 35

Rescaled Distance Cluster Combine C A S E 0 5 0 5 20 25 Label Num +---------+---------+---------+---------+---------+ cuba 2 Israel 5 Poland 7 India 4 Egypt 3 Netherla 6 china U.K 8 U.S 9 (2) K-평균군집분석 앞의예제를이용하여상호배반적인군집분석의예인 K- 평균군집분석을실시하였다. 분석 -> 분류분석 -> K- 평균군집분석변수 : gnp, trade, defense, gdp 케이스설명기준변수 : nation( 문자타입 ) 군집수 : 2 ( 이부분은연구자의의도에따라서변경할수있다 ) 옵션 : 분산분석표방법 : 군집방법 - 가장가까운항목 ( 최단연결법 ), 측도의간격 ( 제곱유클리디안거리 ), 값변환 (Z 점수 ) 해당군집의내용을저장하고자한다면 저장 에서 소속군집 을설정 그결과는다음과같다. 먼저초기군집의중심은아래의표과같이주어지며반복게산에의한최종적인군집의중심은 gnp 는군집 은 326.3, 군집 는 2334 가된다. 초기군집중심 gnp trade defense gpd 군집 2 58.00 2334.00 349.00 26836.00 3054.00 4064.00 8.70 2.20 Copyright[C] by Sejong University. All right reserved 36

반복계산 2 a. 반복계산정보 a 군집중심의변화량 2 3904.208.000.000.000 군집중심값의변화가없거나작아수렴이일어났습니다. 모든중심에대한최대절대좌표변경은.000 입니다. 현재반복계산은 2 입니다. 초기중심간의최소거리는 46038.288 입니다. 최종군집중심 gnp trade defense gpd 군집 2 326.2 2334.00 3683.63 26836.00 04.25 4064.00 4.64 2.20 또한각군집의변수평균들이동일하다는가정을검정하기위하여분산분석을실시한결과아래의네변인에대한군집은모두통계적으로유의한차이가있음을알수있다. 이결과는단지비교의목적에서만유용하게사용된다. 즉이경우에군집 은 8 개의나라가군집 2 는단지 개의나라만설정된다. 또한군집 2 는 U.S 가해당됨을알수있다. 분산분석 군집 오차 평균제곱 자유도 평균제곱 자유도 F 유의확률 gnp 3583298.4 203.790 7 3.990.00 trade 476473305 3026407 7 5.744.005 defense.394e+09 2370577.9 7 588.00.000 gpd 50.837 8.086 7 6.287.04 다른군집의여러케이스간차이를최대화하기위해군집을선택했으므로 F 검정은기술 통계를목적으로만사용되어야합니다. 이경우관측유의수준은수정되지않으므로군집 평균이동일하다는가설을검정하는것으로해석될수없습니다. 군집 유효결측 각군집의케이스수 2 8.000.000 9.000.000 Copyright[C] by Sejong University. All right reserved 37