제 13 장분산분석 1
13.1 일원분산분석 13. 분산분석 - 무작위블럭디자인 13.3 이원분산분석 - 팩토리얼디자인
분산분석 (ANOVA) - 두개이상의집단들의평균값을비교하는데사용. 일원분산분석 - 처치변수가한개인분산분석. 1. 분산분석의원리 A 3.0 8.0 7.0 5.0 5.0 6.0 4.0 7.0 6.0 4.0 평균 5.0 6.0 B 3.0 9.0 7.0 6.0 5.0 7.0 4.0 8.0 6.0 5.0 5.0 7.0 C 4.7 5.8 5.0 5.8 5.0 6.0 5. 6.0 5.1 6.4 5.0 6.0 3
. 분산분석의절차 제 5 부자료의분석 - 중급통계 처치변수처치수준결과변수 4
5 k n i i X X 1 1 k X X n 1 k n i i X X 1 1 전체제곱합 (total variance; total sum of squares; Total SS) 집단간제곱합 (between variance; sum of squares due to treatment; SST) 집단내제곱합 (within variance; sum of squares due to error; SSE) 제 5 부자료의분석 - 중급통계
< 표 13.> 분산분석표 원천제곱합 (SS) 자유도제곱평균 (MS) F obs 처치 ( 집단간 ) SST n X X k 1 오차 ( 집단내 ) SSE k 1 k n X i X 1 i1 n k MST MSE SST SSE ( k 1) ( n k) MST MSE k n 합계 Total SS X i X n 1 1 i1 6
3. 일원분산분석의예 예 13.1: 일원분산분석의예 교육프로그램에따라판매실적이다르다고할수있는가? α=.05. < 표 13.3> 교육프로그램별판매실적 교육프로그램 A B C D 가설검증 (1) H o : μ 1 =μ =μ 3 =μ 4 65 87 75 69 59 78 94 89 H 1 : 모든 μ가동일하지는않다 ( 어떤집단의평균값은다른집단의평균값과다르다 ). 73 79 81 69 83 81 7 79 76 67 6 83 76 80 88 () F-test를한다. (3) F obs 계산을위하여분산분석표를작성한다. 먼저, 각집단의평균값과전체평균값을계산한다. 90 7
3. 일원분산분석의예 Total SS k SST n 1 k n X i X 65 77.34 87 77.34 1 i1... 88 77.34 1,909. X X 675.67 77.34 4(87.75-77.34) 71.5 7(78.43-77.34) SSE k n X i X 65 75.67 87 75.67 1 i1 (88-87.75) 1,196.6 MST MSE SST SSE 4 1 37. 5 ( k 1) 71.6 3 4 63. 0 ( n k) 1,196.6 F obs MST MSE 37.5 63.0 3.77 8
3. 일원분산분석의예 < 표 13.5> 표 13.4의자료에의한분산분석표 원천 제곱합 (SS) d.f. 평균제곱 (MS) F obs 처치 ( 집단간 ) SST = 71.6 3 MST = 37.5 3.77 오차 ( 집단내 ) SSE = 1,196.9 19 MSE = 63.0 합계 Total SS = 1,909. (4) F crit = F (α; k-1, n-k) = F(.05; 3, 19) = 3.13 (5) F=3.13 보다우측이기각영역이되며 F obs =3.77 은기각역에위치하므로 H o 는기각된다. 따라서모든교육프로그램효과가동일하지는않다. 즉, 최소한어느두가지프로그램간에는그효과가다르다고결론지을수있다. F obs = 3.77 0 3.13.05 9
4. 분산분석의추가이슈들 추가 1: p-value 를이용한가설검증 예 13.1 의경우 : p-value F(.05; 3, 19) = 3.13 F(.01; 3, 19) = 5.01 3.77.01<p-value<.05 이며, p-value<α(.05) 보다 작으므로 H o 는기각된다. 추가 : 사후다중비교예 13.1에서분산분석결과네집단중적어도어느두집단간에는평균차이가있다고결론을내렸다. 그러면 6개의두집단비교중어느두집단에서차이가있는가 ( 4 C = 6)? < 부록 > 에서설명. 10
4. 분산분석의추가이슈들 예 13.1 의경우 : p-value 3.77 추가 3: 분산분석에의한두집단평균의비교 -두집단의평균차이검증을위해서 t-test외에분산분석에의한 F-test에의해서도가능. -예 1.1의문제를분산분석에의하여접근할수있다. 분산분석결과 F obs =.70 < F crit = F (.05; -1, 18-) = 4.49로서 H o 는기각되지않는다. 이와같이두모집단평균차이검증을위하여 F-test를하더라도 t-test 결과와같다. t 와 F 의관계 : t (α/; d.f.) = F (α; 1, d.f.) 예 1.1 의결과를이관계에적용시켜보면 (t obs ) = (1.64) =.70 = F obs (t crit ) = (.1) = 4.49 = F crit 로나타남을알수있다. 11
무작위블럭디자인에의한분산분석은 paired-difference test 를확장한것. 예 13.: 무작위블럭디자인에의한분산분석의예 실험에서 4개의수퍼마켓각각에세가지패키지디자인의비누를모두진열하였다. 이경우각수퍼마켓의조건은세가지디자인의비누판매에공통적으로영향을미치며, 이와같은변수를블럭변수라고한다. 이러한자료로부터패키지디자인에따라매출이다르다고할수있는가? α=.05. < 표 13.6> 수퍼마켓별각패키지디자인의판매실적 패키지디자인 ( 처치변수 ) A B C 1 17 34 3 슈퍼마켓 ( 블럭변수 ) 15 6 1 3 1 3 8 4 6 16 1
예 13.: 무작위블럭디자인에의한분산분석의예 < 표 13.7> 무작위블럭디자인의분산분석표 원천제곱합 (SS) 자유도평균제곱 (MS) F obs 처치 ( 집단간 ) SST t 1 MST=SST/(t-1) MST/MSE 블럭 SSB b 1 MSB=SSB/(b-1) MSB/MSE 오차 ( 집단내 ) SSE (b-1)(t-1) MSE=SSE/(b-1)(t-1) 합계 Total SS bt 1 여기서 b 는블럭의수, 그리고 t 는처치의수를나타낸다. 13
예 13.: 무작위블럭디자인에의한분산분석의예 가설검증 (1/) (1) H o : μ A =μ B =μ C H 1 : 모든 μ가동일하지는않다. () F-test를한다. (3) 분산분석표를작성하여 F obs 를구한다. SPSS 1.0에의해분석한결과는다음과같다. < 표 13.8> 표 13.6 의자료에의한무작위블럭디자인의분산분석표 원천 제곱합 (SS) d.f. 평균제곱 (MS) F obs 처치 ( 집단간 ) 547.17 73.58 36.09 블럭 348.00 3 116.00 15.30 오차 ( 집단내 ) 45.50 6 7.58 합계 940.67 11 14
예 13.: 무작위블럭디자인에의한분산분석의예 가설검증 (/) (4) 관심 : 패키지디자인에따라매출이다른가?: F obs ( 처치 )= 36.08을다음의 F crit 과비교한다. F crit = F(α; t-1, (b-1)(t-1)) = F(.05;, 6) = 5.14 (5) - F obs > F crit 이므로 Ho는기각된다. - α=.05에서패키지디자인에따라매출이달라질수있다는결론을내릴수있다. 추가적으로, 수퍼마켓간에매출이동일하다 (μ 1 =μ =μ 3 =μ 4 ) 는귀무가설을생각할수있다. H o : μ 1 =μ =μ 3 =μ 4 H 1 : 모든 μ 가동일하지는않다. F obs = 15.30 F crit = F (α; b-1, (b-1)(t-1)) = F (.05; 3, 6) = 4.76 - F obs > F crit 이므로 H o 는기각된다. - α=.05 에서수퍼마켓간에비누매출이동일하지는않다는결론을내릴수있다. 15
팩토리얼디자인 (factorial design) 두개이상의처치변수의수준변화에따른결과변수값의변화를조사하기위한실험디자인. - 각처치변수를 factor라고부른다. - factor A의처치수준은 a이고 factor B의처치수준은 b이면 a b factorial design. - 처치변수가두개이므로이원분산분석 (two-way ANOVA) 을적용한다. - 추가적으로 factor C가있으며처치수준이 c이면 a b c factorial design이되며삼원분산분석 (three-way ANOVA) 을적용한다. 주효과 각처치변수의변화가결과변수에미치는영향에관한것. 상호작용효과 한처치변수가다른처치변수의변화에따라결과변수에미치는영향. 16
예 : 두개의처치변수, 단맛정도와탄산화정도가소비자태도에미치는영향. ( factorial design) 17
< 표 13.9> a b factorial design 에대한이원분산분석표 원천 제곱합 (SS) 자유도 평균제곱 (MS) F obs Factor A SS(A) (a-1) MS(A) = SS(A)/(a-1) MS(A)/MSE Factor B SS(B) (b-1) MS(B) = SS(B)/(b-1) MS(B)/MSE 상호작용 A B SS(AB) (a-1)(b-1) MS(AB) = SS(AB)/(a-1)(b-1) MS(AB)/MSE 오차 SSE (n-ab) MSE = SSE/(n-ab) 합계 Total SS (n-1) 18
예 13.3: 팩토리얼디자인에의한이원분산분석의예세가지광고대안을개발하여남녀각각 9명의피실험자들을 6개의 cells에할당하고각피실험자에게세가지광고중하나를보여주었다. 피실험자들의광고태도는 < 표 > 와같다. 연구문제 1. 광고대안에따라광고태도가다른가 ( 광고대안의주효과 ; α=.05)?. 성별에따라광고태도가다른가 ( 성별의주효과 ; α=.05)? 3. 성별과광고대안간에는상호작용효과가있는가 (α=.05)? 광고 성별 1 3 남 4.1 3.1 3.5 3.9.8 3. 4.3 3.3 3.6 여.7 1.9.7 3.1..3.6.3.5 < 표 13.10> 남 녀별각광고에대한태도점수 19
예 13.3: 팩토리얼디자인에의한이원분산분석의예 가설검증 (1/) (1) 1. H o : μ 1 =μ =μ 3 H 1 : 모든 μ 가동일하지는않다.. H o : μ 남 =μ 여 H 1 : μ 남 μ 여 3. H o : 상호작용효과가없다. H 1 : 상호작용효과가있다. () 3 factorial design에의한이원분산분석 ( 세개의 F-검증 ) (3) cell별로평균을계산하면 < 표 13.11> 과같다. < 표 13.11> 표 13.10 자료의평균값 성별 광고 1 3 계 남 4.10 3.06 3.43 3.53 여.80.13.50.48 계 3.45.60.97 3.00 0
예 13.3: 팩토리얼디자인에의한이원분산분석의예 가설검증 (/): SPSS 1.0 에의한분석결과 < 표 13.1> 표 13.10 자료의이원분산분석표 원천제곱합 (SS) 자유도평균제곱 (MS) F obs 광고 (A).1811 1.0906 1.81 성별 (B) 5.0139 1 5.0139 100.8 상호작용 (A B).1344.067 1.34 오차.6000 1.0500 합계 7.994 17 (4) 연구가설별로 F-table 에서 F crit 값을찾는다. (5) 상호작용효과 (A B) 에대한검증 : F obs = 1.34 < F crit = F (.05;, 1) = 3.89 따라서, 상호작용효과는유의적이지않다. 광고대안 (A) 의주효과에대한검증 : F obs = 1.81 > F crit = F (.05;, 1) = 3.89 따라서, 광고대안 (A) 의주효과는유의적이다. 성별 (B) 의주효과에대한검증 : F obs = 100.8 > F crit = F (.05; 1, 1) = 4.75 따라서, 성별 (B) 의주효과는유의적이다. 1
예 13.3: 팩토리얼디자인에의한이원분산분석의예 < 그림 13.> 표 13.11 자료의 cell 별평균값 4 광고태도 3 남 여 1 1 3 광고
기술통계 N 평균표준편차표준오차 평균에대한 95% 신뢰구간 하한값상한값 최소값최대값 프로그램 A 6 75.67 8.165 3.333 67.10 84.4 65 87 프로그램 B 7 78.43 7.115.689 71.85 85.01 69 90 판매실적 프로그램 프로그램 C 6 70.83 9.579 3.911 60.78 80.89 59 83 프로그램 D 4 87.75 5.795.898 78.53 96.97 80 94 합계 3 77.35 9.316 1.94 73.3 81.38 59 94 3
분산의동질성에대한검정 Levene 통계량자유도 1 자유도 유의확률 판매실적 1.18 3 19.330 분산분석 제곱합 자유도 평균제곱 F 유의확률 판매실적 집단-간 71.586 3 37.59 3.771.08 집단-내 1196.631 19 6.981 합계 1909.17 4
후검정다중비교 제 5 부자료의분석 - 중급통계 95% 신뢰구간평균차 (I-J) 표준오차유의확률 (I) 프로그램 (J) 프로그램하한값상한값 속변수 : 판매실적 프로그램 A 프로그램 B -.76 4.415.941-16.9 10.76 프로그램 C 4.833 4.58.775-9.0 18.87 프로그램 D -1.083 5.13.17-7.77 3.61 Scheffe Bonferroni 프로그램 B 프로그램 C 프로그램 D 프로그램 A 프로그램 B 프로그램 C 프로그램A.76 4.415.941-10.76 16.9 프로그램C 7.595 4.415.40-5.93 1.1 프로그램D -9.31 4.974.347-4.56 5.91 프로그램A -4.833 4.58.775-18.87 9.0 프로그램B -7.595 4.415.40-1.1 5.93 프로그램D -16.917(*) 5.13.03-3.61-1.3 프로그램A 1.083 5.13.17-3.61 7.77 프로그램B 9.31 4.974.347-5.91 4.56 프로그램C 16.917(*) 5.13.03 1.3 3.61 프로그램B -.76 4.415 1.000-15.76 10.4 프로그램C 4.833 4.58 1.000-8.66 18.3 프로그램D -1.083 5.13.175-7.16 3.00 프로그램A.76 4.415 1.000-10.4 15.76 프로그램C 7.595 4.415.610-5.40 0.59 프로그램D -9.31 4.974.458-3.96 5.3 프로그램A -4.833 4.58 1.000-18.3 8.66 프로그램B -7.595 4.415.610-0.59 5.40 프로그램D -16.917(*) 5.13.0-3.00-1.84 프로그램 D 프로그램A 1.083 5.13.175-3.00 7.16 프로그램B 9.31 4.974.458-5.3 3.96 프로그램C 16.917(*) 5.13.0 1.84 3.00 *.05 수준에서평균차가큽니다. 5
수퍼마켓 디자인 개체 - 간요인 제 5 부자료의분석 - 중급통계 변수값설명 1 3 3 3 3 4 3 1 design A 4 design B 4 3 design C 4 N 기술통계량종속변수 : 판매실적 수퍼마켓디자인평균표준편차 N 1 3 4 합계 design A 17.00. 1 design B 34.00. 1 design C 3.00. 1 합계 4.67 8.6 3 design A 15.00. 1 design B 6.00. 1 design C 1.00. 1 합계 0.67 5.508 3 design A 1.00. 1 design B 3.00. 1 design C 8.00. 1 합계 10.67 11.40 3 design A 6.00. 1 design B.00. 1 design C 16.00. 1 합계 14.67 8.083 3 design A 9.75 7.544 4 design B 6.5 5.439 4 design C 17.00 6.683 4 합계 17.67 9.47 1 6
개체 - 간효과검정종속변수 : 판매실적 소스 제 III 유형제곱합 자유도 평균제곱 F 유의확률 수정모형 895.167(a) 5 179.033 3.609.001 절편 3745.333 1 3745.333 493.890.000 수퍼마켓 348.000 3 116.000 15.97.003 디자인 547.167 73.583 36.077.000 오차 45.500 6 7.583 합계 4686.000 1 수정합계 940.667 11 a R 제곱 =.95 ( 수정된 R 제곱 =.911) 7