제 장. 분산분석 (nalss of Varance: NOV 분산분석은 R. Fsher에의해개발된 3 개이상의모평균에대한분석으로, 측정치의변동을총제곱합 (total sum of squares 으로나타내고이총제곱합을실험과관련된요인 ( 인자의작용 에 대한각자의제곱합으로분해한후, 나머지를오차변동으로해석하는검정법을말한다. 각요인마다분해한분산을오차분산과비교하여특히큰영향을주는인자 ( 요인 가무엇인가를검정하고그결과유의치가있으면요인마다효과추정을행한다. 따라서분산분석은측정치의변동을요인별로분해하여어느요인이특성치에어느정도영향을주는지를파악하는것이라말할수있다. 분산분석은원칙적으로계량치에대해서사용되고그계량치가정규분포를따른다고가정한다.. 분산분석의종류.. 인자 ( 요인 수에의한분류일원분산분석 (one-wa NOV[ 일원배치법 (one-wa classfcaton]: 인자가하나인분석. 다른인자는측정치에경미한영향으로무시할수있거나또는영향이일정할때, 인자 ( 요인 의집단 ( 수준 수가 3 개이상일때그에대한평균사이의차를검증하며실험순서는임의적이다. 이원분산분석 (two-wa NOV[ 이원배치법 (two-wa classfcaton]: 측정치에영향을미치는 인자가둘일때의분석으로두인자 ( 요인 의집단 ( 수준 수조합이반복이없는경우와있는경우로분류하여검증한다. 이분석은두인자모두가모수인자인경우와하나는모수다른하나는변량, 둘다변량인경우가존재하며변동의계수는모두같지만분산의기대치가다르다. 그외에인자가셋인삼원분산분석, 셋이상인다원분산분석이있다... 인자의모형에의한분류 모수효과모형 (Fxed effect model: 기술적으로지정해서제어가능한집단은모수모형이며온도, 압력같은것이이에해당한다. 변량효과모형 (Random effect model: 기술적으로집단을지정해도제어할수없는요인으로예 를들면공정에서임의로뽑은제품의롯트등이다. 혼합효과모형 (Mxed effect model: 위의양자를모두포함한것. 구조모형 : 데이터구조를요인효과와오차로분해하여식으로표현하는것. x j j a x 에대입하면일원배치모형이된다. 를 j j 일원배치의구조모형 : x j a j (. 여기서 xj는데이터, 는데이터전체의평균, 는 집단의모평균, a 는인자 의제 95
집단의효과 ( 모평균에대한오차, j는오차. 모수모형에서 a 0 (. 변수모형에서 ( a 0 (.3..3 실험순서에의한분류 모든실험의순서를임의로행하는것 ( 완전확률화실험 과일부만임의로하는분할법 (splt-plot desgn 의두가지가있다...4 실험 동일한실험에서비교및검토하고자하는집단 ( 수준 의조합이최저한조가있는계획을완비형계획이라하고, 한조도들어있지않는계획을불완비형계획이라한다. 공장실험은대부분완비형이다.. 일원분산분석 ( 일원배치법 개요 : 앞장 (9 장 에서공부한것은두집단 ( 수준 에서나온자료가동일한평균과분포를갖는가를 검정하는것이었다. 일원분산분석을단순하게표현하면이것을확장하여인자 ( 요인 는하나이고 이인자를 k 개집단 ( 수준 으로나뉜표본들을서로비교검정하는것이며, 집단 ( 수준 은 3 개이 상 ( k 3, 실험치 ( 나타나는결과 는하나인것을일원배치분산분석 (onewa NON 이라한다. 일원배치분산분석을이해하기위하여다음의예를보자. [ 예 ] 3 대의기계에서생산되는공구들의파괴강도를측정한후, 각기계가생산한공구의파괴강 도간에차이가있는지를검정하는경우에분산분석을적용할수있다. 여기서파괴강도가분석하 고자하는하나의실험치이고, 3 대의기계는생산된제품에대한집단 ( 수준 으로 k 3 이된다. 좀더자세히말하면어떤특성에대해영향을끼친다고생각하는오직하나의실험결과 ( 여기서는 파괴강도 효과를조사하는것으로다른인자는영향이거의없거나일정하게유지할수있을때 하는분석이며, 집단수 ( 수준수 가 3 개 ( 3 대의기계에서생산된제품 이상으로평균치사이에차 이가있는가를검정한다. 반복수에는제한이없으며실험순서는임의로선택하여실시한다. 총변 동을급간 ( 집단간또는수준간또는요인간 변동과급내 ( 집단내 변동 ( 오차 으로나누어서분산비 를검정한다. 특히일원배치법에서인자구조모형의분산분석표구조는모수형 (fxed effect model 과변량형 (random effect model 모두같다. 확률화실험계획 : 실험단위들을각처리집단에무작위로배정하는계획으로, 일원배치법에어떻게 적용되는지를이해하기위하여다음의예를보자. [ 예 ] 위암에대한서로다른치료제 3 가지,, 3 가있다고할때, 이세가지치료제의효 과를비교하기위한실험계획을세워라. 96
( 풀이 여기서실험치는위암의치료효과이고, 집단수 ( 수준수또는요인수 는,, 3 의서로 다른치료제이다. 실험계획은위암에걸린입원한환자 30 명을대상으로한다고하자. ( 0 명씩,, 3 의세집단으로무작위로나눔. ( 집단에치료제, 집단에치료제, 3 집단에치료제 C 를각각투여. (3 한종류암을치료하는데까지걸린시간을관측하여각약에대한치료효과를분석. 이실험의경우모집단은모든위암환자이며표본은그중 30 명의실험대상인환자, 실험치는치 료약의효과, 수준 ( 집단 은치료제,, C 이다. 반응은평균과분산을이용하여각각의약의치 료평균시간이동일한가를검정한다. 일원배치분산분석에는급간 ( 집단간또는수준간 내에실험의반복수가같은경우와다른경우의 둘로나누어이론적인계산을할수있다... 반복수가같은경우의일원배치법 인자 의수준 ( 집단 수가 k 개 (,, 할경우, 일원배치법의데이터는다음과같이배열된다. 여기서 N, k 이며, 각수준마다 n 번씩동일하게반복실험을 kn 은총실험횟수이다. 표 [-] 일원배치법의데이터배열 ( 반복수가같은경우 구분 처리군 ( 수준별실험의 반복수 : n 인자의수준 ( 요인또는집단 p k k j j j kj 평균 ( 합계 n n n kn 평균 [ 합계 ] [ ] [ ] [ ] [ ] [ ] p p 와 : 실험수준 ( 집단 열의합 : 열의평균 : n j j 에서 n 개데이터의합과평균. 여기서,,, k (.4 n 와 : 전체데이터 N 총합계 : 총평균 : (.5 k kn 개의합과평균 (.6 (.7 N 97
데이터 j의일반화 : j j 인자 수준 ( 집단 의모평균, (,,, k, ( j,,, n 에대해실험전체의모평균 를기준으로표시하면 a (.8 모수모형에서 k ak 0 이므로다음과같이요약할수있다. 반복수가같은일원배치법의구조모형요약 j j a j : 실험오차, 독립적이고 N(0, 분포를따른다. a : 번째처리효과 ( 번째모평균의오차, 단 a, [(,,, k, ( j,,, n] (.9 j j k k (.0 분산분석을하려면먼저집단간에분산의동질성이검정되어야한다. 그것은 z 로 k a k 0 j j 만들어진표로계산한 Levene 의등분산검정통계량 FL 에의해검정된다. <Levene s test: 분산의동질성 (equalt of varances 검정 > 귀무 ( 영 가설 H 0 : k 대립 ( 연구 가설 H : r Levene 의등분산검정통계량 : k : 시료수준 ( 집단 의수 n : 번째수준에속한표본의수 N : 총표본수 ( N n z j z ( k 개의집단에대한분산이동일하다. k : 번째수준 ( 집단 에속한 j 번째표본 j ( k 개중하나이상다른분산이존재한다. F ( N k n ( z z L k n j k ( k ( z z : k 에속한표본수들이모두 n 으로같다면 N kn j, : 번째 group ( 수준 의평균(mean j, : 번째 group 의중앙값(medan z 로만든표로계산한것은 rown-forsthe test에사용된다. j j z z k n zj N j : 모든 j n j z 의평균. zj n : 수준 에대한 j 의평균. 98 j.
검정통계량 FL 은 F( k, N k; 로결정한다. 여기서 FL F( k, N k; 이면 H 0 즉 등분산이채택되고, 크기가반대이면 H 이채택되어 rown-forsthe test에의한통계량이사용 된다. 분산분석은 Levene s test 로등분산이검정되고난후, 평균에대한검정을할수있다. [ 도움말 ] rown-forsthe 통계량을계산하여집단평균의동일성을검정합니다. 등분산을가정 하지않는경우 F 통계량보다이통계량을사용하는것이좋습니다. < 분산분석 : 평균에대한가설의설정과검정 > 귀무 ( 영 가설 H 0 : k 대립 ( 연구 가설 H : 또는 a a a k 0 ( 모평균은모두같다. 가모두같다고할수없다. 또는 99 a 가모두 0 이라고할수없다. 이들가설은분산분석표를작성하여검정할수있다. 이때사용되는수식들은다음과같다. 측정값 j와총평균 의편차, 즉 ( j 의제곱합을총제곱합 (total sum of square: SS 또는총변동 (total varance 이라한다. 총변동 ( 총제곱합 은다음과같이분해된다. 총제곱합 : 여기서 따라서 k j k n j (. j SS ( S ( n [( ( ] j k n [( j ( j ( ( ] j k n k n k n [( j ( j ( ( j j j ( n n( 0 n n n n j j j j j j j n j S 는 k n S ( j j k n k [( j n ( j (. (. 의우측첫째항은각집단내에서편차의제곱합이므로급내변동 (varance wthn group 또는오차변동 ( 잔차제곱합 이라하고 SS( S 로나타낸다. 두번째항은인자 의각집단의 효과차이로인한변동이므로급간변동 (varaton between group 또는 의변동 ( 처리제곱합 이 라하며 SS( S 로표시한다. 즉 S S S (.3 총변동 (total varance: 급간변동 (varaton between group: 급내변동 (varaton wthn group: k n j (.4 j S ( SS ( k k n ( ( ( j (.5 S SS n k n ( [( j (.6 j S SS
변동의자유도 S ( 총변동 의자유도 S ( 급간변동 의자유도 S ( 급내변동 의자유도 : kn (.7 : k (.8 : ( kn ( k k( n (.9 변동들을계산할때에다음의공식을사용할수도있다. < 변동의계산공식 > ( 수정항 (correcton term: C : ( 총변동 : (3 급간변동 : k n S ( j j S n C k k ( n C, ( N kn (.0 N k n jc (. j (. (4 급내변동 : S S S (.3 S 와 S 를자유도로나누어분산으로나타낸것을각각처리평균제곱 ( MS MS V 차평균제곱 ( MS MS V 이라한다. 여기서 M 은 mean( 평균 을의미한다. MS MS 와 MS MS (5 처리평균제곱 : (6 잔차평균제곱 : V V V ( 구룹간평균제곱 와 검정통계량 : F 를분산이라는의미에서 V 와 S V 로각각쓰기로하자. 과잔 (.4 S (.5 V V ( 구룹내평균제곱 의비가검정통계량 Ft 이다. t (.6 V 반복수가같은경우일원배치법의분산분석표는다음과같이작성된다. 표 [-] 일원배치분산분석 ( 반복수가같은경우 변동요인제곱합 ( SS 자유도평균제곱 Ft 값구룹간 ( 처리 SS( S k S V( MS V Ft S V 구룹내 ( 오차 SS( S kn ( V( MS 합계 SS ( S kn 검정 : 유의수준 일때검정통계량 F F(, ; t 이면 H0 가기각된다. 즉요인 ( 이특성 치에영향을미친다고말할수있으며요인의수준간에유의한차이가있다고결론을내릴수있 00
다. 다른말로하면검정통계량 은경우 Ho 를기각하고 H 을채택한다. F 를확률로전환했을때유의확률 PF ( 가유의수준 보다작 t t < 사후분석 : 분산분석후의추정및검정 > 분산분석의 Ft -검정에의하여인자 ( 요인 의수준 ( 집단 간에유의한차가있으면 H0 가기각된다. 그결과인자의각수준에서모평균 하여야한다. 이것은다음의세가지에대해추정이가능하다. 가다를경우처리효과 (treatment effect 에대한분석을 ( 각수준의모평균추정 ( 모평균의점추정 : n ( (.7 j n j ( 모평균의구간추정 ( 각수준마다모평균의신뢰한계 V V t(, t(, (.8 n n ( 각수준의모평균차에대한추정 ( 모평균차의점추정 : a a (, r,,3, (.9 r r r ( 모평균차의구간추정 : 모평균의차 r 에대한신뢰율 (- 의신뢰구간은다음과같이 구할수있다. V V ( r t(, r ( r t(, (.30 n n 신뢰구간에서 0 을포함한다면 와 r 간에유의한차가있다고말할수없다. (3 분산의추정모수모형일때는수준마다모평균을구하지만변량모형일때는수준간의변동 ( 분산 을추정할필요가있다. 일원배치법에서평균제곱은 ( V n (.3 V ( (.3 이들로부터다음과같이분산을추정할수있다. ( V ( V (.33 n V V n SPSS 통계처리문제 ( 반복수가같은경우의일원분산분석 0
[ 보기 _] 어느기계공장에서제품의수율에미치는요인은사용재료에달려있다고믿고있 다. 그래서재료를네수준 ( 집단 으로구분하여각수준에서동일하게반복 6 회를실험하고순서 는임의로행한결과아래와같은결과를얻었다. (a < 수준 ( 집단 별모평균신뢰구간 > 수준별표준편차와표준오차를계산하고모평균이가질수있는범위 ( 신뢰구간 를구하여라. (b <Levene s test> 재료수준 ( 집단 들의측정치들이서로등분산인지유의수준 0.05 에서검정하라. (c < 분산분석 > 수준간에평균차이 ( 사용재료간에수율의차이 가있는지유의수준 0.05 에서양쪽검정하라. (d < 사후분석 > 분산분석결과 Ft 값의유의확률이유의수준 보다작다면 H0 가기각되고 H 이채택된다. 즉 재료에따라제품의수율에영향을미친다고할수있다. 이경우각재료수준간의모평균차에 대한 95% 신뢰구간과검정통계량그리고검정통계량에의한유의확률을각각구하여라. 표 [-3] 네종류재료에따른제품수율 ( 단위 : % 처리군측정수 3 4 5 6 인자의수준 ( 재료의구분 3 4 76 8 79 8 80 75 87 74 78 83 88 76 79 78 86 78 83 85 84 73 74 80 8 70 각각의값은재료 에따른수율 이다. j 합계 470 483 3 506 4 45 9 평균 78.333 80.50 3 84.333 4 75.333 79.65 표준편차 s 3.4 s 3.69 s3 3.386 s4 3.88 s 4.689 표준오차 D.8 D.477 D3.38 D4.585 D 0.957 ( 풀이 표에나타난표준편차와표준오차는다음과같이계산된것이다. 수준 ( 집단 별실험횟수와총실험횟수 : n 6, N 4 분산공식 : s n ( j j n 수준별표준편차 : [(76 78.33 (74 78.33 ] (49.333 9.867 5 5 s, s 9.867 3.4 s s 0
s [(8 80.50 (80 80.50 ] (65.50 3.0, s 5 5 3.0 3.69 s3 [(79 84.33 (8 84.33 ] (57.333.467, s3 5 5.467 3.386 s4 [(8 75.33 (70 75.33 ] (75.333 5.07, s4 5 5 5.067 3.88 전체에대한분산 : s k n ( j j N [(76 79.65 (70 79.65 ] (505.65.984 3 3 s 전체에대한표준편차 : s.984 4.689 s D n 3.4 3.69 D.8, D.477, 6 6 3.386 3.88 D3.38, D4.585 6 6 수준 ( 집단 별표준오차 전체에대한표준오차 : s 4.689 D 0.957 N 4 (a < 수준 ( 집단 별모평균신뢰구간 ( 범위 > 유의수준 0.05 ( 양쪽검정 일때수준별신뢰구간 ( 모평균범위 수준 ( 집단 별및총자유도 : n 6 5, 4 수준별 t -분포값 : t(, / t(5,0.05.57 n 전체 t -분포값 : t(, / t(3,0.05.069 t -분포: http://www.statdstrbutons.com/t/ t( n, t(5,0.05 와 t(, t(3,0.05 의값. (a [p-value] box 에 0.05( 유의수준 입력. (b [d.f.] box 에 5 또는 3 을각각입력. [d.f.: degree of freedom] (c [two tals] 를선택 ( 양쪽검정. [t-value] box에서 t(5,0.05.57 그리고 t(3,0.05.069 를각각얻는다. 구간공식 : t(, D t(, D t(5,0.05 D (.57(.8 3.96 t(5,0.05 D (.57(.477 3.797 03
t(5,0.05 D3 (.57(.38 3.553 t(5,0.05 D (.57(.585 4.075 4 t(3,0.05 D(.069(0.957.980 수준 ( 집단 별모평균범위계산모평균신뢰구간 78.333 3.96 ( 78.333 3.96 80.500 3.797 ( 80.500 3.797 75.04 ( 8.63 84.333 3.553 ( 84.333 3.533 76.70 ( 84.30 3 3 75.333 4.075 ( 75.333 4.075 80.78 ( 87.88 4 4 7.6 ( 79.4 79.65.980 ( 79.65.980 : 77.65 ( 8.6 (b <Levene s test: 수준 ( 집단 간등분산검정 > Levene s test를위한 z 표는다음과같다. 표 [-4] Levene s test 표 j j z j z j z 3 j 4 j.333.5 5.333 5.667.667 5.5.667.333 0.333.5 3.667 0.667 0.667.5.667.667 4.667 4.5 0.333.333 4.333 0.5.333 5.333 z 합계평균 합계 4 7 6 8 65 평균 z.333 z.833 z3.667 z4 3.0 z.708 등분산가설및검정통계량 귀무 ( 영 가설 H 0 : 3 4 ( 4 개의수준에대한분산이동일하다. 대립 ( 연구 가설 H : 4 개중하나이상의다른분산이존재한다. Levene 등분산검정통계량 F L : F k ( N k n( z z ( k ( z z L k n j j 다음의표는 Levene s test 의분모에사용하는값을얻기위하여작성된표이다. 04
표 [-5] k n ( z j j jz 계산에필요한수표 ( z j z ( z j z ( z3 j z3 ( z 4 j z 합계 4 0.777 7.07 7.3 0.443 7.3 0.779 4.0 0..0 5.443.775 0..0 0. 5.447.779 5.447 0.445 4.0 5.443 0. 5.443 합계 6.667 7.333 4.667.333 70.0 여기서 Levene 식에있는계산값들은다음과같다. k n ( z (0.333 (.777.8333 (5.443 3.0 70.00 j jz k.459 F L n( z z 6[(.333.708 (.833.708 (.667.708 (3.0.708 (4 4(.459 0.39 (4 (70 수준 ( 집단 의자유도 : k 3 자료자유도 N k 4 4 0 일때 F -분포값 : F( k, N k; F(3,0;0.05 3.099 유의수준 0.05 F - 분포 : http://www.statdstrbutons.com/f/ F(, ; F(3,0; 0.05 ( (a [p-value] box 에 0.05 입력. 의값 (b [numerator d.f.] box 에 3 입력. (c [denomnator d.f.] box 에 0 입력. (d [rght tal] 을선택. [F-value] box 에서 3.099 를얻는다. ( FL 0.39 확률 ( 유의확률 값 (a [F-value] box 에 0.39 입력. (b [numerator d.f.] box 에 3 입력. (c [denomnator d.f.] box 에 0 입력. (d [rght tal] 을선택. [p-value] box 에서 0.935 를얻는다. 05
등분산검정결과 ( 검정통계량에의한검정 : FL 0.39 F(3,0;0.05 3.099 이기때문에귀무가설 o 채택된다. ( 유의확률에의한검정 : PF ( L 0.39 0.935 0.05 이기때문에 o 검정통계량에의한검정또는유의확률에의한검정에서귀무 ( 영 가설 ( 집단 간은등분산이다. 따라서수준간평균비교 ( 분산분석 가가능하다. H 가채택된다. H 가 Ho 가채택되었다. 즉수준 (c < 분산분석 > 수율에미치는영향은요인이하나인재료뿐이므로일원배치법으로평균을비교한다. 수준은재료의종류인,, 4로 k 4 이며여기서일원인자는재료이다. 귀무가설 ( 영가설 H 0 : 3 4 ( 재료종류에관계없이수율의평균은같다. 대립 ( 연구 가설 H : 재료종류에따라수율의평균은적어도하나이상같지않다. 가설을검정하려면분산분석표를작성하여야하고그것을위해다음의계산이필요하다. 총변동 (otal Sum of Square or otal Varance: SS S : k n ( j [(76 79.65 (80 79.65 (70 79.65 ] 505.65 j S 급간변동 (Varaton between Group: SS S : k (75.333 79.65 ] 58.5 S n ( 6[(78.333 79.65 (80.5 79.65 (84.333 79.65 급내변동 (Varaton wthn Group: SS S : S S S 505.65 58.5 47.5 변동의자유도 : 33 0 S 와 k n ( j 또는 S S S j S S 를자유도로나누면분산이된다. 이들의이름은처리평균제곱 ( MS V MS 제곱 ( V 이라하고이들의비가검정통계량 F 이다. S 58.5 처리평균제곱 : V 86.04 3 S 47.5 잔차평균제곱 : V.375 0 V 86.04 검정통계량 F : F 6.953 V.375 계산값들에의한분산분석표는다음과같다. 과잔차평균 06
표 [-6] 일원배치분산분석표 ( 반복수는동일 변동요인제곱합자유도평균제곱 Ft 값 유의확률 구룹간 구룹내 S 58.5 S 47.500 3 0 V 86.04 V.375 Ft 6.953 0.00 합계 S 505.65 3 검정통계량 : Ft 6.953 F -분포값 : F(, ; F(3, 0; 0.05 3.099 F - 분포 : http://www.statdstrbutons.com/f/ F(, ; F(3,0; 0.05 ( (a [p-value] box 에 0.05 입력. 의값 (b [numerator d.f.] box 에 3 입력. (c [denomnator d.f.] box 에 0 입력. (d [rght tal] 을선택. [F-value] box 에서 3.099 을얻는다. ( Ft 6.953 의확률 ( 유의확률 (a [F-value] box 에 6.953 입력. (b [numerator d.f.] box 에 3 입력. (c [denomnator d.f.] box 에 0 입력. (d [rght tal] 을선택. [p-value] box 에서 0.00 를얻는다. 검정통계량에의한검정 : Ft 6.953 F(3, 0;0.05 3.099 이므로귀무 ( 영 가설 0 대립 ( 연구 가설 H 을채택한다. H 는기각하고 유의확률에의한검정 : 유의확률은 PF [ t (6.953] 0.00 이다. 이것은유의수준 0.05 보다작 기때문에귀무 ( 영 가설 H0 는기각하고대립 ( 연구 가설 H 을채택한다. 즉유의수준 0.05 ( 신뢰 수준 95% 에서재료에따라제품의수율은다르다고할수있다. (d < 사후분석 > H0 가기각되면각각의모평균차에대한신뢰구간을결정하는사후분석이필요하다. 차에대한신뢰범위 ( 신뢰한계 는다음과같다. 모평균차 78.33 80.50.7 3 78.33 84.33 6.0 07
4 78.33 75.33 3.0 3 80.50 84.33 3.83 4 80.50 75.33 5.7 3 4 4.33 75.33 9.0 표준오차 (Standard rror: 모평균차에대한검정통계량 (.7 V / n D.03 V (.375 D.03 n 6.068 6 3.0 3.83 3.954, 4.477, 3.886,.03.03.03 5.7 9.0 4.546, 34 4.43.03.03 t -분포: http://www.statdstrbutons.com/t/ ( t(, t(0,0.05 값 (a [p-value] box 에 0.05 입력. (b [d.f.] box 에 0 입력. (c [two tals] 를선택. [t-value] box에서.086 을얻는다. t(, t(0,0.05.086 (, 3,, 34 확률 ( 유의확률 (a [d.f.] box 에 0 입력 (b [two tals] 선택 (c [ t -value] box 에.068,.954,.477,.886,.546, 4.43 을각각입력 [p-value] box 에서다음의확률을얻는다. p (.068 0.98, p ( 3.954 0.008, p ( 4.477 0.55 p ( 3.886 0.074, p ( 4.546 0.09 p ( 34 4.43 0.000 양쪽검정구간공식 : V V ( r t(, r ( r t(, n n 여기서 n n n n3 n4 6, 33 0, 0.05, V.375 V t(, (.086(.03 4.4 n 08
구간계산평균차신뢰구간유의확률.7 4.4.7 4.4 6.00 4.4 3 6.00 4.4 3 3.00 4.4 4 3.00 4.4 4 3.83 4.4 3 3.83 4.4 3 5.7 4.4 4 5.7 4.4 4 9.00 4.4 3 4 9.00 4.4 3 4 6.4.07 0.98 0.4.76 0.008.4 7.4 0.55 8.07 0.4 0.074 0.93 9.4 0.09 4.76 3.4 0.000 검정결과 :, 3,, 34 의유의확률로보면 과, 과 4, 그리고 와 3 가유의수준 0.05 에서같다고할수있고다른것은같다고할수없다. SPSS 통계처리 [ 재료수율.sav] SPSS 데이터편집기에표 [_3] 의데이터를변수명 [ 재료 ]: = 재료, = 재료, 3= 재료 3, 4= 재료 4 로구분하고, 해당하는수율을변수명 [ 수율 ] 로각각입력하여통계들을구한다. 분석 > 평균비교 > 일원배치분산분석 보조창에서 [ 수율 ] 을종속변수, [ 재료 ] 를요인으로각각이동. 옵션단추를눌러모수및변량효과 를제외한통계량을모두선택. 계속 > 확인 일원배치분산분석결과 기술통계 수율 재료 재료 재료 3 재료 4 합계 평균에대한 95% 표준 표준 신뢰구간 N 평균 편차 오차 하한값 상한값 최소값 최대값 6 78.33 3.4.8 75.04 8.63 74 83 6 80.50 3.69.478 76.70 84.30 75 85 6 84.33 3.386.38 80.78 87.89 79 88 6 75.33 3.88.585 7.6 79.4 70 8 4 79.63 4.689.957 77.65 8.60 70 88 분산의동질성에대한검정 수율 Levene 통계량 자유도 자유도 유의확률.39 3 0.936 분산분석 수율 집단 - 간집단 - 내합계 제곱합 자유도 평균제곱 F 유의확률 58.5 3 86.04 6.953.00 47.500 0.375 505.65 3 09
수율 Welch rown-forsthe a. 비동시적 F 분포 평균동질성검정 통계량 a 자유도 자유도 Sg. 6.09 3.08.0 6.953 3 9.55.00 평균도표 검정결과 ( Levene s test 는유의확률이 0.936 으로유의수준 0.05 보다크기때문에자료들은등분산이다. 따라서평균동질성검정, 즉 Welch, rown-forsthe 검정은사용하지않는다. ( SPSS 에서얻은분산분석표내용은위에서이론으로계산한값과동일하다. 여기서분산분석 Ft 의유의확률 0.00 는유의수준 0.05 보다작기때문에 H0 가기각된다. 즉제품의수율은 재료에따라다르다. < 사후분석 > H 이채택될경우평균값들의대소관계를파악하는방법을다중비교라고하며, 이는자료가등 분산일때분산분석표에서검정한결과가평균의차이를인정한경우나이분산인경우 Welch 와 rown-forsthe 의검정에서둘다유의한경우만실시하는절차이다. 사후분석은등분산인경우 : LSD, Scheffe, uke, S-N-K, Duncan, 이분산인경우 : amhane,, Dunnet, 3, Games-Howell, Dunnett 의 C. 중에서합당하다고생각하는것을선별하여출력한다. 0
[ 도움말 ] 일원배치분산분석사후분석검정평균들간에차이가있다고판단되면사후분석범위검정과대응별다중비교를수행하여차이가나는평균을판별할수있습니다. 범위검정은차이가없는평균의동일집단군을식별하며, 대응별다중비교는각대응평균간차이를검정하고유의수준 0.05 에서다른집단평균이유의하다는것을행렬에별표로나타냅니다. 분석 > 평균비교 > 일원배치분산분석 재설정을누르고 [ 수율 ] 을종속변수로, [ 재료 ] 를요인으로이동 사후분석을클릭하고등분산을가정함중에서 LSD 와 Duncan 을선택. 계속 > 확인 사후분석결과 종속변수 : 수율 LSD (I 재료재료 재료 재료 3 재료 4 (J 재료재료 재료 3 재료 4 재료 재료 3 재료 4 재료 재료 재료 4 재료 재료 재료 3 *..05 수준에서평균차가큽니다. 동일집단군 다중비교 95% 신뢰구간 평균차 (I-J 표준오차 유의확률 하한값 상한값 -.67.03.99-6.40.07-6.000*.03.008-0.4 -.76 3.000.03.55 -.4 7.4.67.03.99 -.07 6.40-3.833.03.074-8.07.40 5.67*.03.09.93 9.40 6.000*.03.008.76 0.4 3.833.03.074 -.40 8.07 9.000*.03.000 4.76 3.4-3.000.03.55-7.4.4-5.67*.03.09-9.40 -.93-9.000*.03.000-3.4-4.76 수율 유의수준 =.05에대한부집단 재료 N 3 Duncan a 재료4 6 75.33 재료 6 78.33 78.33 재료 6 80.50 80.50 재료3 6 84.33 유의확률.55.99.074 동일집단군에있는집단에대한평균이표시됩니다. a. 조화평균표본크기 = 6.000 을 ( 를 사용 사후분석결과 : LSD 의다중비교를보면앞서이론으로계산한모평균차의신뢰구간과유의확률 이동일함을알수있다. Duncan의동일집단군비교는평균이가장작고유의확률이 0.05를넘는것을짝을지어비교한결과이다. 예를들면재료4와재료은평균이각각 75.33과 78.33이고유의확률은 0.55로유의수준 0.05보다크기때문에유의수준내에서두평균은같다고할수있다. 다른것도같은방법으로해석한다.
.. 반복수가다른경우의일원배치법 실험횟수가같지않거나결측치가있는경우로자료의구조는표 [-] 에서시험횟수만 n 이 n 로대치된다. 그리고검정방법도시험횟수가같은경우와동일하다. 반복수가다른일원배치법의구조모형 a, (,,, k, ( j,,, n j j k k 총평균 : a : 번째처리효과, 단 na 0 j : 실험오차이며, 독립적이고 자료의총개수 : k N n N(0, 이다. 변동분해및표시반복수가같은경우와마찬가지로다음과같이표시된다. S ( SS ( k n j S ( SS S ( SS S ( SS j 총변동 (total varance: k n k [( j n ( j S ( k n j 급간변동 (varaton between group: 급내변동 (varaton wthn group: j k S n ( k n [( j 또는 S S S S j 변동의자유도 S 의자유도 ( 총자유도 : N S 의자유도 : k S 의자유도 : N k S 와 S 를자유도로나누어분산으로나타내면이것은각각처리평균제곱 ( MS MS V 과잔차평균제곱 ( MS MS V 이다. 여기서 M 은 mean( 평균 을의미한다. 분산의표시 처리평균제곱 : V S k
잔차평균제곱 : V S N k 검정통계량 F t : F t V V 이들을종합하여표로나타내면다음과같다. 표 [-7] 반복수가같지않은일원배치법의분산분석표 변동요인제곱합 ( SS 자유도평균제곱 F t 값 처리 오차 S ( SS S ( SS k N k 합계 S ( SS N 검정 : 유의수준 일때검정통계량 t V( MS S / V ( MS S / F 가 F F(, ; t V / V 이면귀무 ( 영 가설 H0 가기각되고 대립가설 H 이채택된다. 즉요인이측정치에영향을미친다 ( 요인의수준간에유의한차이가있 다 고결론을내릴수있다. 그이후의방법은반복수가같은경우와동일하다. SPSS 통계처리문제 ( 반복수가다른경우일원분산분석예 [ 보기 _] 세대의기계에서생산되는공구들의파괴강도가차이가있는지를알아보기위하여 다음과같은실험값들을수집하였다. 이론으로아래내용을각각계산하고, SPSS 통계프로그램에 서얻은결과와비교하라. 여기서유의수준은 0.05 ( 양쪽검정 이다. (a 수준별그리고전체에대한표준편차와표준오차그리고모평균이가질수있는값의범위. (b Levene s test 에의한수준간등분산검정. (c 분산분석에의한평균검정. (d H ( 모평균이다름 이채택될경우의사후분석으로모평균차범위. 표 [-8] 파괴강도데이터 기계 36 4 4 49 기계 40 48 39 45 44 기계 3 35 37 4 34 3 ( 풀이 (a < 표준편차, 표준오차및신뢰범위 > 기계은, 기계 는, 기계 3 은 3 로하고하나의요인효과인파괴강도평균을각각,, 3 그리고총평균을 로표시하며, 계산을위해다음의계산용표를참고하자. 3
표 [-9]: 요인별파괴강도계산표 처리군실험횟수 3 4 5 인자 ( 요인 의수준 ( 기계의종류 3 36 40 35 4 48 37 4 39 4 49 45 34 44 3 각값은기계에 따른제품의강도 합계 68 6 3 80 564 평균 4 43. 3 36 40.86 표준편차 s 5.354 s 3.70 s3 3.808 s 5.50 표준오차 D.677 D.655 D3.703 D.377 수준 ( 집단 별자유도 : 4 3, 5 4, 3 5 4 총자유도 : 4 3 수준 ( 집단 별분산, 표준편차및표준오차 : s ( [(36 4 (49 4 ] (86 8.667 3 3 5 j j s ( [(40 43. (44 43. ] (54.8 3.70 4 4 6 j j s ( [(35 36 (3 36 ] (58 4.50 4 4 4 3 3j 3 3 j 표준편차표준오차 ( D s / n s 8.667 5.354 D.677 s 3.70 3.70 D.655 s3 4.50 3.808 D3.703 전체분산, 표준편차및표준오차 : s ( [(36 40.86 (3 40.86 ] 4 n j j 3 s 6.58 5.50 D.377 (344.857 6.58 3 t - 분포 : http://www.statdstrbutons.com/t/ t (3,0.05, t (4,0.05, t(3,0.05 분포양쪽검정값 4
(a [p-value] box 에 0.05 입력. (b [two tals] 선택 (c [d.f.] box 에 3, 4, 3 을각각입력 [ t -value] box에서 3.8,.777,.6을차례로얻을수있다. t(, t(3,0.05 3.8 t(, t( 3, t(4,0.05.777 t(, t(3,0.05.6 양쪽검정구간공식 : t(, D t(, D 계산 4 (3.8(.677 4 (3.8(.677 수준별구간범위 43. (.777(.655 43. (.777(.655 33.48 ( 50.5 36 (.777(.703 36 (.777(.703 38.6 ( 47.79 3 3 3.7 ( 40.73 전체모평균범위 40.86 (.604(.377 40.86 (.604(.377 37.3 ( 43.6 (b <Leven s test( 등분산검정 > 귀무 ( 영 가설 H 0 : 3 ( 각집단에대한분산이동일하다. 대립 ( 연구 가설 H : 3 개중하나이상다른분산이존재한다. Levene 의검정통계량 : F ( N k n ( z z L k n j k ( k ( z z j 분산분석은수준간에등분산을가정한분석이므로제일먼저해야할일은 Levene 의등분산검정 이다. 여기서는자료가크지않기때문에 Levene s test 를이해하기위하여자세히계산하였다. z 는 z 로만들어지는값들로다음과같이계산한다. j j j z j components를만드는방법, 그리고이들에의한 z j 표. z 36 4 6 z 4 4 z 4 4 0 3 3 z 34 36 34 34 3 z 3 36 4 35 35 3 5
이들값에의해만들어진 Leven s test zj표는다음과같다. 표 [-0] Levene s test zj 표 z j z j z 3 j 합계평균 6 3. 4.8 0 4. 6 7.8 0.8 4 합계 4 4.8 4 4.8 평균 z 3.5 z.96 z3.8 z 3.057 3 n ( z (6 3.5 ( 3.5 (0 3.5 (7 3.5 j jz (3..96 (4.8.96 (4..96 (.8.96 (0.8.96 (.8 (.8 (6.8 (.8 (4.8 66.79 3 n z z ( 4(3.5 3.057 5(.96 3.057 5(.8 3.057 Lenene 검정통계량 : 0.785 0.047 0.330.6 F k ( N k n ( z z (4 3(.6 L k n ( k ( z (3 (66.79 j jz 0.0957 자유도 k 3, N k 4 3 및유의수준 0.05 의 F 분포경계값 : F( k, N k; F(,;0.05 3.98 F - 분포 : http://www.statdstrbutons.com/f/ F(, ; F(,.0.05 의값과 F 0.0957 의확률 ( 유의확률. F(, ; F(,.0.05 ( (a [p-value] box 에 0.05 입력. 의값 (b [numerator d.f.] box 에 입력. (c [denomnator d.f.] box 에 입력. (d [rght tal] 을선택. [F-value] box 에서 3.98 를얻을것이다. ( FL 0957 의확률 ( 유의확률 (a [F-value] box 에 0.0957 입력. (b [numerator d.f.] box 에 입력. L 6
(c [denomnator d.f.] box 에 입력. (d [rght tal] 을선택. [p-value] box 에서 0.909 를얻을것이다. Levene s test 결과 : F 0.0957 F(,;0.05 3.98 이므로수준 ( 집단 간의자료들은등분 L 산이다. 또한유의확률 pf ( 0.0957 0.909 는유의수준 0.05 보다크기때문에 Ho 가채 택된다. 따라서수준간분산은등분산이므로다음의분산분석이가능하다. (b < 분산분석 > 가설및가설을검증하기위한변동계산 귀무 ( 영 가설 H 0 : 3 ( 기계에따라강도에영향을미치지않는다. 대립 ( 연구 가설 H : 최소한기계이상은강도에영향을미친다. 총변동 : 급간변동 : S ( (36 40.86 (4 40.86 (49 40.86 k n j k j (40 40.86 (48 40.86 (44 40.86 (35 40.86 (37 40.86 (3 40.86 344.86 ( 4(4 40.86 5(43. 40.86 5(36 40.86 46.06 S n 급내변동 : S S S 344.86 46.06 98.80 자료수 : n 4, n 5, n3 5 총자료수 : N 455 4 수준수 : k 3 변동의자유도 N 4 3 k 3 N k 4 3 S 46.057 처리평균제곱 : V 73.09 S 98.80 잔차평균제곱 : V 8.073 V 73.09 검정통계량 : Ft 4.04 V 8.073 계산된값들에의한분산분석표는다음과같다. 7
표 [-] 수준 3 인기계강도의분산분석표 변동요인제곱합 ( SS 자유도평균제곱 F t 값 유의확률 구룹간 구룹내 S 46.057 S 98.800 V 73.09 V 8.073 4.04 0.048 합계 S 344.857 3, 과유의수준 0.05 에대한 F 분포의값 : 자유도 F(, ; F(,; 0.05 3.98 F - 분포 : http://www.statdstrbutons.com/f/ F(, ; (,;0.05 F 의값과 L F(, ; F(,;0.05 ( (a [p-value] box 에 0.05 입력. 의값 (b [numerator d.f.] box 에 입력. (c [denomnator d.f.] box 에 입력. (d [rght tal] 을선택. [F-value] box 에서 3.98 을얻을것이다. ( Ft 4.04 의확률 ( 유의확률 (a [F-value] box 에 4.04 입력. (b [numerator d.f.] box 에 입력. (c [denomnator d.f.] box 에 입력. (d [rght tal] 을선택. [p-value] box 에서 0.048 를얻을것이다. F 의확률 ( 유의확률 검정결과 : F 4.04 F(,;0.05 3.98 이므로 0 H 가기각되고 H 이채택된다. 똑같은 논리로유의확률 PF ( 4.04 0.048 은유의수준 0.05 보다작기때문에 Ho 가기각되고 H 이채택된다. 즉 기계에따라제품의강도에영향을미친다 고말할수있다. 다른말로하면 기계에따라제품의강도가유의미하다 이다. (c < 사후분석 > H0 가기각되면수준간평균차의신뢰구간, 검정통계량및이에대한신뢰수준을구한다. ( r 두수준 ( 집단 간평균차의검정통계량 : V / n 두수준 ( 집단 간평균차의신뢰수준 : r ( r ( r t(, t(, V / n r 8
위의수식을양쪽검정모평균차에대한것으로다시쓰면다음과같다. V V ( r t(, r ( r t(, n n r r 여기서 nr 은두수준 ( 집단 간실험횟수를조화평균한값이다. 실험횟수 : n 4, n n3 5 실험 (,, 또는실험 (, 3 의조화평균실험횟수 : n n3 4.444 (/ 4 (/ 5 0.45 실험 (, 3 의조화평균실험횟수 : n 3 5 (/ n (/ n (/ 5 (/ 5 표준오차 (Standard rror: S D D 3 3 계산값 : D로표시 : V (8.073 D.85 n 4.444 V (8.073.689 n 5 3 3 V t(, t(, 0.05 D(or D 3 (.0(.85 6.77 n V t(, t(, 0.05 D3 (.0(.689 5.98 n 검정통계량 3 ( 4 43. V / n.85 ( 4 36 V / n.85 3 3 3 ( 43. 36 V / n.689 3 3 3.04 0.408.6776 t -분포: http://www.statdstrbutons.com/t/ ( t(, t(,0.05 값 (a [p-value] box 에 0.05 입력. (b [d.f.] box 에 입력. (c [two tals] 를선택. [t-value] box 에서.0 을얻을것이다. (, 3 와 3 유의확률 (a [d.f.] box 에 입력 9
(b [two tals] 선택 (c [ t -value] box 에 0.408,.04,.6776 를각각입력 [p-value] box 에다음의확률을각각얻을수있다. p ( 0.408 0.68 p ( 3.04 0.059 p ( 3.776 0.0 모편균차구간계산모평균차의신뢰구간신뢰확률. 6.77. 6.77 6 6.77 3 6 6.77 3 7. 5.98 3 7. 5.98 3 7.48 5.08 모 0.68 0.8.8 0.059.8 3. 0.0 위의계산값들을 SPSS 통계에서확인하자. SPSS 통계처리 [ strength.sav] 분석 > 평균비교 > 일원배치분산분석보조창이뜨면 [ 파괴강도 ] 를종속변수로, [ 기계종류 ] 를요인으로각각이동. 옵션단추를눌러통계량모두를선택. 계속 > 확인 일원배치분산분석결과 기술통계 파괴강도 기계 기계 기계 3 합계모형 고정형식효과변량효과 평균에대한 95% 표준 표준 신뢰구간 최소 최대 N 평균 편차 오차 하한값 상한값 값 값 성분- 간분산 4 4.00 5.354.677 33.48 50.5 36 49 5 43.0 3.70.655 38.60 47.80 39 48 5 36.00 3.808.703 3.7 40.73 3 4 4 40.9 5.50.377 37.3 43.6 3 49 4.5.36 37.78 4.79.97 30.40 50.7.837 분산의동질성에대한검정 파괴강도 Levene 통계량 자유도 자유도 유의확률.096.909 0
분산분석 파괴강도 집단 - 간집단 - 내합계 제곱합 자유도 평균제곱 F 유의확률 46.057 73.09 4.04.048 98.800 8.073 344.857 3 파괴강도 Welch rown-forsthe a. 비동시적 F 분포 평균동질성검정 통계량 a 자유도 자유도 Sg. 4.455 6.68.059 3.783 8.40.068 평균도표 분석 : ( 먼저 분산의동질성에대한검정 을보면유의확률이 0.909 으로유의수준 0.05 보다크기때문에등분산이가정되어 평균동질성검정의 Welch와 rown- Forsthe 의분석은사용하지않는다. ( 분산분석표에서유의확률은 0.048 이므로유의수준 0.05 보다낮아 H0 가기각된다. 즉, 세 대의기계에서생산되는공구들의파괴강도는차이가있다. 는결론을얻는다. 사후분석 : 악한다. Ho 가기각되고 H 이채택되었기때문에사후분석으로평균값들의대소관계를파 분석 > 평균비교 > 일원배치분산분석 > 사후분석 등분산을가정함에서 LSD 와 Duncan 을선택. 계속 > 확인
사후분석결과 다중비교 종속변수 : 파괴강도 LSD (I 기계종류기계 기계 기계 3 (J 기계종류기계 기계 3 기계 기계 3 기계 기계 *..05 수준에서평균차가큽니다. 95% 신뢰구간 평균차 (I-J 표준오차 유의확률 하한값 상한값 -.00.85.68-7.48 5.08 6.000.85.059 -.8.8.00.85.68-5.08 7.48 7.00*.689.0.8 3. -6.000.85.059 -.8.8-7.00*.689.0-3. -.8 동일집단군 Duncan a,b 기계종류기계 3 기계 기계 유의확률 파괴강도 유의수준 =.05에대한 부집단 N 5 36.00 4 4.00 4.00 5 43.0.055.676 동일집단군에있는집단에대한평균이표시됩니다. a. 조화평균표본크기 = 4.65 을 ( 를 사용 b. 집단크기가같지않습니다. 집단크기의조화평균이사용됩니다. 제종오류수준은보장할수없습니다. 검정분석 : ( LSD 다중비교의 95% 신뢰구간은이론으로계산한신뢰구간과동일하고또한표 준오차및유의확률도계산값과같음을확인할수있다. ( Duncan 의동일집단군비교에서기 계 3 과기계 의유의확률은 0.055 이므로이것은유의수준 0.05 보다크기때문에이수준에서평 균이같다고할수있다. 또한기계 과기계 는유의확률이 0.676 으로유의수준 0.05 보다훨 씬크기때문에두평균은서로근접되어있음을수있다. SPSS 통계처리문제 ( 반복수가다른경우일원분산분석 [ 보기 _3] 어느공장에네종류의기계,, 3, 4 가있다. 각기계에서생산된제품의 강도를측정하여얻은데이터가다음표와같다. (a 집단 ( 수준 별로 95% 신뢰구간을구하여라. (b Levene의등분산검정통계량과유의확률을구하고유의수준 0.05 에서검정하라. (c 각집단의평균을유의수준 0.05 에서검정하라. (d 분산분석후귀무 ( 영 가설이기각되면집단간평균차에대한 95% 신뢰구간과검정통계량및 유의확률을구하여라.
표 [-] 네종류기계에의한제품강도 처리군실험횟수 3 4 5 6 인자의수준 ( 기계의종류 3 4 6 9 3 4 5 7 8 3 8 8 9 8 6 5 5 8 6 각값은기계에 따른제품의강도 합계 67 89 88 57 30 평균 6.75 4.83 3 7.60 4 4.5 5.84 표준편차 s.7 s.37 s3.40 s4.986 s.40 표준오차 D.09 D 0.87 D3 0.50 D4.493 D 0.553 ( 풀이 평균, 표준편차및표준오차계산은다른곳에서이미충분히보여줬기때문에생략한다. (a 수준별 95% 신뢰구간 수준별자유도 : 4 3, 6 5, 3 5 4, 4 4 3 총자유도 : 9 8 t - 분포 : http://www.statdstrbutons.com/t/ t (3,0.05, t (4,0.05, t (5,0.05 및 t(8,0.05 의값. (a [p-value] box 에 0.05 입력. (b [two tals] 선택. (c [d.f.] box 에 3, 5, 4 및 8 을각각입력. [ t -value] box 에서아래의값들을차례로얻을수있다. t(, t( 4, t(3,0.05 3.8 t(, t(5,0.05.57 t( 3, t(4,0.05.777 t(, t(8,0.05.0 구간공식 : t(, D ( t(, D 3
계산 6.75 (3.8(.09 6.75 (3.8(.09 수준별구간범위 4.833 (.57(0.87 4.833 (.57(0.87 3. 0.8 7.60 (.777(0.50 7.60 (.777(0.50.59 7.07 3 3 4.5 (3.8(.493 4.5 (3.8(.493 6.8 9.0 4 4 9.50 9.00 전체평균범위 5.84 (.0(0.553 5.84 (.0(0.553 4.68 7.00 (b <Levene s test> 분산분석은집단 ( 수준 간에등분산이전제되어야만검정이가능하다. 귀무 ( 영 가설 H 0 : 3 4 ( 각집단에대한분산이동일하다. 대립 ( 연구 가설 H : 4 개중하나이상다른분산이존재한다. 귀무가설의채택여부는 Levene 의검정통계량에의해이루어진다. 등분산을검증하는 Levene s test z 표는다음과같다. 표 [-3] Levene s test 표 j j z j z j z 3 j 4 j 0.75.833.4.5.75 0.67 0.6 3.5.5.833 0.4 3.75.5 3.67.6 0.75 0.67 0.4.67 z 합계평균 합계 7 9.334 4.4 9 9.734 평균 z.75 z.556 z3 0.88 z4.5 z.565 Levene 검정통계량 : F ( N k n ( z z L k n j k ( k ( z z j 여기서계산값들은다음과같다. k n ( z 8.64 j jz k 4.3604 n ( z z 4(.75.565 6(.556.565 5(0.88.565 4(.5.565 4
표 [-4] Levene s test 계산값표 ( z j z ( z j z ( z3 j z3 ( z 4 j z4 합계.0.630 0.704.0.0.99 0.0784.0 0.5 0.077 0.304.5 0.5.595 0.584.5.99 0.304 0.5 합계.5 8.33.38 6.5 8.64 Levene 검정통계량계산값 : F L (9 4(4.3604.70 (4 (8.64 F 분포값 : F( k, N k; F(3,5;0.05 3.88 F - 분포 : http://www.statdstrbutons.com/f/ F(, ; F(3,5;0.05 ( (a [p-value] box 에 0.05 입력. 의값 (b [numerator d.f.] box 에 3 입력. (c [denomnator d.f.] box 에 5 입력. (d [rght tal] 을선택. [F-value] box 에서 3.88 을얻을것이다. ( FL.670 의확률 ( 유의확률 (a [F-value] box 에.70 입력. (b [numerator d.f.] box 에 3 입력. (c [denomnator d.f.] box 에 5 입력. (d [rght tal] 을선택. [p-value] box에서 0.354 를얻을것이다. 즉 pf ( L.70 0.354 검정결과 : FL.70 F(3,5;0.05 3.88 이므로 0 H 가채택된다. 유의확률로검정하면 pf ( L.70 0.354 는유의수준 0.05 보다크기때문에 Ho 가채택 된다. 즉위의자료집단 ( 수준 은등분산이므로분산분석이가능하다. (c < 분산분석 > 등분산이증명되면다음단계로평균비교의분산분석을행한다. 귀무 ( 영 가설 H 0 : 3 4 ( 기계에따라강도에영향을미치지않는다. 5
대립 ( 연구 가설 H : 최소한한기계이상은강도에영향을미친다. 가설은다음의계산으로분산분석표를작성하여검정통계량 Ft 나이에대한유의확률로검정한다. 총변동 : 급간변동 : k n ( j (6 5.84 (4 5.84 (5 5.84 04.56 S j k S n ( 4(6.75 5.84 6(4.833 5.84 5(7.60 5.84 4(4.5 5.84 34.993 급내변동 : S S S 04.56 34.993 69.533 변동의자유도 : k 4 3 처리평균제곱 : 잔차평균제곱 : 검정통계량 : N k 9 4 5 N 9 8 S 34.993 V.664 3 S 69.553 V 4.637 5 V.664 Ft.555 V 4.637 표 [-5]: 분산분석표 변동요인제곱합 ( SS 자유도평균제곱 F t 값 유의확률 구룹간 구룹내 S 34.993 S 69.553 3 5 V.664 V 4.637.56 0.098 합계 S 04.56 8 유의수준 0.05 에대한 F 분포의값 : F(, ; F(3,5; 0.05 3.9 F - 분포 : http://www.statdstrbutons.com/f/ F(, ; F(3,5;0.05 ( (a [p-value] box 에 0.05 입력. 의값 (b [numerator d.f.] box 에 3 입력. (c [denomnator d.f.] box 에 5 입력. (d [rght tal] 을선택. [F-value] box 에서 3.88 을얻을것이다. ( Ft.56 의확률 ( 유의확률 (a [F-value] box 에.56 입력. 6
(b [numerator d.f.] box에 3 입력. (c [denomnator d.f.] box에 5 입력. (d [rght tal] 을선택. [p-value] box에서 0.098 를얻을것이다. 분산분석결과 ( Ft.56 F(3,5;0.05 3.9 이므로 0 H 가채택된다. ( 유의확률 PF (.56 0.098 은유의수준 0.05 보다크기때문에 Ho 가채택된다. 기 계간에생산된제품의강도는유의하지않다 ( 기계종류에따라제품의강도에차이가없다. Ho 가채택되었으므로사후분석은필요하지않지만내용을확실히보기위하여사후분석을해보 도록한다. (c < 사후분석 > 여기서사용되는수식은두수준 ( 집단 평균차의검정통계량과각각의신뢰수준이다. 두수준 ( 집단 간평균차의검정통계량 : 두수준 ( 집단 간평균차의신뢰수준 : ( r V / n r ( r ( r t(, t(, V / n 모평균차에대한구간으로위수식을다시쓰면다음과같다. V V ( r t(, r ( r t(, n n r r r 여기서 nr 은두수준 ( 집단 간조화평균실험횟수이다. 실험횟수및 V : n n4 4, n 6, n3 5, V 4.637 실험 (, 또는실험 (, 4 의조화평균실험수 : n n4 4.800 (/ 4 (/ 6 실험 (, 3 또는실험 ( 3, 4 의조화평균실험수 : n3 n34 4.4444 (/ 4 (/ 5 실험 (, 4 의조화평균실험수 : n4 4.000 (/ 4 (/ 4 실험 (, 3 의조화평균실험수 : n3 5.4545 (/ 6 (/ 5 표준오차 (Standard rror: S D 4 D 로표시 V (4.637 D.390 n 4.80 7
D D D V (4.637 D.445 n 4.444 3 34 4 3 4 3 V (4.637.53 n 4 V (4.637.3039 n 5.4545 3 평균차 6.75 4.83.9 3 6.75 7.60 0.85 4 6.75 4.5.50 3 4.83 7.60.77 4 4.83 4.5 0.58 3 4 7.60 4.5 3.35 검정통계량 ( (.9 V / D.390 n ( 0.85 3 3 D3.445 (.50 4 4 D4.53 (.77 0.588.64 3 3 D3.3039 ( 0.58 4 4 D4.390 ( 3.30 3 4 34 D34.445.43 0.48.85.38 t - 분포 : http://www.statdstrbutons.com/t/ (, 3, 4, 3, 4, 34 확률 ( 유의확률 (a [d.f.] box 에 5 입력 (b [two tals] 선택 (c [ t -value] box 에.38, 0.588,.64,.4, 0.48,.85 를차례로입력 [p-value] box 에다음의확률을각각얻을수있다. p (.38 0.88 8
p ( 3 0.588 0.565 p ( 4.64 0. p ( 3.4 0.05 p ( 4 0.48 0.68 p ( 34.85 0.037 ( t(, t(5,0.05 값 (a [p-value] box 에 0.05 입력. (b [d.f.] box 에 5 입력. (c [two tals] 를선택. [t-value] box에서.3 를얻을것이다. 즉 t(, t(5, 0.05.3 V t(, t(5, 0.05 D(or D 4 (.3(.390.964 n t(5,0.05 D (or D (.3(.445 3.080 3 34 t(5,0.05 D (.3(.53 3.47 4 t(5,0.05 D3 (.3(.304.780 평균차구간 : V V ( r t(, r ( r t(, n n r 모평균차구간계산 95% 신뢰구간 ( 유의확률.9.964.9.964 0.85 3.080 3 0.85 3.080 3.50 3.47 4.50 3.47 4.77.780 3.77.780 3 0.58.964 4 0.58.964 4 3.35 3.080 3 4 3.35 3.080 3 4.04 4.88 (0.88 3.93.3 (0.565 0.75 5.75 (0. 5.55 0.0 (0.05.38 3.54 (0.68 0.7 6.43 (0.037 r SPSS 통계처리 [_3_ 제품강도.sav] SPSS 데이터편집기에 [ 표 _] 의데이터를변수명 [ 기계종류 ] 에 = 기계, = 기계, 3= 기계3, 4= 기계4 로구분하고그에해당하는수율을변수명 [ 제품강도 ] 로각각입력하여통계값들을구한다. 분석 > 평균비교 > 일원배치분산분석보조창이뜨면 [ 제품강도 ] 를종속변수로, [ 기계종류 ] 를요인으로각각이동. 옵션단추를눌러통계량중모수및변량효과를제외하고모두선택. 계속 > 확인 9
일원배치분산분석결과 ( 반복수가같지않은자료의분산분석 기술통계 제품강도 기계 기계 기계 3 기계 4 합계 표준 표준 평균에대한 95% 신뢰구간 N 평균 편차 오차 하한값 상한값 최소값 최대값 4 6.75.7.09 3. 0.8 4 9 6 4.83.37.87.59 7.08 8 5 7.60.40.50 6.8 9.0 6 9 4 4.5.986.493 9.50 9.00 8 9 5.84.40.553 4.68 7.00 9 분산의동질성에대한검정 제품강도 Levene 통계량 자유도 자유도 유의확률.69 3 5.354 분산분석 제품강도 집단 - 간집단 - 내합계 제곱합 자유도 평균제곱 F 유의확률 34.993 3.664.56.098 69.533 5 4.636 04.56 8 제품강도 Welch rown-forsthe a. 비동시적 F 분포 평균동질성검정 통계량 a 자유도 자유도 Sg..9 3 7.048.0.33 3 9.489.39 검정결과분석 : ( 분산의동질성검정 (Levene s test 은유의확률이 0.354 로유의수준 0.05 보 다크기때문에수준간의자료는등분산이가정된다. 따라서비모수통계인중앙값으로계산한평 균동질성검정의 Welch 나 rown-forsthe 분석은필요하지않다. ( 분산분석의내용을보면이론으로계산한값과동일하고, 유의확률 0.098 은유의수준 0.05 보다크기때문에 H0 가채택되며그결과사후분석은하지않는것이일반적이다. 필 요하다면앞의보기문제처럼다음과같이사후분석을할수도있다. < 사후분석 > 분석 > 평균비교 > 일원배치분산분석 재설정을누른후 [ 파괴강도 ] 를종속변수로, [ 기계종류 ] 를요인으로이동 사후분석을누르고등분산을가정함에서 LSD 와 Duncan 을선택. 계속 > 확인 30
사후분석결과 다중비교 종속변수 : 제품강도 LSD (I 기계종류기계 기계 기계 3 기계 4 (J 기계종류기계 기계 3 기계 4 기계 기계 3 기계 4 기계 기계 기계 4 기계 기계 기계 3 *..05 수준에서평균차가큽니다. 95% 신뢰구간 평균차 (I-J 표준오차 유의확률 하한값 상한값.97.390.88 -.05 4.88 -.850.444.565-3.93.3.500.5. -.74 5.74 -.97.390.88-4.88.05 -.767.304.05-5.55.0.583.390.68 -.38 3.55.850.444.565 -.3 3.93.767.304.05 -.0 5.55 3.350*.444.035.7 6.43 -.500.5. -5.74.74 -.583.390.68-3.55.38-3.350*.444.035-6.43 -.7 동일집단군 Duncan 기계종류기계 4 기계 기계 기계 3 유의확률 제품강도 유의수준 =.05에대한 부집단 N 4 4.5 6 4.83 4.83 4 6.75 6.75 5 7.60.4.083 동일집단군에있는집단에대한평균이표시됩니다. 평균도표 3
[ 일원배치분산분석교과서예제 (p36] SPSS 통계처리 [ 지역조사.sav] 응답자의학력에따라평균연령의차이가모집단의평균차이에의한것인지 ( 유의미한지, 우연히표본의평균차이에의한것이지를알아본다. 분석 > 평균비교 > 일원배치분산분석보조창이뜨면 [ 연령 ] 을종속변수로, [ 학력 ] 을요인으로이동옵션을선택하여통계량중에서모수및변량효과를제외시키고모두선택. 사후분석을누름 보조창이뜨면등분산을가정하지않음에서 Dunnett 3 를선택. 계속 > 확인 일원배치분산분석결과 기술통계 연령 초등학교이하중학교고등학교대학교대학원이상합계 평균에대한 95% 표준 표준 신뢰구간 N 평균 편차 오차 하한값 상한값 최소값 최대값 34 58.74 5.54.665 53.3 64.6 85 68 47.9 9.975.0 44.78 49.6 8 70 75 39.64 0.37.65 38.4 40.87 8 75 34.74.5.77 33. 36.6 9 76 5 39.0 8.9.304 34.6 44.4 9 60 604 39.83.43.506 38.84 40.83 8 85 분산의동질성에대한검정 연령 Levene 통계량 자유도 자유도 유의확률 3.97 4 599.003 분산분석 연령 집단 - 간집단 - 내합계 제곱합 자유도 평균제곱 F 유의확률 353.67 4 5338.407 44.493.000 7869.86 599 9.983 933.444 603 연령 Welch rown-forsthe a. 비동시적 F 분포 평균동질성검정 통계량 a 자유도 자유도 Sg. 3.784 4 73.035.000 39.955 4 3.897.000 3
평균도표 분석 : 분산의동질성에대한검정 에서유의확률은 0.03 으로유의수준 0.05 보다작기때문에 학교수준에대한연령간에는등분산이아니다. 따라서분산분석을하지않고, 이분산인경우의평 균차이를검정하는 rown-forsthe 와 Welch 의검정을사용한다. 이때 평균동질성검정 의 rown- Forsthe 와 Welch 의검정의유의수준은 0 이므로 Ho 가기각되고 H 이채택된다. 즉 학교수준간에는연령차이가있다. H 이채택되었으므로사후분석이필요하다. 사후분석결과 종속변수 : 연령 Dunnett 3 (I 학력초등학교이하 중학교 고등학교 대학교 대학원이상 (J 학력중학교고등학교대학교대학원이상초등학교이하고등학교대학교대학원이상초등학교이하중학교대학교대학원이상초등학교이하중학교고등학교대학원이상초등학교이하중학교고등학교대학교 *..05 수준에서평균차가큽니다. 다중비교 95% 신뢰구간 평균차 (I-J 표준오차 유의확률 하한값 상한값.544*.97.003.97 0. 9.09*.738.000 0.97 7. 3.999*.775.000 5.79 3. 9.535* 3.53.000 9.8 9.89 -.544*.97.003-0. -.97 7.548*.36.000 3.66.44.455*.435.000 8.37 6.54 7.99.60.05 -.0 6.00-9.09*.738.000-7. -0.97-7.548*.36.000 -.44-3.66 4.908*.994.000. 7.70.444.387.000-7.8 8.07-3.999*.775.000-3. -5.79 -.455*.435.000-6.54-8.37-4.908*.994.000-7.70 -. -4.464.430.55 -.6 3.3-9.535* 3.53.000-9.89-9.8-7.99.60.05-6.00.0 -.444.387.000-8.07 7.8 4.464.430.55-3.3.6 33
.3 이원배치법 ( 이원분산분석 : two-wa factoral desgn 영향을미치는두인자의효과에대하여조사하고자할때이용되는분산분석으로반복이없는경우와반복이있는경우로분류한다. 이원배치법은두인자모두모수인경우, 한인자는모수, 한인자는변량인경우와두인자모두변량인경우가있다. 이경우에변동계산은모두같으나분산의기대치는다르다..3. 반복이없는이원배치법인자가모두모수인경우 인자의수준수가 p, 인자의수준수가 q 인반복이없는이원배치 법의데이터구조는다음과같다. 이원배치법의구조모형 ( 반복이없는경우 a b e j j j e N 이고서로독립. 여기서 (,,, p, ( j,,, q j ~ (0, : 실험전체의모평균 a : 인자 의 번째열 (column 효과 b : 인자 의 j 번째행 (row 효과 j p q a b j j 0 이실험의자료수 N pq 는다음표와같이배열된다. 표 [-6] 이원배치법의데이터구조 ( 반복이없는경우. j p 합계평균 p (r (r p (r (r j j j j jp j (r j (r q q q q qp q (r q(r 합계 평균 (c (c (c p(c (c (c (c p(c 아래첨자 (c 와 (r 은 column( 열 과 row( 행 을각각나타낸다. 예로 (c 와 (c 는 열의 평균과 열의총합이다. 34
인자들의각수준에서데이터들의합과평균 열의합 : j 행의합 : (c j (r q j 열의평균 : (c j p j, j 행의평균 : j (r 총합 (total: (c (c p(c (r (r q (r 총평균 (total average: pq 데이터 j q j q j p j p 와총평균 의차이를제곱한후에합하여얻은총제곱합은 의효과에의한제곱 합과 의효과에의한제곱합, 그리고잔차제곱합으로다음과같이분해된다. 총변동 ( 총제곱합 : 급간변동 p S ( SS ( q j 에의한급간변동 ( 효과에의한제곱합 : 에의한급간변동 ( 효과에의한제곱합 : 급내변동 잔차제곱합 : p q S ( SS [ ] j (c j(r j S ( S S S 또는 S S ( S S j S ( SS q [ ] p q j (c S ( SS p [ ] j(r < 변동계산용다른공식 > ( 수정항 (Correcton erm: C : C, N pq N ( 총변동 : (3 급간변동 : p q S ( j j p q j p q p [ (c ] j j C (c S C q j (r S C p p q q [ j (r ] j j S S S S (4 급내변동 : 총자유도 : pq 인자 의자유도 : p 인자 의자유도 : q 오차 의자유도 : ( p( q 35
S, S 를자유도로나누어분산으로나타낸것이처리평균제곱 MS( MS V, MS( MS V 과잔차평균제곱 ( MS( MS V 이다. M 은 mean( 평균 을의미한다. S S 처리평균제곱 ( 인자 : V p S S 처리평균제곱 ( 인자 : V q S S 잔차평균제곱 : V ( p( q V, V 와 V 의비가각각의검정통계량 V V 검정통계량 : F F V V F 와 F 이다. 따라서반복이없는이원배치의분산분석은다음과같이구성된다. 표 [-7] 이원배치법의분산분석표 ( 반복이없는경우 변동요인제곱합자유도평균제곱 Ft 값 구룹간 ( 처리 인자 구룹간 ( 처리 인자 구룹내 ( 오차 : 잔차 S ( SS S ( SS S ( SS p q ( p( q 합계 S ( SS pq 검정해석 : 유의수준 일때, F F F(, ; 이면 에대한귀무 ( 영 가설 H ( 0 를기각. F(, ; 이면 에대한귀무 ( 영 가설 H ( 0 를기각. V ( MS S / V ( MS S / V ( MS S / F V / V F V / V 이러한경우각각의요인이특성치에영향을미친다고말할수있고요인의수준간에유의한차 가존재한다고결론을내릴수있다. < 분산분석후의추정및검정 > H ( o 나 Ho( 가기각되면추후검정을검토하여야한다. ( 각수준의모평균추정 ( 모평균의점추정 q j (c q j p j j j (r p ( 모평균의구간추정 V (c t(, (c t(, q V q 36
V j(r t(, j(r t(, j p V p ( 두인자의수준을조합한조건에서모평균의추정 ( 인자의 수준과 인자의 j 수준에서의모평균의점추정 ( j (c j (r j 의구간추정 V V ( t (, ( t (, n 여기서 (c j (r j (c j (r ne n e N (3 한인자가모수인자, 다른인자가변량인자인경우의추정 ( 난괴법 분산분석은변함없지만모수인자는최적조건의모평균을, 변량인자는모분산을추정한다. ( 모수인자 수준에서의모평균의신뢰구간 V V V V t(, / t(, / N N ( V V S는 Satterthwate 자유도 : S [( V / ] [( V / ] ( c S ( c S ( 변량인자 간의모분산추정 : 분산분석표에서평균제곱은 V p 분산추정 : V V p V 표준편차추정 : V V p e [ 보기 _4] 어느공장에서 4 가지반응온도와 3 종류의원료에의하여제품의수율에미치는영 향을조사하고자반복이없는이원배치법에의하여실험한결과얻은자료가아래표 [-8] 이 다. 분산분석표를작성하고반응온도와원료의종류에따라제품의수율이다르다고할수있는지 유의수준 0.05 에서검정하라. 표 [-8] 인자 ( 반응온도 와 인자 ( 원료 에의한제품의수율 원료 3 온도 인자의수준 ( 반응온도의종류 3 4 7 7 59 47 78 73 66 57 74 69 63 55 합계 49[ (r ] 74[ (r ] 6[ 3(r ] 평균 6.5[ (r ] 68.5[ (r ] 65.5[ 3(r ] 합계 4[ (c ] 3[ (c ] 88[ 3(c ] 59[ 4(c ] 784[ ] 평균 74.67[ (c ] 7[ (c ] 6.67[ 3(c ] 53[ 4(c ] 65.33[ ] 37
( 풀이 귀무 ( 영 가설 Ho( : (c (c 3(c H ( o : (r (r 3(r 4(r 대립 ( 연구 가설 H : 각인자의수준간에평균이같지않다. 가설의검정에필요한계산 수준수 (column 수 : p 4 수준수 (row 수 : q 3 총자료수 : N pq 총변동 : 4 3 ( j [(7 65.33 (78 65.33 (55 65.33 ] 94.67 j S 급간변동 : 4 S q[ ] 3[(74.67 65.33 (7 65.33 3 j (c (6.67 65.33 (53 65.33 ] 835.34 S p [ j(r ] 4[(6.5 65.33 (68.5 65.33 (65.5 65.33 ] 78.7 급내변동 : S S ( S S 94.667 (835.347 78.67 9.6 총자유도 : pq (4(3 인자 의자유도 : p 4 3 인자 의자유도 : q 3 오차 의자유도 : ( p( q (3( 6 처리평균제곱 : S S 835.347 V( MS 78.449 p 3 S S 78.67 V( MS 39.084 q 잔차평균제곱 : S S 9.53 V( MS 4.859 ( p( q (3( 검정통계량 : V 78.449 F 57.308 V 4.859 V 39.084 F 8.044 V 4.859 유의수준 0.05 에서경계값 : F(, ; F (3,6;0.05 4.76 38
F(, ; F(,6;0.05 5.4 F - 분포 : http://www.statdstrbutons.com/f/ ( F 57.94 과 F 8.044 의확률 ( 유의확률 (a [denomnator d.f.] box 에 6 입력. (b [rght tal] 을선택. (c [numerator d.f.] box 에 3 과 를각각입력. (d [F-value] box 에 57.94 와 8.044 를각각입력. [p-value] box 에서 0.000 과 0.0 를얻을것이다. ( F(, ; F(3,6;0.05 와 F(, ; F(,6;0.05 (a [p-value] box 에 0.05 입력. (b [rght tal] 을선택. (c [denomnator d.f.] box 에 6 입력. (d [numerator d.f.] box 에 3 과 를각각입력. [F-value] box 에서 4.76 과 5.4 를각각얻을것이다. F (3,6;0.05 4.757 F (,6;0.05 5.43 의값 계산값들에의한분산분석표는다음과같다. 표 [-9] 인자 ( 온도 와 인자 ( 원료 에의한제품의수율분산분석표 변동요인제곱합자유도평균제곱 Ft 값 인자 인자 잔차 S 835.34 S 78.7 S 9.6 3 6 V 78.447 V 39.085 V 4.86 Ft 57.94 Ft 8.044 유의확률 0.000 0.0 합계 S 94.667 검정결과 : 여기서등분산검정즉 Leven s test 는실험횟수가한번이기때문에불가능하다. 따라 서등분산을제외한평균비교로검정을한다. F F 검정통계량 97.94 F(3,6;0.05 4.76 8.044 F (,6;0.05 5.43 F 와 F 는자신의자유도를가진유의수준 0.05 각의귀무 ( 영 가설 Ho( 와 Ho( 에서 F 분포값보다크므로각 는기각된다. 즉반응온도와원료의종류에따라제품의수 율에차이가있다 ( 반응온도와원료의종류에따라제품의수율이유의하다. 39
< 사후분석 > 인자 와 의귀무가설은기각되었기때문에점추정에근거하여다음과같이구간을구한다. 구간공식 : V (c t(, (c (c t(, q V j(r t(, j(r j(r t(, p V q V p 제 열의구간추정 대입할값 : ( c 74.67 (c 7.0, 3(c 6.67, 4( c 53.0 74.67 t (6,0.05 4.859 4.859 (c 74.67 t (6,0.05 3 3 t(6,0.05.050, (c 4.859 3.77 : 74.67.5644 74.67.5644 7.056 77.344 (c 4.859 t(6, 0.05 (.050(.77.5644 3 같은방법으로다른열을구하면각각다음과같다. 65.4356 73.5644 (c 60.056 65.344 3(c 50.4356 55.5644 4(c 제 행의구간추정 : 6.5 t(6,0.05 4.859 4.859 (r 6.5 t(6,0.05 4 4 (r 6.5, (r 68.50, 3(r 65.5 6.5 (.05(.0 6.5 (.05(.0 (r r 60.09 64.4708 다른행의구간추정도같은방법으로한다..3. 반복이있는이원배치법 개요 : 인자가둘인실험의분산분석은 ( 등분산을제일먼저검정하고, ( 등분산일경우분산분석을통해수정모델로타당성검정을하여두인자로인한실험치에효과가있다고결론을얻 으면 (3 상호작용효과 (nteracton effect 를검정한다. (4 상호작용이없다면각각의인자에대 한수준들의효과를비교분석하며, 이때각인자의수준간차이가있다면 (5 사후검정의교차분석으로평균비교를한다. (6 상호작용이있다면사후분석에서이에대한교차분석도변행하여야 40
한다. 예를들면결핵은복합약을사용하여야만큰효과를볼수있다. 이경우약의효과는상호 작용이두드러져나타날것이다. 인자 의수준이 p, 인자 의수준이 q 라고하고임의의실험횟수를 r 이라하면데이터배 열은다음과같다. 표 [-0] 반복수가있는인자, 의배열 요인 p 합계평균 p r r r pr p (r (r p p r r r pr p (r (r p j j p j jr jr j r jpr j j j jp j(r j(r j j j jp q q qp q 합계 qr qr q r qpr q q q q (c (c q q (c qp qp q(r p(c q(r 평균 (c (c (c p(c 여기서 ( 합계 와 ( 평균 에있는아래첨자 (c 와 (r 은 column( 열 과 row( 행 를나타낸다. 앞으로 인자 ( 요인 는행에나타내고수준수는 p, 이것의일반적인수의대표는 로하자. 한편인자 ( 요인 는열에표시하고수준수는 q, 그리고수의대표는 j 로표시한다. 실험횟수는 r 로하고이수의대표는 k 로나타내도록한다. 4
<Levene s test: 분산의동질성 (equalt of varances 검정 > 분산분석을하려면 Levene s test 로수준간자료가등분산인지먼저검정하고, 만일등분산이아 니면다른검정 ( 비모수통계에의한검정 을하여야한다. 즉자료가등분산이증명된후분산분 석이수행된다. 따라서아래의등분산검정통계량으로검정한결과가귀무가설을채택할때분산 분석을할수있다. 귀무 ( 영 가설 H 0 : j( j 집단에대한분산이동일하다. 대립 ( 연구 가설 H : Levene 의등분산검정통계량 : 여기서 j k j중하나이상다른분산이존재한다. p q j L p q r F pq( r r( zjz ( pq ( z zj j k z 는 z 로만드는표이며 L j k j k j 검정 : F F(, ; L j k F 은이표로부터계산된다. 이면 H o ( 등분산 가채택되어분산분석에서평균을비교할수있다. 따 라서분산분석을하려면 Levene s test 로귀무가설 Ho 가확률적으로채택되어야한다. < 분산분석 > Levene s test 에서등분산이입증되면다음과같이순차적으로계산한후분산분석표를작성하고 평균에대한가설을검정한다. 귀무 ( 영 가설 Ho( : (r (r 3(r H ( o : (c (c 3(c 4(c 인자들의각수준 ( 집단 에서합과평균합평균 r j r j k j j k k r k (c j(r q r j k (c j k p r j k j(r k 총제곱합 : ( c ( c p(c (r (r q(r 4 q r j k j k qr p r j k pr k p q r pqr j k p q r j k or S S S S S j k S ( SS ( 급간변동 : S ( SS qr [ ] p (c j k
S ( SS pr [ ] q j 상호 ( 교호 작용 : S ( SS j(r 앞으로 C 로쓸것이다. p q r [ ] j 수정모형 : S ( SS S S S 급내변동 : S ( SS j (c j(r p q r ( j k j or S S S j k 변동을쉽게계산하기위하여다은공식을정의하여사용할수있다. 변동계산공식 ( 수정항 (Correcton erm: C: ( 총변동 : (3 급간변동 : (4 수정모형 : C ( N pqr N p q r p q r ( j k j k j k j k p S q (c C, (r qr j pr j p q S j C r j S C S S S S (5 상호 ( 교호 작용 : C (6 급내변동 : S S S S C 자유도 총자유도 : pqr 급간변동자유도 : p 급간변동자유도 : q 상호작용자유도 ( C : C ( p( q 수정모형자유도 : C pq 급내변동자유도 : C pq( r 각요인들의평균제곱 ( 분산 S S 처리평균제곱 : V( MS, V ( MS SC 상호작용평균제곱 : VC( MSC C S 잔차평균제곱 : V ( MS 43
S 수정모형제곱 : V ( MS 표 [-] 이원배치법의분산분석표 ( 반복이있는경우 변 동 요 제곱합 ( SS 자유도평균제곱 ( MS Ft 값 인수정모형인자 S S ( SS S ( SS S ( SS C ( SS pq C S ( SS p q C ( p( q pq( r V ( MS S / V ( MS S / V ( MS S / V S / C C C V ( MS S / F V / V F V / V F V / V F V / V C C 인 자 상호작용오차합계 SS ( S pqr < 분산분석후의추정및검정 > 분산분석에서평균에대한귀무가설이기각되고대립가설이채택되면즉인자간의평균이다르다 고하면상호간에모평균비교와구간추정을한다. ( 각수준의모평균추정 (a 모평균의점추정 44
( q r p r j k (c ( j j k j (r qr j k pr k (b 모평균의구간추정 유의수준이 이고양쪽검정일때인자, 의각수준마다모평균의신뢰한계는다음과같다. V V (c t(, ( (c t (, qr qr V V j(r t(, ( j j (r t (, pr pr ( 모평균차의구간추정유의수준이 이고양쪽검정일때두모평균차의신뢰한계는다음과같다. V V [ (c '(c ] t(, ( ( ' [ (c '(c ] t(, qr qr V V [ j(r j '(r ] t(, ( j ( b ' [ j(r j '(r ] t(, j pr pr (3 두인자의수준을조합한조건에서모평균의추정 < 상호작용을무시할수있는경우 > (a 인자의 수준과 인자의 j 수준에서모평균의점추정 ( a b j j (c j (r (b ( 의구간추정 j 유의수준이 ( 양쪽 일때두인자의수준을조합한모평균의신뢰한계는다음과같다. V V ( t (, ( ( t (, n (c j (r j (c j (r ne 여기서 n e N N p q e < 상호작용을무시할수없는경우 > (a 인자의 수준과 인자의 j 수준에서모평균의점추정 ( a b ( ab j j j j (b ( 의구간추정 j V V j t(, ( j j t (, r r (4 한인자가모수, 다른인자가변량인경우의추정 가모수인자, 가변량인자일때분산분석은변함이없지만분산분석후의추정은모수인자 는최적조건에관한모평균을추정하고, 변량인자는모분산을추정하여야한다. 45
(a 모수인자 수준에서모평균의신뢰구간 ( 상호작용을무시할경우 * V V * V V (c t(, ( (c t(, pqr pqr Satterthwate 자유도 : * (b 변량인자 간의모분산추정 분산분석표에서평균제곱은 V ( V V [( V / ] [( V / ] pr, 이다. 이들로부터다음과같이분산을추정할수있다. V V pr V V pr V 이원배치분산분석절차의요약 ( Levene s test 로등분산검정. ( 수정모형타당성검정 : 각각의요인이실험치에작용하여야검정가능 ( H 이채택되어야함. (3 요인간의상호작용확인 : 두요인간상호작용검정. (4 상호작용이없으면각인자효과를분리하여각각의인자의수준에대해다중비교. (5 상호작용이있다면두요인의효과를동시에고려한처리평균에대해다중비교. (6 상호작용의경우각인자의분리비교는무의미하다. SPSS 통계처리문제 ( 상호작용이없는경우 [ 보기 _5] 종류의비료 (, 와 3 종류의토양 (,, 3 에따라옥수수를실험재배하 여수확량을조사하였더니다음과같았다. 옥수수수확량이토양과비료에따라차이가있는지유 의수준 0.05 ( 양쪽 에서검정하라. 표 [-] 비료와토양의옥수수수확량요인 ( 비료 ( 비료 ( 토양 ( 토양 3 ( 토양3 3 9 30 9 6 5 3 0 6 9 7 3 9 0 표 [-3] 계산용표 요인 평균 [ 합계 ] (r.00 46
3 9 0 [ (r 6] 3.0 ( 63.0 ( 63 30 9 6 6 9 7 8.33 ( 85 7.33 ( 8 5 3 3 9 0 3 3.33 ( 3 70 0.67 ( 3 6 (r 7.833 [ (r 67] 3(r.00 [ 3(r 3] 평균 ( 합계 (c 4. [ (c 8] (c =3.00 [ (c 07] 3.6 [ 45] (r 은 row( 행, (c 는 column( 열 을표시. ( 풀이 (a <Levene s test: 등분산검정 > 분산분석을위해먼저하여야할일은 Levene 의등분산검정이다. Levene 의검정용표는아래와 같이작성된다. 표 [-4] z 에의한 Levene s test 표 j ( 토양 j k j k j ( 비료 ( 비료 0 ( z ( z ( z 3 0( z ( z ( z 3 평균 z(r ( 토양 3 ( 토양3 z.33.67 ( z 0.67 ( z.33 ( z 3 z.56.67 ( z 3.33 ( z 3 0.33 ( z 33 z 0.67.33 ( z.67 ( z 0.33( z 3 z..33 ( z 3.67 ( z 3 0.67 ( z 33 z(r.33 z3(r.33 평균 z3. z3.56 z(c.33 z(c. z =. 여기서아래첨자 (r 은 row( 행, (c 는 column( 열 을의미한다. 47
귀무 ( 영 가설 H 0 : j( j 집단에대한분산이동일하다. 대립 ( 연구 가설 H : Levene s test: j중하나이상다른분산이존재한다. p q j L p q r F pq( r r( zjz ( pq ( z zj j k p q r 3 3 ( z ( j k z j z j j k j k j k z [(0.33 (.33 (.33 ] [(0 0.67 ( 0.67 ( 0.67 ] [(.67.56 (0.67.56 (.33.56 ] [(.33. (.67. (0.33. ] [(.67. (.33. (0.33. ] 8.074 [(.33.56 (.67.56 (0.67.56 ] p q 3 ( z j z ( z j z j j (.33. (0.67. (.56. (.. (.. (.56. 0.5679 j k 비료의종류 : p 토양의종류 : q 3 측정횟수 : r 3 수정모형자유도 : pq ((3 5 급내변동자유도 : pq( r ((3(3 Levene 의검정통계량값 : ((3(0.5679 0.4444 FL 0.5064 5(8.074 40.3705 F 분포값 : F(, ;0.05 F(5,;0.05 3.06 F - 분포 : http://www.statdstrbutons.com/f/ ( F(, ; F(5,;0.05 의값 (a [p-value] box 에 0.05 입력. (b [numerator d.f.] box 에 5 입력. (c [denomnator d.f.] box 에 입력. (d [rght tal] 을선택. [F-value] box 에서 3.06 을얻을것이다. ( FL 0.5064 의확률 ( 유의확률 48
(a [F-value] box 에 0.5064 입력. (b [numerator d.f.] box 에 5 입력. (c [denomnator d.f.] box 에 입력. (d [rght tal] 을선택. [p-value] box 에서 0.767 을얻을것이다. 검정결과 : FL 0.5064 F(5,;0.05 3.06 이므로귀무가설 o H 가채택된다. 한편유의확률 로보면 PF ( L 0.5064 0.767 은유의수준 0.05 보다크기때문에 Ho 가채택된다. 비료 와토양에의한교차자료의분산 ( 은등분산이다. 따라서다음단계의분산분석이가능하다. j (b < 분산분석 > 귀무 ( 영 가설 H o : 다음은네종류의차례로검정해야할귀무가설내용이다. 이들의반대가대립 ( 연구 가설 H 이다. ( 비료와토양은각각또는상호작용에의한옥수수의수확량과관련이없다 ( 두인자비료와토 양은옥수수수확량에영향을주지않는다. ( 비료와토양은옥수수수확량에서로상호작용을하지않는다. (3 비료의두종류는수확량이같다. (4 토양의세종류는수확량이같다. 분산분석에서우선 ( 번은 H ( 비료와토양은옥수수수확과관련이있다 이채택되어야만그다 음을진행할수있다. ( 번은 H o ( 비료와토양은옥수수수확량에서로상호작용을하지않는다 가채택된다면 (3 번과 (4 번을독립적으로검정할수있다. 만일 H ( 비료와토양은수확에서로 상호작용을한다 이채택되면 (3 번과 (4 번의검정은무의미하다. 이들을순차적으로검정하는 분산분석표를작성하려면다음의계산이필요하다. 총변동 : 급간변동 : 3 3 j k j k S ( SS ( ( 3.6 (0 3.6.78 p ( [ (c ] 9[(4. 3.6 (3.0 3.6 ] 6.7 S SS qr q ( [ j(r ] 6[( 3.6 (7.833 3.6 j S SS pr 상호작용 : S ( SS r [ ] C C p q j j (c j(r 3[( 4. 3.6 ( 3 3.6 49 ( 3.6 ] 63.444 (8.33 4. 7.83 3.6 (7.33 3 7.83 3.6 (3.33 4. 3.6 (0.67 3 3.6 ] 5.445 수정모형 : S( SS S S S 6.7 63.444 5.445 75.6
급내변동 : S ( SS p q r ( j k j or S S S.78 75.6 36.667 j k 위의값들은공식을이용하여다음과같이계산할수도있다. (45 C 0034.7 N 8 S [( (3 (0 ] 0034.7 047 0034.7.78 수정항 (correcton term: 총변동 : 급간변동 : S [(8 (07 ] C (90373 0034.7 6.7 qr 9 S [(6 (67 (3 ] C (689 0034.7 63.444 pr 6 S [(63 (85 (6 C (3063 0034.7 75.6 r 3 S S S S 75.6 6.7 63.444 5.445 C 급내변동 : S S S.78 75.6 36.667 자유도 (degree of freedom ( 비료 의자유도 : p ( 토양 의자유도 : q 3 상호작용자유도 : C ( p( q ((3 잔차 ( 오차 자유도 : pq( r ((3(3 수정모형자유도 : pq ((3 5 총자유도 : pqr ((3(3 7 S 6.7 처리평균제곱 : V 6.7 S 75.6 V 35. 5 S 36.667 잔차평균제곱 : V 3.056 검정통계량 : V 35. F.493 V 3.056 VC.7 FC 0.89 V 3.056 V 6.7 F.00 V 3.056 V 8.7 F 6.74 V 3.056 이들값으로이원분산분석표를작성하면다음과같다. 50 V V C S 63.444 8.7 SC 5.445.73 C
표 [-5] 비료와토양이원분산분석표 변동요인제곱합 ( SS 자유도평균제곱 Ft 값수정모형 75.6( S 5( 35.( V.49( 절편 ( 수정항 0034.7(C 0034.7 384.09 유의확률 F 0.000 ( 비료 6.7( S ( 6.7( V.0( F 0.64 ( 토양 63.44( S ( 8.75( V 6.74( F 0.000 5.445( S C ( C.7( V C 0.89( F C 0.436 오차 36.667( S ( 3.056( V 7( F - 분포 : http://www.statdstrbutons.com/f/ ( F (5,;0.05, F (,;0.05, F (,;0.05, F(,;0.05 의값 (a [p-value] box 에 0.05 입력. (b [rght tal] 을선택. (c [denomnator d.f.] box 에 입력. (d [numerator d.f.] box 에 5,,, 를차례로입력. [F-value] box 에서다음의값을얻을것이다. F(, ; F(5,; 0.05 3.06 F(, ; F(,; 0.05 4.743 F(, ; F(,; 0.05 3.885 F(, ; F(,; 0.05 3.885 C ( F, F, F, FC 의확률 ( 유의확률 (a [denomnator d.f.] box 에 입력. (b [rght tal] 을선택. (c [numerator d.f.] 와 [F-value] 에 (5,.493, (,.00, (, 6.74, (, 0.89 을서로 matchng 시켜각각 box 에차례로입력. [p-value] box 에서다음의확률을각각얻을것이다. PF (.493 0.00 PF (.0 0.64 PF ( 6.74 0.00 PF ( C 0.89 0.436 5
검정결과 ( 수정모형타당성검정 : 각각의요인효과가유의한지를검정하는부분으로가장먼저분석해야 할부분이다. 만일귀무 ( 영 가설 Ho 를채택하면이것은비료나토양이옥수수수확량에아무런 영향을주지않는다는것으로해석되며이경우이원배치분산분석은타당성을잃고더이상의 검정을할수없다. 따라서수정모형의귀무 ( 영 가설은기각되고대립가설, 즉옥수수수확량은 두요인인토지와비료에각각의존하고또는둘의상호작용있다는가설 H 이채택되어야그다 음분석을할수있다. 이것을 F -분포값으로확인하면, F.493 F(5,,0.05 3.06 이므로귀무 ( 영 가설은기각된다. 확률로보면 F 유의확률 0.00은유의수준 0.05 보다작 기때문에 H o ( 모형이타당성이없다. 또는토지와비료두요인은옥수수수확량과아무런관련 이없다 가기각되고 H ( 모형은타당하다. 또는옥수수수확량은비료와토지의두요인과관련 이있다 가채택되어다음의분석을수행할수있다. ( 상호 ( 교호 작용 : 상호작용이란두인자 ( 비료와토지 가옥수수의생산량에동시에영향을주는 것을의미한다. 따라서다음단계를진행하려면이부분의검정은상호작용이없는 Ho 가채택되 어야한다. F 0.89 F(, ;0.05 F(,;0.05 3.89 이므로귀무 ( 영 가설이채택되어 C C 비료와토지의상호작용은없다. 이것을확률로보면 F C 유의확률 0.436은유의수준 0.05 보다크기때문에 H o ( 상호작용이없다 가채택된다. 그결과비료와토지의효과를분리하여검 정할수있다. (3 ( 비료 효과 : F.0 F(, ; F(,;0.05 4.743 이므로귀무 ( 영 가설이채택된 다. 즉두종류의비료효과차이는없다는결론을얻는다. 이것을확률로해석하면 F 의유의확 률은 0.64 로유의수준 0.05 보다크기때문에 Ho 가채택되어옥수수수확량에두비료효과의 차이는없다고검정된다. (4 ( 토양 효과 : F 6.745 F(, ; F(,;0.05 3.89 이므로귀무 ( 영 가설 o H 가 기각되므로토양의종류에따라옥수수수확량은차이가있다. 이것을확률에서검정하면 F 의 확률은 0.00으로유의수준 0.05보다작기때문에 H ( 옥수수수확량은토양에따라유의미하다 이채택된다. 검정의요약및절차 ( 등분산검정 : 분산분석은집단간의모분산이같다고가정하고설계된이론이므로 Levene s test로자료간분산이등분산일때비로소분산분석을진행할수있다. 만일등분산이아니라면분산분석을하지않고비모수분석방법을사용하여야한다. 위의검정에서두인자 ( 비료와토지 의교차로얻은측정치 ( 옥수수수확량 들은등분산이었다. ( 수정모형검정 : 우선모형이이원배치분산분석에타당한가를점검한다. 만일수정모형에서귀무 ( 영 가설이채택된다면이것은각인자의수준 ( 요인 들이결과에아무런작용을할수없다는뜻이기때문에검정을멈추게된다. 그러므로이원배치분산분석을하려면필연적으로수정모형의 귀무 ( 영 가설 H o, 즉 두인자 ( 비료와토양 는측정치 ( 옥수수수확량 와관련이없다. 가기각되 5
고대립가설 H, 즉 두인자는측정치와관련이있다 ( 작용한다. 가채택되어야그다음분석을 진행시킬수있다. (3 사후분석 : 위의분석에서두비료효과는차이가없었고 ( 유의하지않고, 토양효과는있었다 ( 유의하다. 따라서토양효과에대한사후분석즉평균의교차비교와신뢰구간을보여주는것이 필요하다. (C < 사후분석 > 계산에필요한값들 표준오차 : V (3.056 D.0093 pr ((3 토양의평균차 : (r (r 7.83 6.83 (r 3(r.0 (r 3(r 7.83 5.83 검정통계량 : (r 3 (r 3 (r jj'(r V / pr D j (r j '(r j (r j '(r (r (r 6.83 6.767 D.0093 (r 3(r.0 0.9908 D.0093 (r 3 (r 5.83 5.7763 D.0093 t -분포: http://www.statdstrbutons.com/t/ ( t(, t(,0.05 값 (a [p-value] box에 0.05 입력. (b [d.f.] box에 입력. (c [two tals] 를선택. [t-value] box에서.79 를얻을것이다. ( 의확률 ( 유의확률 (a [d.f.] box에 입력. (b [two tals] 를선택. (c [t-value] box에 6.767, 0.99, 5.776을차례로입력. 53
[p-value] box 에서다음의확률을얻는다. P ( (r 6.767 0.00 P ( 3 (r 0.99 0.34 P ( 3 (r 5.776 0.00 토양효과의모평균차에대한 95% 신뢰구간 V V [ j(r j '(r] t(, ( j ( b ' [ j(r j '(r ] t(, j pr pr V t(, t(, 0.05 D (.79(.0093.99 pr 평균차신뢰구간계산 95% 평균차신뢰구간유의확률 6.83. ( ( 6.83. 9.03 ( ( 4.63 0.00.0. ( ( 3.0. 3 5.83. ( ( 5.83. 3.0 ( (.0 0.34 3 3 SPSS 통계처리 [_5_corn.sav] 3.63 ( ( 8.03 0.00 SPSS 데이터편집기에표 [-] 의데이터를변수명 [ 토양 ] 에 [ 비료 ], 그리고세개의실험횟수에해당하는 [ 수확량 ] 을차례로대응시켜입력한다. 변수값설명에다음과같이설명을덧붙여라. 토양 토양 분석 > 일반선형모형 > 일변량보조창이뜨면 [ 수확량 ] 을종속변수로, [ 토양 ] 과 [ 비료 ] 를모수요인으로각각이동. 옵션단추를눌러통계량중에서기술통계량과동질성검정을선택. 유의수준은 0.05를입력계속 > 확인 일변량분산분석결과 개체 - 간요인 토양 비료 3 변수값설명 N 토양 6 토양 6 토양3 6 비료 9 비료 9 54
기술통계량 종속변수 : 수확량토양비료토양 비료 비료 합계토양 비료 비료 합계토양3 비료 비료 합계합계비료 비료 합계 평균 표준편차 N.00.000 3.00.000 3.00.44 6 8.33.08 3 7.33.58 3 7.83.7 6 3.33.58 3 0.67.08 3.00.9 6 4. 3.63 9 3.00 3.536 9 3.6 3.534 8 오차분산의동일성에대한 Levene 의검정 a 종속변수 : 수확량 F 자유도 자유도 유의확률.506 5.766 여러집단에서종속변수의오차분산이동일한영가설을검정합니다. a. 계획 : Intercept+ 토양 + 비료 + 토양 * 비료 개체 - 간효과검정 종속변수 : 수확량 제 III 유형 소스 제곱합 자유도 평균제곱 F 유의확률 수정모형 75.6 a 5 35..495.000 절편 0034.7 0034.7 384.09.000 토양 63.444 8.7 6.745.000 비료 6.7 6.7.00.64 토양 * 비료 5.444.7.89.436 오차 36.667 3.056 합계 047.000 8 수정합계.78 7 a. R 제곱 =.87 ( 수정된 R 제곱 =.755 검정결과분석 : SPSS 로나온값들은위에서이론으로계산한값들과정확히일치한다. 개체 - 간효과검정표는여러가설들을검정하는부분으로수정모형이가장먼저확인되어야할 부분이다. 수정모형에서유의확률이 0.000라는뜻은대립 ( 연구 가설 H을채택하는것이므로비 료와토지는옥수수수확에유의하다. 즉 비료와토지는옥수수수확량과관련이있다 이기때문 에다음검정을진행하는것이가능해진다. 두번째검토하여야할부분은토양 * 비료의상호 ( 교호 작용부분이다. 유의확률은 0.436 이므로귀 무가설 Ho 가채택된다. 즉 토양과비료는상호작용이없다 이기때문에비료와토양의독립적 인다음의분석이가능하다. 55
( 비료의유의확률 0.64는유의수준 0.05보다크므로귀무 ( 영 가설 Ho 가채택된다. 즉 유의 수준 5%( 신뢰수준 95% 에서두종류의비료에따른옥수수수확량은차이가없다. ( 토양의유효확률 0.000은유의수준 0.05보다작으므로대립 ( 연구 가설 H 이채택된다. 즉 유의수준 5% 하에서세종류의토양에따른옥수수의수확량은차이가있다. 옥수수의수확량이토양에따라다르므로어떤토양이옥수수의수확에가장크게영향을미치는 지를사후분석할필요가있다. < 사후분석 > 분석 > 일반선형모형 > 일변량재설정을누르고 [ 수확량 ] 을종속변수, [ 토양 ] 과 [ 비료 ] 를모수요인으로이동. 옵션을눌러출력에서모수추정값선택후계속. 사후분석을클릭한후 [ 토양 ] 을사후검정변수로이동. 등분산을가정함내에있는 LSD 와 Duncan 을 check. 계속 > 확인 사후분석결과 토양 종속변수 : 수확량 LSD (I 토양토양 토양 토양 3 (J 토양토양 토양 3 토양 토양 3 토양 토양 관측된평균에기초합니다. *..05 수준에서평균차는유의합니다. 다중비교 95% 신뢰구간 평균차 (I-J 표준오차 유의확률 하한값 상한값 -6.83*.009.000-9.03-4.63 -.00.009.34-3.0.0 6.83*.009.000 4.63 9.03 5.83*.009.000 3.63 8.03.00.009.34 -.0 3.0-5.83*.009.000-8.03-3.63 동일집단군 56
수확량 집단군 토양 N Duncan a,b 토양 6.00 토양3 6.00 토양 6 7.83 유의확률.34.000 동일집단군의그룹에대한평균이표시됩니다. 유형 III 제곱합에기초합니다오차항은평균제곱 ( 오차 = 3.056 입니다. a. 조화평균표본크기 6.000 을 ( 를 사용합니다. b. 유의수준 =.05. 위의평균값들은이미이론에서계산된것들이다. 토양 과 3 은거의차이가없고토양 는 이들과차이가있다. 따라서토양 를이용하면옥수수의소출을극대화할수있다. SPSS 통계처리문제 ( 상호작용이있는경우 [ 보기 _6] 아래표는어느공장에 4 가지반응온도와 3 종류의원료에의하여제품의수율에 미치는영향을조사하고자각수준의조합마다 3 회씩반복하여얻은수율자료이다. 다음을이론 으로계산하여검정하고 SPSS 에서얻은결과와비교하라. (a Levene s test표작성과유의수준 0.05 에서등분산인지검정하라. (b 등분산이입증되면가설을세우고그에따른분산분석표를작성하며유의수준 0.05 에서 각가설을검정하라. (c 상호작용이있을경우사후분석으로두요인의효과를동시에고려한처리평균에대하여다 중비교를하라. 표 [-6] 반응온도와원료에따른제품의수율 원료 온도 인자의수준 ( 반응온도 3 4 7 70 60 50 73 7 6 49 70 7 57 5 평균 ( 합 7.333(4 7(3 59.333(78 50(50 79 75 68 59 75 74 67 60 76 76 65 55 평균 ( 합 76.667(30 75(5 66.667(00 58(74 3 73 70 66 57 75 68 6 56 76 7 63 54 합계 평균 755 6.967 89 69.0833 79 65.967 57
74.667(4 69.667(09 63.667(9 55.667(67 합계 668 647 569 49 375 평균 74. 7.889 63. 54.556 65.97 ( 풀이 (a <Levene s test: 등분산검정 > z 에의한 Levene s test 표는다음과같이만들어진다. j k j k j 표 [-7] Levene s test 표 요인 3 4 0.333.667.333 0 0.667.667.333 평균 z. z 0.667 z3.555 z4 0.667.333.667 0.667 0.333 0.333.667 평균 z.555 z 0.667 z3. z4 3.667 0.333.333 0.333.667.333.333.667 0.667 평균 z3. z3. z33.556 z34. 총평균 평균 0 z(r 3 z(r.33.333 0.333.667 z3(r. z(c.59 z(c 0.85 z3(c.407 z4(c.59 z =.85 여기서아래첨자 (r 은 row( 행, (c 는 column( 열 을의미한다. 등분산가설 귀무 ( 영 가설 H 0 : j( j 집단에대한분산이동일하다. 대립 ( 연구 가설 H : 가설의검정통계량 Levene s test: j중하나이상다른분산이존재한다. p q j L p q r F p 는반응온도의종류로 p 4 q 는원료의종류로 q 3 pq( r r( zjz ( pq ( z zj j k r 은측정횟수로 r 3. p q r 4 3 3 ( z z j ( z z j j k j k j k j k (0.333. (.667. (.333.556 (.667. 3.037 j k 58
F 4 3 z j j z ( (.. (0.667. (...90 p q pq( r r( zjz j (4(3((3(.90 L p q r ( pq ( z j j k j k z ((3.037 0.959 에서자유도, 4 유의수준 0.05 F(, ; F(,4;0.05.6 F - 분포 : http://www.statdstrbutons.com/f/ ( F(,4; 0.05 의분포값 (a [p-value] box 에 0.05 입력. (b [numerator d.f.] box 에 입력. (c [denomnator d.f.] box 에 4 입력. (d [rght tal] 을선택. [F-value] box 에서다음의값을얻을것이다. F(, ; F(,4;0.05.6 ( FL 의확률 ( 유의확률 (a [numerator d.f.] box 에 입력. (b [denomnator d.f.] box 에 4 입력. (c [rght tal] 을선택. (d [F-value] box 에 0.959 입력. [p-value] box 에서다음의확률을얻는다. PF ( L 0.959 0.506 의 F - 분포값 Levene s test( 등분산검정 결과 : F 0.959 F(,4;0.05.6 이므로반응온도와원 L 료들의교합에의해이루어진실험치들은서로간에등분산이다. 또한유의수준 와비교하여유 의확률은 PF ( L 0.9587 0.506 > 0.05 이기때문에 H o ( 등분산 가채택된다. (b < 분산분석 > 등분산이입증되었기때문에다음은분산분석에의해차례로검정해야할네종류의귀무가설내 용이다. 이들의반대가대립 ( 연구 가설 H 이다. ( Ho( : 반응온도와원료는수율과관련이없다. ( Ho( C : 반응온도와원료는상호작용으로수율에영향을주지않는다. (3 Ho( : 반응온도사이에수율의차이는없다. (4 Ho( : 원료의종류에따른수율의차이는없다. 여기서 ( 은수정모형의타당성검정으로 Ho( 가기각되고 H ( 59 이채택되어야다음검
정 ( 를행할수있다. ( 는반응온도와원료사이의상호작용을검정하는것으로귀무가설 H ( o C 가채택되어야그다음단계 (3 과 (4 를검정할수있다. 여기서 C 는 를의미한다. 만일상호작용 H ( C 가채택되면 (3 과 (4 의검정은무의미하다. 이들가설을검정하려면다음의계산에의해분산분석표를작성하여야한다. 여기서는변동값을 얻기위하여계산공식을사용하도록하자. 변동계산 수정항 : 총변동 : 급간변동 (375 C 56684.078 N 36 p q r p q r ( j k j k j k j k S C p _ c qr q j _ r pr j p q j r j S C S C [(7 (73 (54 ] 56684.078 50.97 [(668 (647 (569 (49 ] 56684.078 68.75 9 [(755 (89 (79 ] 56684.078 8. [(4 (30 (67 ] 56684.078 44.6389 S C 3 S S S S 44.6389 68.75 8. 44.6667 C 급내변동 ( 오차 : S S S 50.97 44.6389 69.3333 자유도 (degree of freedom 총자유도 pqr 36 35 의자유도 의자유도 교호 ( 상호 작용자유도 : p 4 3 급내변동자유도 : q 3 : C ( p( q (3( 6 C : pq( r (4(3(3 4 수정모델자유도 : pq 평균제곱 ( 분산 S 68.75 V( MS 7.967 3 SC 44.6667 VC( MSC 7.4445 C 6 S 69.3333 V( MS.8889 4 S 8. V( MSb 4. S 44.64 V.967 검정통계량 60