ANOVA 기본개요세집단이상인평균비교 => 일원분산분석집단을요인 (factor) 혹은처리효과 (treatment effect) 라하고집단의개별값을수준 (level) 이라한다. 요인이하나인경우 one-way ANOVA 분산분석 (ANOVA Analyss Of VArance) 은실험설계로부터유래, 분산 ( 변동 ) 에의해요인 ( 모형 ) 의유의성를검증한다. 실험관심대상에대한정보를얻기위한계획된테스트나관측절대실험 absolute experment 3G 서비스에대한고객만족도와같이현상을관찰 ( 관측, 조사 ) 하여관심대상에어떤현상이나타나는지분석비교실험 comparatve experment 기존마케팅전략과새로운마케팅전략비교와같이관심현상에영향을요인 (factor) 을조절하여반응 (response) 변화분석 Control vs. Expermental group Placebo 효과 Pre and Post test 용어실험단위 : 처리 ( 실험조건, 요인수준 ) 가가해지는최소단위관찰단위 : 개체의최소단위반응 (response): 관심대상의측도, output, Y 요인 (factor): 제어가능하며반응에영향을주는인자, X s 설명변수에해당수준 (level): 실험에사용되는요인의값, 범주형이거나실험에서설정된측정값 1
실험설계원리 Randomzaton ( 랜덤화 ) : 실험단위의배정과실험순서랜덤하게결정 실험의객관성보장 Replcaton( 반복 ) : 동일처리를 2 개이상의실험단위에가함 실험오차계산 Blockng( 블록화 ) : 랜덤화불가능, 실험의정도를높인다. ( 예 ) 농지 6 개, 비료 (A, B, C) Repetton: 같은조건에서여러번반복실험, 관측치는평균하나만사용 용어 2 주효과 (man effect): 요인이반응변수에미치는영향교호효과 (nteracton effect): 인자의결합조건이반응변수에미치는영향교락 (confoundng): 두개이상의효과를분리할수없는경우 반응치 전체평균 + 처리효과 (Σ주효과 +Σ교호효과 )+( 블록효과 +)+( 실험오차 + 관찰오차 ) Yjk = μ + α + β j + ( αβ ) jk + εjk 2
데이터와모형다음은 3 개호수의산소량의차이가있는지알아보기위하여각호수의중앙에서깊이 1m 의물로부터산소량 (ppm) 을측정한자료이다. 호수에서위치에따라산소량의차이가있을것이므로 10 곳을선택하여각산소량을측정한것이다. Lake Observaton 1 0 2 1 3 1 2 3 4 1 5 2 1 3 4 6 8 7 5 3 4 5 3 14 26 25 18 19 22 21 16 20 30 모형 Yj = μ + α + εj ( 가정 ) ε ~ (0, σ 2 j N ) 요인에의한설명변동 + 오차변동 집단 ( 수준 ) 내 (wthn) 변동 2집단 ( 수준 ) 간 (between) 변동 3총변동 (Total Sum of Squares) 총변동3=SSB 2 + SSW 점추정치 ˆμ = =, ˆμ = = Y.. Y j j Y. Y j j 총변동분해 (decomposton) 집단첨자는, 반복첨자는 j 3
총변동 (SST: Total SS) ( 2 j.. ) j 집단간변동 (SSB: Between SS) ( 2... ) j SSA : 요인 A 변동, 요인각수준의평균차이집단내변동 (SSW: Wthn SS) ( 2 j. ) j SSE: 오차변동 ANOVA table 집단의개수 k, 총데이터개수 n 이라하면, 변동자유도 SS MS F Between ( 요인 A) k-1 SSA(=SSB) MSB=SSB/(a-1) Wthn ( 오차 ) n-k SSE(=SSW) MSE=SSE/(n-a) (MSE 는 σ 2 Total ( 총 ) n-1 SST 추정치 ) MSB/MSE ~ F(k-1,n-k) 분산분석 산소량 집단 - 간집단 - 내합계 제곱합 자유도 평균제곱 F 유의확률 2117.400 2 1058.700 105.518.000 270.900 27 10.033 2388.300 29 요인유의성귀무가설 : μ 1 = μ 2 = = μ a ( 수준 ( 집단 ) 별반응변수평균은동일하다 ) α 1 = α 2 = = α a =0 집단이 2 개이면독립인 t-검정대립가설 : 적어도한집단의평균은다르다. 4
사후검정 (post-hoc test) 다중비교에서는여러개의가설을동시에검정하므로유의수준을조정해야한다. 이를조정된실험유의수준 (controlled expermental error rate) 이라하고 1 (1 α) c 이다. 여기서 c 는가설수를의미한다. 집단간 (parwse) 평균차이, 집단그룹간 (contrast) 평균차이 분산분석 F-검정결과에관계없이시행 Fsher s Least Sgnfcant Dfference parwse ( 두수준별평균비교 ) 검정에사용하나이는다중비교에해당되지는않는다. 두모집단평균차이검정에서통합분산 (pooled varance) 대신 MSE 사용한다. MSE 1/ n + 1/ 1 n2 다중비교 (multple comparson) Tukey Honestly Sgnfcant Dfference( 자연과학 ) Scheffe( 사회과학 ) DUNCAN : 가장 Lberal 방법 Dunnett (control 집단과비교 ) q = j MSE / n 대비 (contrast) 처리효과수준별선형결합의차이가있는지알아보기위한분석방법이다. 대비정의 : Q = c μ, c = 0, Q ˆ = c Y. ( Qˆ ) 2 검정통계량 : F = ~ F( 1, n k) c 2 MSE( ) n 호수 1 이동쪽에있고호수 2, 3 이서쪽에있는경우동쪽호수와서쪽호수간의산소량의차이가있는가? 대비 : Q = u ( u + 3 ) / 2 추정치? Q = y ( y + 3 ) / 2 1 2 u 1 2 y 5
( 연습문제 ) SHIP.XLS (1) 배의크기에따른고객만족도의차이가있나? (2) 집단간 Parwse 사후검정하시오. (3) ( 작은배 ), (M, L) 차이가있는지검정하시오. Name Small Name Medum Name Large Hanseactc 90.5 Amsterdam 91.1 Century 89.2 Msssspp Queen 78.2 Crystal Symphony 98.9 Dsney Wonder 90.2 Phlae 92.3 Maasdam 94.2 Enchantment of the Seas 85.9 Royal Clpper 95.7 Noordam 84.3 Grand Prncess 84.2 Seabourn Prde 94.1 Royal Prncess 84.8 Infnty 90.2 Seabourn Sprt 100 Ryndam 89.2 Legend of the Seas 80.6 Slver Cloud 91.8 Statendam 86.4 Paradse 75.8 Slver Wnd 95 Veendam 88.3 Sun Prncess 82.3 earnfecton.xls 6