실험설계개요어떤원인이반응에유의한영향을주고있는가를파악하고그영향이양적으로어느정도큰가를알아내고자실시함 ( 추정과검정 ) 적은영향밖에미치지못하는요인 ( 오차 ) 들은전체적으로어느정도영향을주고있으며, 측정오차는어느정도인가를알아내고자실시함 ( 오차항추정 ) 유의한영향을미치는원인들이어떠한조건을가질때가장바람직한반응을얻을수있는가를알아내기위해서실시함 ( 최적화 ) 용어 요인 (Factor): 요인은제어가능한변수중하나로반응에미치는영향을의미하며, 실험공정에서연구된다. 요인 ( 인자 ) 은 X로표현된다. 인자 ( 요인 ) 는온도나시간처럼정량적일수있고또한다른기계, 다른작업자, 또는환경처럼정성적일수있다. 반응 (Response): 주어진수준에서인자들의수준조합에의해측정되는 ( 생산되는 ) 특성치이다. 수준 (Level): 인자수준이란실험에서조절될수있는인자값을의미한다. 교호작용 (Interacton): 두인자들사이의조합에서일어나는효과 기본원칙 Randomzaton 랜덤화 관심요인외에기타원인들의영향이실험결과에미치지않게함 시간에따라변하는인자의효과나경향을실험을시간대에대해균일하게배치함으로써약화시킬수있다. Blocng 블록화 동일한성질을가진단위들의집합 (Bloc) 실험전체를시간적혹은공간적으로분할하여 Bloc 을만들어주면각 Bloc 내에서는실험환경이균일하게되어좀더좋은결과를얻을수있다. 46
Bloc 은실험계획시또다른독립변수 ( 요인 ) 로취급해야한다. 실험이이틀에걸쳐서수행되었다고하면실험일을 Bloc 이라한다. Replcaton 반복화 실험조건을처음부터다시 setup 하여실험하는것. 실험의재현성을알아보기위한방법 : 실험결과의신뢰성을높일수있다. 오차변동을계산할수있다. ( 참고 ) Repetton : 동일실험조건에서즉시반복실험 => 평균관측치를하나의 관측치로이용 Confoundng 교락 두개이상인자의효과가함께나타나고그효과를각각의인자에의한효과로분리해낼수없을경우그인자들은교락 (Confoundng) 되어있다고한다. 구할필요가없는 인자교호작용이나고차의교호작용 (nteracton effect) 을블록또는주효과와교락시켜실험의효율을높일수있다. -요인설계 (4 개실험조건 ) 요인 A 주효과 : 클럽효과수준 = (New, Old) : 수준별평균의차이 요인 B 주효과 : 경기기각수준 = ( 밤, 낮 ) (AB) 교호효과 : 두요인수준의결합조건의평균차이 47
One-way ANOVA 일원분산분석개요 요인 ( 분류형, 질적설명변수 ) 이하나 집단이 3개이상인모집단평균차이검정 실험설계에서는 CRD completely Randomzed Desgn 완전임의설계 데이터 기호 = 처리변수수준첨자, = 반복첨자 n = 처리변수 수준의반복수, n = 실험총반복수 y : 처리변수 번째수준의 번째반복의종속변수결과값 y. : 처리변수 번째수준의종속변수평균 y.. : 종속변수반응값의총평균 모형 model Y e, 1,,...,, 1,,..., n MVUE : ˆ y, y. ˆ.. 가정 assumpton e ~ dn(0, ) 독립성 / 정규성 / 등분산성 48
집단간평균의차이? 귀무가설 :... 1 ( 모든집단평균은동일하다 ) 모든 0 주효과는유의하지않음 ) 요인의효과는유의하지않다. 대립가설 : 적어도하나이상의집단평균은유의하다. ( 요인의 y 35 변동분해 Varaton Decomposton 총변동자승합 SST (Total Sum of Squares) SST ( Y Y ) (3) n 1 1.. SST n 1 1 ( Y n Y.. ) ( Y Y ) ( Y Y ) (1) () 1 1. n 1 1... (1) = SSE (Error SS 집단내변동, 오차변동 ) () = SSA (Between SS / Treatment SS 집단간변동, 처리변동, 요인 A 주효과 ) 가정 e ~ dn (0, ) 으로부터 y ~ dn (, ) 이므로 SSA ~ ( 1), SSE ~ ( n 1) 이고서로독립이다. SSA/( 1) 그러므로 ~ F( 1, n 1) SSE /( n 1) 49
분산분석표 ANOVA table 변동자유도자승합평균자승합 F 요인변동 -1 SSA 오차변동 n--1 SSE 총변동 n-1 SST SSA MSA ( 1) SSE MSE ( n 1) MSA TS ~ MSE F( 1, n 1) 비즈니스표작성 집단평균 (M) 표준편차 (SD) F- 검정통계량 1 유의확률포함 사후검정 (Post-hoc test) 혹은다중비교 (multple comparson) 분산분석의 F- 검정은단지귀무가설 H 0 : u1 u... ut 즉전체적인차이를 검정하는것이다. 그러므로수준별차이 (parwse: 예 : H 0 : u 1 u 3 ) 가있는지혹은 수준의선형결합대비 (contrast: 예 : H 0 : u 1 u u 3 ) 의차이가있는지검정할필요가 있는데이를사후검정혹은다중비교 ( 대비포함 ) 라한다. 사후검정이므로비록 F- 검정결과와관계없이 ( 귀무가설을채택하더라도 ) 시행하게된다. 다중비교에서는여러개의가설을동시에검정하므로유의수준을조정해야한다. 이를조정된실험유의수준 (controlled expermental error rate) 이라하고 1 (1 ) 이다. 여기서 c는가설수를의미한다. parwse 다중비교의경우 c t( t 1) / 가 된다. Fsher s Least Sgnfcant Dfference parwse ( 두수준별평균비교 ) 검정에사용하나이는다중비교에해당되지는않는다. 두모집단평균차이검정에서통합분산 (pooled varance) 대신 MSE 사용한다. Tuey HSD(honestly sgnfcant dfference) procedure Y Y q MSE / 분포에대한표제공 n c 50
가장보수적인 ( 귀무가설기각하지않음 ) 방법이다. ( 자연과학분야 ) Duncan Multple range test Tuey 방법과매우유사하나수준별표본평균을크기순으로나열하여 차이가가장큰것을비교해가면서유의수준을검정한다. r 은검정단계순서이다. 1 (1 ) r 으로조정해가면서 귀무가설을기각할확률이매우높아자주사용하지않는다. Scheffe s S method 대비 (contrast) 까지고려한다중비교방법이다. ( 사회과학분야 ) Dunnett s procedure 처리효과의수준하나가 control ( 실험집단 ) 인경우 ( 예 : placebo 집단, 교육을하지않는집단, 이전약투여집단 ) 이집단과다른집단들을 parwse 비교할경우사용된다. 예제데이터 SHIPS.xls 유람선운영 S 사는배의크기에따른고객만족도점수의차이가있는지 알아보기위한조사한것이다. 배크기별로 8 개유람선임의추출, 각유람선탑승 고객의평가점수를평균한측정치이다. One-way ANOVA ods graphcs on; proc glm data=shp; class sze; model score=sze; means sze / scheffe; run;qut; proc tabulate data=shp; class sze; var score; table (sze all), (score)*(mean std); run; 고정된경우대응변인의유의성검증 Type III 는다른요인의효과가 51
F- 검정결과배크기에따른만족도의차이는유의함 다중비교결과 ( 소형 > 중형 ) > ( 중형 > 대형 ) : 그러므로소형과대형배의승객의 만족도차이만유의하다. Two-Way ANOVA 개요 요인 ( 분류형, 질적설명변수 ) 이두개 요인개별효과를주효과 ( 각요인의수준별평균차이 ) 두요인의수준결합에의해평균의차이가나는효과, 사회과학분석에서는일반적으로교호효과를사용하지않는다 ( 이유는설명이용이하지않음 ). 주효과를보기위한변동분해로만사용한다. 5
모형 model Y b ( ab) e, 1,,..., a, 1,,..., b 가정 assumpton e ~ dn (0, ) 독립성 / 정규성 / 등분산성 통계적가설귀무가설 : 요인 A의수준별평균의차이는없다 요인 A 주효과유의하지않음귀무가설 : 요인 B의수준별평균의차이는없다 귀무가설 : 모든 ( ab ) 0 요인 (A, B) 의교호작용은유의하지않음 변동분해 Varaton Decomposton 총변동자승합 SST (Total Sum of Squares) SST n 1 1 ( Y Y ).. SST a b a b a b a b ( Y Y. Y. Y.. ) ( Y. Y.. ) ( Y. Y.. ) ( Y Y Y. Y.. ) 1 1 1 1 1 1 1 1 SSE SSA SSB SSAB 분산분석표 ANOVA table 변동 자유도 자승합 평균자승합 (= 자승합 / 자유도 ) F 요인 A 주효과 a-1 SSA MSA MSA/MSE~F 요인 A 주효과 b-1 SSB MSB MSB/MSE~F (AB) 교호효과 (a-1)(b-1) SSAB MSAB MSAB/MSE~F 오차변동 차이 SSE MSE Total 총변동 n-1 SST 비즈니스표작성 요인 A 요인 B 1 A F-검정통계량 1 b 평균 SD 요인 A 주효과요인 B 주효과요인 AB 교호효과 53
예제데이터 SHIPS.xls Heght: 0 f step at the low (5.75") heght, 1 f at the hgh (11.5") heght Frequency: the rate of steppng. 0 f slow (14 steps/mn), 1 f medum (1 steps/mn), f hgh (8 steps/mn) Rest_HR: the restng heart rate of the subect before a tral, n beats per mnute HR: the fnal heart rate of the subect after a tral, n beats per mnute 요인 ( 계단높이, 올라가는속도 ) 가운동후심장박동 (HR) 에영향을미치나? One-way ANOVA ods graphcs on; proc glm data=heart; class frequency heght; model hr=frequency heght; means frequency / tuey; run;qut; proc tabulate data=shp; class sze; var score; table (sze all), (score)*(mean std); run; 대체 빈도, 높이모두유의함, 교호작용유의하지않음 54
높이가높으면심장박동이높아진다 빈도가많으면심장박동이높아진다. 빈도 = 만다른빈도와유의한차이있음 교호작용은유의하지않음 => ( 높이 =1, 빈도 =) 결합조건에서심장박동이가장높아진다. 예제 다음은가솔린종류 (A, B, C) 와첨가제 (1,, 3, 4) 에따른연비의차이가있는 알아보기위하여동일차종 4 대를이용하여 ( 물론차에의한차이도있을것이라 생각되지만무시한다 ) 측정한결과이다. 첨가제가솔린 1 3 4 A 7.4 8.6 33 3 33.5 3.3 30.8 9.7 B 33.3 34.5 35.6 34.4 33.4 33.1 9.6 30.6 C 33 33.5 34.7 33.3 33 3 8.6 9.8 공분산분석 ANCOVA (Analyss of Covarance) 공변량 (covarate) 종속변수값에대한요인들의유의성검정을제대로하기위해고려되는변량 일반적으로종속변수의실험전값이다. ( 예 ) 교육효과에서의사전점수 공변량은관심의대상이아니라요인의유의성검정을정확하기위하여고려함 모형 Y a b ( ab) x One-way ANOVA ods graphcs on; proc glm data=heart; class frequency heght; model hr=resthr frequency heght ; means frequency / tuey; run;qut; 55
공변량은유의함 빈도, 높이요인유의함, 교호효과유의하지않음 56