MINITAB 보조도구백서 이문서는 Minitab Statistical Software 의보조도구에서사용되는방법과데이터검사를 개발하기위해 Minitab 통계학자들이실시한연구에대해설명하는전체백서중하나입니다. 2- 표본 t- 검정 개요 2-표본 t-검정은 2개의독립적인집단이서로다른지비교하기위해사용할수있습니다. 이검정은두모집단이모두정규분포를따르고분산이같다는가정하에서도출됩니다. 정규성가정은중요하지않지만 (Pearson, 1931; Barlett, 1935; Geary, 1947), 등분산가정은표본크기가크게다른경우에중요합니다 (Welch, 1937; Horsnell, 1953). 일부실무자는기존 2-표본 t 절차를수행하기전에등분산을평가하기위한예비검정을먼저수행합니다. 그러나이런분산검정에는중요한가정과제한이적용되기때문에이방법에는심각한단점이있습니다. 예를들어기존 F-검정같은여러등분산검정은정규성이탈에민감하게반응합니다. 그외에 Levene/Brown-Forsythe처럼정규성가정에의존하지않는검정은분산의차이를탐지하는검정력이낮습니다. B.L. Welch는 2개의독립적인정규분포의분산이다를경우두분포의평균을비교하는근사방법을개발했습니다 (Welch, 1947). Welch의수정된 t-검정은등분산가정에따라도출되지않으므로사용자는등분산검정을먼저실시하지않고도두모집단의평균을비교할수있습니다. 이문서에서는 Welch의수정된 t 방법을기존 2-표본 t 절차와비교하고어느절차의신뢰성이가장높은지결정합니다. 또한자동으로수행되고보조도구보고서카드에표시되는다음데이터검사에대해설명하고이런검사가분석결과에어떤영향을미치는지설명합니다. 정규성 비정상데이터 표본크기 WWW.MINITAB.COM
2- 표본 t- 검정방법 기존 2- 표본 t- 검정과 Welch 의 t- 검정비교 분산이같은 2개의정규분포모집단에서얻어진데이터에대해기존 2-표본 t-검정의검정력은 Welch의 t-검정과같거나더우수합니다. 정규성가정은기존절차에중요하지않지만 (Pearson, 1931; Barlett, 1935; Geary, 1947), 등분산가정은유효한결과를보장하는데중요합니다. 더구체적으로말하면기존절차는표본크기가다를때표본크기에관계없이등분산가정에민감합니다 (Welch, 1937; Horsnell, 1953). 그러나실제로는등분산가정이참인경우가드물며, 이로인해제1종오류율이더높아질수있습니다. 그러므로두표본의편차가다를때기존 2-표본 t-검정을사용하면검정에서잘못된결과가나올가능성이더큽니다. Welch의 t-검정은분산이같다고가정하지않아표본크기에관계없이동일하지않은분산에민감하게반응하지않으므로기존 t-검정을대체할수있는실용적인대안입니다. 그러나 Welch의 t-검정은근사기반이고표본크기가작을때효과적이지않을수있습니다. 당사는 Welch의 t-검정이나기존 2-표본 t-검정이보조도구에서사용할수있는가장신뢰할수있는실용적인검정인지판단하고자했습니다. 목적당사는시뮬레이션연구와이론적인도출을통해 Welch의 t-검정과기존 2-표본 t-검정중어느검정의신뢰도가더높은지파악하고자했습니다. 보다구체적으로는다음을조사하고자했습니다. 데이터가정규분포를따르고분산이같을때다양한표본크기에서기존 2-표본 t- 검정과 Welch t-검정모두의제1종및제2종오류율 기존 2-표본 t-검정이효과적이지않은분산이다른불균형설계에대한 Welch의 t- 검정의제1종및제2종오류율방법시뮬레이션에서는다음세가지부분에초점을맞췄습니다. 정규성, 비정규성, 등분산, 이분산, 균형및불균형설계가포함된다양한모형가정 하에서기존 2- 표본 t- 검정과 Welch t- 검정의모의검정결과를비교했습니다. 자세한 내용은부록 A 를참조하십시오. 2- 표본 T- 검정 2
Welch t- 검정의검정력함수를도출하고기존 2- 표본 t- 검정의검정력함수와 비교했습니다. 자세한내용은부록 B 를참조하십시오. 비정규성이 Welch t- 검정의이론적검정력함수에미치는영향을조사했습니다. 결과기존 2-표본 t 모형에대한가정이참이면 Welch의 t-검정은소규모불균형설계를제외하고기존 2-표본 t-검정과검정력이유사합니다. 그러나기존 2-표본 t-검정은등분산가정에대한민감도가높기때문에소규모불균형설계에서검정력이낮을수도있습니다. 또한실제설정에서는두모집단의분산이정확히동일함을증명하기가어렵습니다. 따라서 Welch의 t- 검정과비교한기존 2-표본검정의이론적인우월성은실용적인가치가거의또는전혀없습니다. 이런이유로보조도구에서는 Welch의 t-검정을사용하여두모집단의평균을비교합니다. 자세한시뮬레이션결과는부록 A, B, C를참조하십시오. 2- 표본 T- 검정 3
데이터검사 정규성 보조도구에서독립적인두모집단의평균을비교하기위해사용하는 Welch의 t-검정은모집단이정규분포를따른다는가정하에도출됩니다. 데이터가정규분포를따르지않더라도 Welch의 t-검정은표본이충분히클경우검정력이우수합니다. 목적당사는 Welch 방법과기존 2-표본 t-검정의모의유의수준이목표유의수준 ( 제1종오류율 ) 0.05와얼마나가깝게일치하는지확인하고자했습니다. 방법정규분포를따르는모집단, 치우친모집단및오염된정규분포를따르는 ( 등분산및이분산 ) 모집단으로부터생성된 10,000쌍의독립표본에대해 Welch의 t-검정과기존 2-표본 t-검정의시뮬레이션을수행했습니다. 표본의크기는다양했습니다. 정규분포모집단은비교를위한대조모집단으로사용됩니다. 각조건에대해모의유의수준을계산하고이를목표또는명목유의수준 0.05와비교했습니다. 검정이효과적이면모의유의수준이 0.05와가까울것입니다. 결과표본크기가중간이상일때 Welch의 t-검정은정규및비정규데이터에대해모두일정한제1종오류율을유지합니다. 두표본의크기가모두 15 이상이면모의유의수준은목표유의수준에가깝습니다. 자세한내용은부록 A를참조하십시오. 이검정은표본이상대적으로작을때도효과적이기때문에보조도구는데이터의정규성을검사하지않습니다. 대신표본크기를확인하고보고서카드에다음과같은상태를표시합니다. 상태 조건 두표본크기가모두 15 이상이므로정규성은문제가되지않음. 하나이상의표본크기가 15 미만이므로정규성이문제가될수있음. 2- 표본 T- 검정 4
비정상데이터 비정상데이터는특이치라고도하는극도로크거나작은데이터값입니다. 비정상데이터는분석결과에심각한영향을미칠수있습니다. 표본이작을때비정상데이터는통계적으로유의한결과를찾을확률에영향을미칠수있습니다. 비정상데이터는데이터수집의문제나프로세스의비정상적인동작을나타낼수있습니다. 따라서이런데이터점은조사할만한가치가많으며, 가능하면수정해야합니다. 목적당사는전체표본에비해매우크거나매우작고분석결과에영향을미칠수있는데이터값이있는지확인하는방법을개발하고자했습니다. 방법당사는 Hoaglin, Iglewicz & Tukey(1986) 가설명한상자그림에서특이치를식별하는방법을토대로비정상데이터를검사하는방법을개발했습니다. 결과보조도구는분포의하위또는상위사분위수로부터사분위간범위의 1.5배이상벗어난데이터점을비정상데이터로구분합니다. 하위및상위사분위수는데이터의 25번째및 75번째백분위수에해당됩니다. 사분위간범위는두사분위수의차이입니다. 이방법을사용하면특정특이치를각각탐지할수있기때문에특이치가여러개일때도효과적입니다. 특이치는표본크기가매우작을때만검정력함수에영향을미치는경향이있습니다. 일반적으로, 특이치가있을때관찰되는검정력값은목표이론적검정력값보다약간높은경향이있습니다. 이패턴은부록 C의그림 10에서확인할수있습니다. 여기서모의및이론적검정력곡선은최소표본크기가 15에도달할때까지합당한수준으로가까워지지않습니다. 비정상데이터가있는지검사할때 2-표본 t-검정에대해보조도구보고서카드에는다음과같은상태가표시됩니다. 상태 조건 비정상적인데이터점없음. 2- 표본 T- 검정 5
상태 조건 하나이상의데이터점이비정상이고검정결과에영향을미칠수있음. 표본크기 일반적으로가설검정을수행하여 " 차이가없는 " 귀무가설을기각하기위한증거를수집합니다. 표본이너무작으면검정의검정력이실제로존재하는평균의차이를탐지하는데충분하지않아서제2종오류가발생할수있습니다. 따라서실제로중요한차이를높은확률로탐지할만큼큰표본크기를사용하는것이중요합니다. 목적현재데이터에서귀무가설을반박하는증거를충분히얻을수없는경우에는표본크기가검정에서탐지하고자하는실제차이를높은확률로탐지하기에충분히큰지확인하고자했습니다. 표본크기계획의목적은중요한차이를높은확률로탐지할수있는충분한크기의표본을사용하기위한것이지만, 표본이너무커서무의미한차이를통계적으로유의하다고판단내릴확률이높아져서도안됩니다. 방법검정력및표본크기분석은통계적분석을수행하는데사용되는특정검정의이론적검정력함수에기초합니다. Welch t-검정의경우이검정력함수는표본크기와두모집단의평균차이, 그리고두모집단의실제분산에의해결정됩니다. 자세한내용은부록 B를참조하십시오. 결과데이터로부터귀무가설을반박하는충분한증거를얻을수없으면보조도구는주어진표본크기에대해 80% 및 90% 확률로탐지할수있는실제차이를계산합니다. 또한탐지하려는실제차이를사용자가제공할경우차이를 80% 및 90% 확률로탐지하는데필요한표본크기를계산합니다. 결과는구체적인표본에따라달라지므로보고할일반적인결과는없습니다. 그러나 Welch 검정의검정력함수에대한자세한내용은부록 B와 C를참조하십시오. 검정력과표본크기를확인할때 2-표본 t-검정에대해보조도구보고서카드에는다음과같은상태가표시됩니다. 2- 표본 T- 검정 6
상태 조건 검정에서평균의차이가탐지되므로검정력은문제가되지않음. 또는검정력이충분함. 검정에서평균의차이를찾지못했지만표본크기는주어진차이를 90% 이상의확률로탐지하기에충분함. 검정력이충분할수있음. 검정에서평균의차이를찾지못했지만표본크기는주어진차이를 80% - 90% 의확률로탐지하기에충분함. 90% 검정력을달성하기위해필요한표본크기가보고됨. 검정력이충분하지않을수있음. 검정에서평균의차이를찾지못했지만표본크기는주어진 차이를 60% - 80% 의확률로탐지하기에충분함. 80% 검정력과 90% 검정력을달성하는데 필요한표본크기가보고됨. 검정력이충분하지않음. 검정에서평균의차이를찾지못했으며표본크기는주어진차이를 60% 이상의확률로탐지하기에충분하지않음. 80% 검정력과 90% 검정력을달성하는데필요한표본 크기가보고됨. 검정에서평균의차이를찾지못함. 탐지할평균의실제차이를지정하지않았으므로보고서에는 표본크기, 표준편차및알파를기준으로 80% 및 90% 확률로탐지할수있는차이가표시됨. 2- 표본 T- 검정 7
참고문헌 Arnold, S. F. (1990). Mathematical Statistics. Englewood Cliffs, NJ: Prentice-Hall, Inc. Aspin, A. A.A. (1949). Tables for Use in Comparisons whose Accuracy Involves Two Variances, Separately Estimated, Biometrika, 36, 290-296. Bartlett, M. S. (1935). The effect of non-normality on the t-distribution. Proceedings of the Cambridge Philosophical Society, 31, 223-231. Box, G. E. P. (1953). Non-normality and Tests on Variances, Biometrika, 40, 318-335. Geary, R. C. (1947). Testing for Normality, Biometrika, 34, 209-242. Hoaglin, D. C., Iglewicz, B., & Tukey, J. W. (1986). Performance of Some Resistant Rules for Outlier Labeling. Journal of the American Statistical Association, 81, 991-999. Horsnell, G. (1953). The effect of unequal group variances on the F test for homogeneity of group means. Biometrika, 40, 128-136. James, G. S. (1951). The comparison of several groups of observations when the ratios of the populations variances are unknown, Biometrika, 38, 324-329. Kulinskaya, E. Staudte, R. G. & Gao, H. (2003). Power Approximations in Testing for unequal Means in a One-Way Anova Weighted for Unequal Variances, Communication in Statistics, 32(12), 2353-2371. Lehmann, E. L. (1959). Testing statistical hypotheses. New York, NY: Wiley. Neyman, J., Iwaszkiewicz, K. & Kolodziejczyk, S. (1935). Statistical problems in agricultural experimentation, Journal of the Royal Statistical Society, Series B, 2, 107-180. Pearson, E. S. (1931). The Analysis of variance in case of non-normal variation, Biometrika, 23, 114-133. Pearson, E.S. & Hartley, H.O. (Eds.). (1954). Biometrika Tables for Statisticians, Vol. I. London: Cambridge University Press. Srivastava, A. B. L. (1958). Effect of non-normality on the power function of t-test, Biometrika, 45, 421-429. Welch, B. L. (1951). On the comparison of several mean values: an alternative approach. Biometrika, 38, 330-336. 2- 표본 T- 검정 8
Welch, B. L. (1947). The generalization of Student s problem when several different population variances are involved. Biometrika, 34, 28-35. Welch, B. L. (1938). The significance of the difference between two means when the population variances are unequal, Biometrika, 29, 350-362. Wolfram, S. (1999). The Mathematica Book (4th ed.). Champaign, IL: Wolfram Media/Cambridge University Press. 2- 표본 T- 검정 9
부록 A: 비정규성과이종성이기존 2-표본 t-검정과 Welch t-검정에미치는영향 서로다른모형가정하에서기존 2-표본 t-검정과 Welch의 t-검정을비교하기위해고안된여러시뮬레이션연구를실시했습니다. 시뮬레이션연구 A 연구는다음의세부분으로나뉘어실시되었습니다. 연구의첫번째부분에서는정규성가정이참일때기존 2-표본 t-검정과 Welch의 t- 검정의등분산가정에대한민감도를조사했습니다. 2개의독립적인정규분포로부터표본 2개를생성했습니다. 기준표본인첫번째표본은평균이 0이고표준편차가 σ 1 = 2, N(0,2) 인정규모집단에서추출했습니다. 두번째표본도평균이 0인정규분포에서추출되었지만, 비율이 0.5, 1.0, 1.5 및 2가되도록표준편차를선택했습니다. 다시말해, 두번째표본은각각,, 및모집단에서추출되었습니다. 또한각각의경우에기준표본크기는으로고정되었고각각의주어진에대해표본크기의비율이약 0.5, 1, 1.5 및 2.0과같도록두번째표본크기를선택했습니다. 이들 2-표본설계에대해서는각모집단으로부터 10,000쌍의독립적인표본을각각생성했습니다. 그런다음, 10,000쌍의표본에대해각각 2-표본 t-검정과 Welch의 t- 검정을수행하여평균의차이가없다는귀무가설을검정했습니다. 평균의실제차이가없으므로, 10,000회의반복실험중에서귀무가설이기각된비율이검정의모의유의수준을나타냅니다. 각검정의목표유의수준은 α = 0.05이므로, 각검정및각실험과연관된시뮬레이션오류는약 0.2% 입니다. 두번째부분에서는비정규성, 특히치우침이두검정의모의유의수준에미치는영향을조사했습니다. 이시뮬레이션은기준표본을자유도가 2인카이-제곱분포Chi(2) 에서추출하고두번째표본을다른카이-제곱분포에서추출하여 ρ = σ /σ 의값이 0.5, 1.0, 1.5 및 2가되도록했다는점을제외하고이전시뮬레이션과 2 1 같은방법으로설정되었습니다. 가설평균차이는모집단평균의실제차이가되도록설정되었습니다. 2- 표본 T- 검정 10
세번째부분에서는특이치가두 t-검정의성능에미치는영향을조사했습니다. 이런이유로, 표본 2개는오염된정규분포에서추출되었습니다. 오염된정규분포 CN (p, σ) 는 2개의정규모집단, 즉 N(0,1) 모집단과정규 N(0, σ) 모집단을혼합한것입니다. 오염된정규분포는다음과같이정의됩니다. CN(p, σ) = pn(0,1) + (1 p)n(0, σ) 여기서 p는혼합모수이고 1 p는오염의비율, 즉특이치의비율입니다. X가 CN(p, σ) 로분포된경우평균은 μ X = 0이고표준편차는 σ X = p + (1 p)σ 2 임을증명하는것은쉽습니다. 기준표본은 CN(. 8, 4) 에서도출되었고두번째표본은오염된정규분포 CN(. 8, σ) 에서추출되었습니다. I부및 II부와마찬가지로, ( 오염된 ) 두모집단의표준편차비율 ρ = σ 2 /σ 1 이 0.5, 1.0, 1.5 및 2와같도록모수 σ를선택했습니다. σ 1 =. 8 + (1.8) 16 = 2.0이기때문에이는각각 σ = 1, 4, 6.40, 8.72를선택하는결과로이어집니다. 다시말해두번째표본은 CN(. 8, 1), CN(. 8, 4), CN(. 8, 6.4) 및 CN(. 8, 8.72) 에서추출되었습니다. 그다음으로, I 부에서설명한것과같은방법으로시뮬레이션을실시했습니다. 연구결과는표 1에정리되고그림 1, 2, 3에표시되었습니다. 결과및요약시뮬레이션결과는대체로기존 2-표본 t-검정이정규성과등분산가정하에서표본크기가작을때도목표수준에가까운유의수준을제공한다는이론적인결과를뒷받침합니다. 그림 1의두번째열그림은두정규모집단의분산이동일한설계의모의유의수준을표시합니다. 기존 2-표본 t-검정에따른모의유의수준은목표수준선과구별되지않습니다. 아래표에는정규모집단, 치우친모집단 ( 카이-제곱 ) 및오염된정규모집단으로부터각각생성된표본의쌍을기준으로 α = 0.05인기존 2-표본 t-검정과 Welch의 t-검정모두에대한양측검정의모의유의수준이나와있습니다. 표본의쌍은같은분포유형에서추출되었지만, 각모집단의분산은같지않을수있습니다. 2- 표본 T- 검정 11
표 1 n = 5 일때양측검정 ( 각각 α = 0.05 인기존 2- 표본 t- 검정과 Welch 의 t- 검정 ) 의모의유의 수준 기준모집단 : N(0,2) 2 차모집단 : N(0, σ 2 ) 기준모집단 : Chi(2) 2 차모집단 : 카이 - 제곱 기준모집단 : CN(.8,4) 2 차모집단 : CN(8, σ) σ 2 σ 1.5 1.0 1.5 2.0.5 1.0 1.5 2.0.5 1.0 1.5 2.0 n 1 방법 n 1 = 5 n 1 = 5 n 1 = 5 3.6 2T.035.050.079.105.058.042.078.113.031.036.035.034 Welch.035.039.049.055.048.029.055.063.029.024.021.020 5 1.0 2T.061.052.054.058.086.036.054.064.035.031.025.023 Welch.048.042.044.047.066.021.040.050.027.023.018.016 8 1.6 2T.096.048.033.027.133.041.033.032.059.037.029.024 Welch.050.045.043.042.094.034.032.041.034.029.026.022 10 2.0 2T.118.055.034.025.139.041.028.024.073.041.028.023 Welch.052.051.050.051.097.041.033.042.035.032.028.025 표 2 n = 10 일때양측검정 ( 각각 α = 0.05 인기존 2- 표본 t- 검정과 Welch 의 t- 검정 ) 의모의 유의수준 기준모집단 : N(0,2) 2 차모집단 : N(0, σ 2 ) 기준모집단 : Chi(2) 2 차모집단 : 카이 - 제곱 기준모집단 : CN(.8,4) 2 차모집단 : CN(8, σ) σ 2 σ 1.5 1.0 1.5 2.0.5 1.0 1.5 2.0.5 1.0 1.5 2.0 n 1 방법 n 1 = 10 n 1 = 10 n 1 = 10 5.5 2T.020.050.081.112.039.044.091.123.021.035.045.047 2- 표본 T- 검정 12
기준모집단 : N(0,2) 2 차모집단 : N(0, σ 2 ) 기준모집단 : Chi(2) 2 차모집단 : 카이 - 제곱 기준모집단 : CN(.8,4) 2 차모집단 : CN(8, σ) σ 2 σ 1.5 1.0 1.5 2.0.5 1.0 1.5 2.0.5 1.0 1.5 2.0 n 1 방법 n 1 = 10 n 1 = 10 n 1 = 10 Welch.046.048.050.050.043.047.067.063.034.028.022.019 10 1.0 2T.057.051.053.055.068.044.053.054.043.042.037.032 Welch.051.049.049.049.062.037.046.049.039.038.032.027 15 1.5 2T.088.048.034.029.100.043.032.032.064.040.028.021 Welch.050.048.047.048.074.044.041.046.035.037.035.031 20 2 2T.110.048.026.019.133.042.026.022.093.046.029.019 Welch.048.047.045.046.083.050.044.049.036.039.040.038 표 3 n = 15 일때양측검정 ( 각각 α = 0.05 인기존 2- 표본 t- 검정과 Welch 의 t- 검정 ) 의모의 유의수준 기준모집단 : N(0,2) 2 차모집단 : N(0, σ 2 ) 기준모집단 : Chi(2) 2 차모집단 : 카이 - 제곱 기준모집단 : CN(.8,4) 2 차모집단 : CN(8, σ) σ 2 σ 1.5 1.0 1.5 2.0.5 1.0 1.5 2.0.5 1.0 1.5 2.0 n 1 방법 n 1 = 15 n 1 = 15 n 1 = 15 8.53 2T.021.050.083.110.036.041.089.114.022.044.056.062 Welch.050.051.051.050.047.049.067.062.044.036.027.022 15 1.0 2T.049.047.050.053.064.046.051.061.045.045.041.037 Welch.045.046.049.048.060.042.048.057.042.043.039.033 23 1.53 2T.081.049.033.028.103.042.036.030.075.048.033.024 Welch.048.049.048.050.071.042.048.050.042.045.044.041 2- 표본 T- 검정 13
기준모집단 : N(0,2) 2 차모집단 : N(0, σ 2 ) 기준모집단 : Chi(2) 2 차모집단 : 카이 - 제곱 기준모집단 : CN(.8,4) 2 차모집단 : CN(8, σ) σ 2 σ 1.5 1.0 1.5 2.0.5 1.0 1.5 2.0.5 1.0 1.5 2.0 n 1 방법 n 1 = 15 n 1 = 15 n 1 = 15 30 2.0 2T.111.050.028.018.123.049.027.020.100.046.025.016 Welch.049.051.051.053.074.056.045.047.039.044.042.040 표 4 n = 20 일때양측검정 ( 각각 α = 0.05 인기존 2- 표본 t- 검정과 Welch 의 t- 검정 ) 의모의 유의수준 기준모집단 : N(0,2) 2 차모집단 : N(0, σ 2 ) 기준모집단 : Chi(2) 2 차모집단 : 카이 - 제곱 기준모집단 : CN(.8,4) 2 차모집단 : CN(8, σ) σ 2 σ 1.5 1.0 1.5 2.0.5 1.0 1.5 2.0.5 1.0 1.5 2.0 n 1 방법 n 1 = 20 n 1 = 20 n 1 = 20 10.5 2T.019.052.087.115.028.048.087.119.021.048.067.079 Welch.050.054.053.053.044.054.061.061.048.042.035.028 20 1.0 2T.048.049.052.053.057.046.052.056.049.044.042.040 Welch.045.049.051.050.055.044.050.052.047.042.040.037 30 1.5 2T.086.054.039.032.098.047.035.033.075.047.033.022 Welch.054.054.053.052.068.047.051.053.041.043.044.042 40 2.0 2T.107.049.026.016.123.046.027.019.107.047.026.016 Welch.048.049.046.047.070.054.046.045.044.043.043.042 2- 표본 T- 검정 14
그림 1 표본크기의비율과분산이같거나다른 2 개의정규분포로부터생성된표본쌍에 기초한두양측검정 ( 각각 α = 0.05 인기존 2- 표본 t- 검정과 Welch 의 t- 검정 ) 의모의유의수준 그래프. 시뮬레이션에서는표본이비교적작을경우기존 2-표본 t-검정이비정규성에대해서는강하지만 2-표본설계가불균형인경우등분산가정에는민감하다는결과가나왔습니다. 이내용은그림 1, 2, 3에그래프로나와있습니다. 기존 2-표본 t-검정에기초한모의유의수준곡선은분산이매우다를때도표본크기의비율이 1.0인지점에서목표수준곡선과교차합니다. 세가지분포유형 ( 정규, 카이-제곱및오염된정규분포 ) 의경우에모두표본크기가다르면기존 2-표본 t-검정의모의유의수준은분산이같을경우에만목표수준에근접합니다. 이내용은그림 1, 2, 3의두번째열그림에각각묘사되어있습니다. 기존 t-검정은설계가불균형이고분산이같지않을때효과적이지않습니다. 분산에작은차이만있어도문제가될수있습니다. 이처럼분산이다른불균형설계에서는데이터의정규성에의해모의유의수준이개선되지않습니다. 실제로모의유의수준은표본크기가증가할때모집단에관계없이목표수준에서멀어집니다. 분산이더큰모집단에서더큰표본을추출하면모의유의수준이목표수준보다더작습니다. 분산이더작은모집단에서더큰표본을추출하면모의유의수준이목표수준보다더큽니다. Arnold(1990, 372페이지 ) 는이분산가정하에서기존 2-표본 t-검정통계량의점근분포를조사할때유사한의견을제시했습니다. 2- 표본 T- 검정 15
반면에 Welch 2-표본 t-검정은그림 1, 2, 3에나와있는것처럼등분산가정이탈의영향도받지않습니다. Welch t-검정은등분산가정하에서도출되지않기때문입니다. Welch의 t-검정을도출하는데사용된정규가정은두표본크기중최소값이매우작을때만중요한것으로보입니다. 그러나표본이큰경우검정은정규가정이탈의영향을받지않습니다. 이내용은두표본의최소크기가 15일때모의유의수준이목표수준과계속가깝게유지되는그림 2 및 3에설명되어있습니다. 두표본이모두자유도가 2인카이-제곱분포에서생성되고두표본의크기가모두 15일때모의유의수준은 0.042입니다 ( 표 3 참조 ). 특이치역시두표본의최소크기가충분히크면 Welch의 t-검정의성능에영향을미치지않습니다. 표 3과그림 3에서는두표본의최소크기가 15 이상이면모의유의수준이목표수준에가깝다는것을볼수있습니다.( 표준편차비율이 0.5, 1.0, 1.5 및 2.0일때모의유의수준은각각 0.045, 0.045, 0.041, 0.037입니다.) 이런결과는실제로대부분 Welch 2-표본 t-검정이모의유의수준또는제1종오류율을기준으로기존 2-표본 t-검정보다더우수함을보여줍니다. 그림 2 표본크기비율과분산이같거나다른 2 개의정규분포로부터생성된표본쌍에 기초한두양측검정 ( 기존 2- 표본 t- 검정과 Welch 의 t- 검정 ) 의모의유의수준그래프. 2- 표본 T- 검정 16
그림 3 표본크기비율과분산이같거나다른 2 개의정규분포로부터생성된표본쌍에 기초한두양측검정 ( 기존 2- 표본 t- 검정과 Welch 의 t- 검정 ) 의모의유의수준그래프. 2- 표본 T- 검정 17
부록 B: 두검정의검정력함수비교 당사는 Welch의 t-검정의검정력함수가기존 2-표본 t-검정의검정력함수와같거나거의같을수있는조건을확인하고자했습니다. 일반적으로 t-검정 (1-표본또는 2-표본 ) 의검정력함수는잘알려져있고여러출판물에서논의되었습니다 (Pearson & Hartley, 1952; Neyman 외, 1935; Srivastava, 1958). 다음항목에서는 2-표본설계의세가지대립가설에대한검정력함수에대해각각서술합니다. 정리 B1 정규성및등분산가정하에서명목크기가 α 인양측 2- 표본 t- 검정의검정력함수는표본 크기의함수로표현할수있으며, 차이 δ = μ 1 μ 2 는다음식으로나타낼수있습니다. π(n 1,, δ) = 1 F dc,λ (t α/2 dc ) + F dc,λ ( t α/2 dc ) 여기서 F dc,λ(. ) 는자유도가 d C = n 1 + 2 고비중심모수가다음과같은비중심 t 분포의 C.D.F 입니다. δ λ = σ 1/n 1 + 1/ 또한대립가설 μ 1 > μ 2 와연관된검정력함수는다음식으로표현됩니다. π(n 1,, δ) = 1 F dc,λ(t α dc ) 반면에 μ 1 < μ 2 대립가설에대해검정할때의검정력은다음식으로표현됩니다 π(n 1,, δ) = F dc,λ( t α dc ) 위정리의결과는잘알려져있지만, Welch 의수정된 t- 검정에기초한검정의검정력함수는 문헌에서구체적으로논의된적이없습니다. 일원분산분석모형에대해주어진근사검정력 함수로부터근사를도출할수있습니다 (Kulinskaya 외, 2003 참조 ). 그러나이검정력함수는 양측대립가설에만적용할수있습니다. 그러나 2- 표본설계는매우특별하므로 Welch t- 검정의 ( 정확한 ) 검정력함수를세개의대립가설에대해각각구할수있는다른방법을 적용할수있습니다. 이러한함수는다음정리에제시되어있습니다. 정리 B2 모집단이 ( 분산이같지않을수있지만 ) 정규분포를따른다는가정하에명목크기가 α 인 양측 Welch t- 검정의검정력함수는표본크기및차이 δ = μ 1 μ 2 의함수로표현할수 있습니다. α/2 α/2 π W (n 1,, δ) = 1 G dw,λ W (t dw ) + GdW,λ W ( t dw ) 2- 표본 T- 검정 18
여기서 G d,λ (. ) 는다음식으로표현되는자유도가 d W 고 d W = σ 1 4 ( σ 1 2 n + σ 2 2 1 n ) 2 1 (n 1 1) + σ 2 2 ( 1) 비중심모수가다음과같은비중심 t 분포의 C.D.F 입니다. δ λ W = σ 2 1 /n 1 + σ 2 2 / 단측대립가설에대한검정력함수의식은다음과같습니다. 및 π W (n 1,, δ) = 1 G dw,λ W (t α dw ) π W (n 1,, δ) = G dw,λ W ( t α dw ) 위의공식은귀무가설을대립가설 μ 1 > μ 2 와 μ 1 < μ 2 에대해검정하는경우에각각 해당됩니다. 결과증명은부록 D 에나와있습니다. 이검정력함수 2 개를비교하기전에기존 2- 표본 t- 검정은모집단의분산이같다는추가적인 가정하에도출되기때문에두검정의이론적검정력함수는두번째가정이 Welch 의 t- 검정에서성립할때비교해야한다는점에유의하십시오. 이론적으로, 정규성및등분산가정하에서 모든 n 1,, δ 에대해 π(n 1,, δ) π W (n 1,, δ) 임이알려져있습니다. 다음결과는두함수가 ( 대략적으로 ) 같은조건을서술합니다. 2 4 정리 B3 정규성및등분산가정하에서다음이성립됩니다. 1. n 1 ~ 이면각차이 δ에대해 π(n 1,, δ)~π W (n 1,, δ) 입니다. 특히 n 1 = 면각차이 δ에대해 π(n 1,, δ) = π W (n 1,, δ) 이므로 Welch t-검정은기존 2-표본 t-검정만큼강력합니다. 2. n 1 과 가작고 n 1 면 Welch t-검정의검정력은기존 2-표본 t-검정보다낮습니다. 그러나 n 1 과 가크면 ( 표본크기의차이에관계없이 ) π(n 1,, δ)~π W (n 1,, δ) 입니다. 결과증명은부록 E에제시되어있습니다. 2- 표본 T- 검정 19
등분산가정하에서두검정의검정력함수와연관된비중심모수는동일합니다. 검정력함수가차이가나는유일한이유는자유도가각각차이가나기때문입니다. 이론적으로, 언급된가정하에서기존 t-검정이 UMP(uniformly most powerful) 이므로자유도가더높음을알수있습니다. 그러나위결과의핵심은설계가균형이거나균형에가까울경우검정력함수가동일하거나거의동일하다는것입니다. 기존 t-검정은설계가현저히불균형하고표본이작을때만 Welch t-검정보다검정력이훨씬더우수합니다. 부록 A에나와있는것처럼기존 2-표본 t-검정이등분산가정에특별히민감하게반응하는경우에도마찬가지입니다. 따라서실제로는 Welch t-검정의검정력함수가더신뢰할수있는함수입니다. 여기서는정리 B3의결과를정규모집단 2개의표준편차가똑같이 3인다음예를사용하여설명합니다. 정리 B1과정리 B2의 ( 양측 ) 검정력함수에기초한검정력값은다음네가지시나리오에서계산됩니다. 1. 두표본이모두작지만크기가같은경우 (n 1 = = 10). 2. 두표본이모두작지만한표본이다른표본보다 2배더큰경우 ( n 1 = 10, = 20). 3. 한표본은작고다른표본은중간크기지만중간크기표본이작은표본보다 4배더큰경우 (n 1 = 10, = 40). 4. 한표본이중간크기고다른표본은크지만더큰표본이중간크기표본보다 4배더큰경우 (n 1 = 50, = 200). 두검정에대해모두 α = 0.05라고가정하여각시나리오에대해검정력함수를차이 δ = 0.0, 0.5, 1.0, 1.5, 2.0, 5.0에서평가합니다. 결과는표 5에제시되어있으며, 함수는그림 4에표시되어있습니다. 표 5 양측기존 2-표본 t-검정과양측 Welch t-검정의이론적검정력함수비교, α = 0.05. 표본크기 n 1 과 는고정이며, 검정력함수를차이 δ( 범위 : 0.0-5.0) 에서평가했습니다. δ 0.0 0.5 1.0 1.5 2.0 2.5 3 3.5 4 4.5 5.0 n 1 = = 10 π(n 1,, δ).05.064.109.185.292.422.562.694.805.887.941 π W (n 1,, δ).05.064.109.185.292.422.562.694.805.887.941 n 1 = 10, = 20 π(n 1,, δ).05.070.132.239.383.547.703.828.913.962.986 2- 표본 T- 검정 20
δ 0.0 0.5 1.0 1.5 2.0 2.5 3 3.5 4 4.5 5.0 π W (n 1,, δ).05.070.129.231.371.531.686.813.902.955.982 n 1 = 10, = 40 π(n 1,, δ).05.075.152.283.455.637.791.899.959.986.996 π W (n 1,, δ).05.072.142.261.419.592.748.865.938.976.992 n 1 = 50, = 200 π(n 1,, δ).05.182.556.883.987.999 1. 1. 1. 1. 1. π W (n 1,, δ).05.180.548.877.986.999 1. 1. 1. 1. 1. 그림 4 양측기존 2- 표본 t- 검정과양측 Welch t- 검정의이론적검정력함수를탐지할평균의 차이 δ 와비교하여표시한그래프. 두검정에서모두 α = 0.05 를사용합니다. 가정된모집단은 표준편차가똑같이 3 인정규분포를따릅니다. 2- 표본 T- 검정 21
시뮬레이션연구 B 이시뮬레이션연구의목적은분산이같지않다고가정되는균형설계에서기존 2-표본 t- 검정과연관된검정력수준을 Welch의 2-표본 t-검정과연관된검정력수준과비교하는것입니다. 해당연구의실험은부록 A에설명되어있는것과유사합니다. 첫번째실험그룹에서는이분산정규모집단으로부터크기가같은표본쌍을생성했습니다. 기준모집단은 N(0,2) 가되도록고정되었고두번째정규모집단은표준편차비율 ρ = σ 2 / σ 1 이 0.5, 1.5 및 2가되도록선택되었습니다. 마찬가지로, 두번째집단에서두표본은이분산카이-제곱분포에서추출되었습니다 ( 기준모집단은 Chi(2) 임 ). 마지막실험집합에서는앞의부록 A에서정의한것과같은오염된정규분포 ( 기준모집단 CN(.8,4)) 로부터표본쌍을생성했습니다. 각실험집합에대해표본크기가 n = n 1 = = 5, 10, 15, 20, 25, 30인각검정과연관된모의검정력수준을 ( 주어진탐지가능한차이 δ에서 ) 계산했습니다. 각실험에서는모의검정력수준을귀무가설이거짓이었을때기각된횟수의비율로계산했습니다. 모든실험에대해평균의차이를기준모집단 ( 두표본의첫번째 ) 에표준단위로지정했습니다. 더구체적으로말하면본연구의세가지분포유형에대해모두상대적으로작았기때문에 δ = 1.0 σ 1 = 2.0을고정했습니다. 시뮬레이션결과는표 2.2에보고되고그림 2.2a, 그림 2.2b 및그림 2.2c에표시되었습니다. 결과및요약표 6과그림 4의결과는등분산가정하에서이론적검정력함수가정리 2.3에나와있는것처럼균형설계에서동일함을보여줍니다. 또한표본크기가비교적작지만거의같으면두함수는대체로같은검정력값을나타냅니다. 표본이비교적작고표본하나가다른표본보다약 4배정도클때 ( 예를들어 n 1 = 10, = 40일때 ) 만검정력함수간에어느정도눈에띄는차이가나타나기시작합니다. 이경우에도기존 2-표본 t-검정에기초한이론적검정력값은 Welch의 t-검정에기초한검정력값보다약간더높을뿐입니다. 마지막으로, 설계가현저히불균형이지만표본이 ( 비교적 ) 크면두검정력함수는정리 B3에서술된것처럼사실상동일합니다. 또한이분산균형설계에서두검정은사실상동일한검정력값을나타냅니다. 그러나매우작은표본 (n < 10) 에서는기존 2-표본 t-검정이약간더효과적입니다. 2- 표본 T- 검정 22
표 6 이분산균형설계에서기존 2- 표본 t- 검정과 Welch 의 t- 검정의모의검정력수준비교 기준모집단 : N(0,2) 기준모집단 : Chi(2) 기준모집단 : CN(.8,4) n σ 2 σ 1.5 1.5 2.0.5 1.5 2.0.5 1.5 2.0 5 2T 0.431 0.196 0.152 0.555 0.281 0.215 0.579 0.373 0.335 Welch 0.366 0.166 0.119 0.424 0.25 0.184 0.521 0.32 0.283 10 2T 0.77 0.385 0.27 0.846 0.438 0.324 0.79 0.51 0.435 Welch 0.747 0.372 0.253 0.832 0.427 0.308 0.776 0.493 0.417 15 2T 0.916 0.539 0.387 0.948 0.565 0.424 0.898 0.615 0.508 Welch 0.908 0.532 0.375 0.945 0.557 0.413 0.891 0.605 0.497 20 2T 0.971 0.682 0.497 0.982 0.68 0.521 0.952 0.702 0.573 Welch 0.969 0.677 0.487 0.981 0.676 0.511 0.947 0.697 0.563 25 2T 0.99 0.779 0.591 0.994 0.765 0.605 0.98 0.783 0.641 Welch 0.99 0.777 0.582 0.994 0.762 0.597 0.979 0.778 0.636 30 2T 0.998 0.851 0.675 0.998 0.826 0.676 0.994 0.839 0.699 Welch 0.998 0.849 0.67 0.998 0.824 0.668 0.994 0.836 0.694 2- 표본 T- 검정 23
그림 5 이분산균형설계에서기존 2- 표본 t- 검정과 Welch 의 2- 표본 t- 검정의모의검정력 수준비교표본은표준편차비율이 0.5, 1.5 및 2.0 이되도록이분산정규분포를따르는 모집단에서추출되었습니다. 2- 표본 T- 검정 24
그림 6 이분산균형설계에서기존 2- 표본 t- 검정과 Welch 의 2- 표본 t- 검정의모의검정력 수준비교표본은표준편차비율이 0.5, 1.5 및 2.0 이되도록이분산카이 - 제곱분포를따르는 모집단에서추출되었습니다. 2- 표본 T- 검정 25
그림 7 이분산균형설계에서기존 2- 표본 t- 검정과 Welch 의 2- 표본 t- 검정의모의검정력 수준비교표본은표준편차비율이 0.5, 1.5 및 2.0 이되도록오염된이분산정규분포를 따르는모집단에서추출되었습니다. 2- 표본 T- 검정 26
부록 C: 검정력및표본크기와정규성에대한민감도 보조도구에서두모집단의평균을비교하기위한검정력분석은 Welch t-검정의검정력함수를토대로수행됩니다. 이함수가함수도출에적용된정규가정에민감하게반응할경우, 검정력분석에서잘못된결론이나올수있습니다. 이런이유로이함수의정규가정에대한민감도를조사하기위한시뮬레이션연구를실시했습니다. 민감도는표본을비정규분포로부터생성할때모의검정력수준과이론적검정력함수로부터계산된검정력수준이일치하는정도를기준으로평가되었습니다. 정리 B2에따르면표본이정규분포로부터생성될때모의검정력수준과이론적검정력수준이가장가깝기때문에정규분포는대조모집단의역할을합니다. 시뮬레이션연구 C 연구는정규, 카이-제곱및오염된정규분포의세가지분포를사용하여세부분으로나누어실시했습니다. 자세한내용은부록 A를참조하십시오. 이연구의각부분에서는모의검정력을 ( 주어진표본크기 n 1 과 에대해주어진탐지가능한차이 δ에서 ) 귀무가설이거짓일때기각된횟수의비율로계산했습니다. 모든경우탐지할차이는기준모집단의표준단위로지정되었습니다. 즉, 본연구에사용되는세가지분포유형에대해모두 δ = 1.0 σ = 2.0입니다. Welch의 t-검정에기초한이론적검정력값도비교를위해계산했습니다. 1 시뮬레이션결과및요약 시뮬레이션에서는표본크기가비교적작을경우 Welch t-검정의검정력함수가정규성가정에대해강하다는결과가나왔습니다. 일반적으로두표본의크기가최소 15개에불과하면모의검정력값이그에해당되는목표이론적검정력수준과가깝습니다 ( 표 7-10과그림 8-10 참조 ). 표 7-10에는정규모집단, 치우친모집단 ( 카이-제곱 ) 및오염된정규모집단으로부터생성된표본의쌍에기초한 α = 0.05인양측 Welch t-검정의모의검정력수준이나와있습니다. 표본의쌍은같은분포유형에서추출되었지만, 모집단의분산은같지않을수있습니다. 비교를위해이론적검정력값을계산했습니다. 2- 표본 T- 검정 27
표 7 n = 5 일때 α = 0.05 인양측 Welch t- 검정의모의검정력수준 기준모집단 : N(0,2) 기준모집단 : Chi(2) 기준모집단 : CN(.8,4) σ 2 σ 1.5 1.0 1.5 2.0.5 1.0 1.5 2.0.5 1.0 1.5 2.0 n 1 = 5 n 1 = 5 n 1 = 5 n 1 3.6 관측치.288.158.113.091.432.305.211.149.361.257.234.220 목표값.353.192.116.092.353.192.116.092.353.192.116.092 5 1.0 관측치.370.252.169.121.427.334.248.189.522.380.319.284 목표값.389.286.190.137.389.286.190.137.389.286.190.137 8 1.6 관측치.387.326.242.179.427.364.286.225.573.453.374.319 목표값.400.345.260.193.400.345.260.193.400.345.260.193 10 2.0 관측치.390.351.272.208.421.373.296.235.590.483.394.336 목표값.402.364.291.223.402.364.291.223.402.364.291.223 표 8 n = 10 일때 α = 0.05 인양측 Welch t- 검정의모의검정력수준 기준모집단 : N(0,2) 기준모집단 : Chi(2) 기준모집단 : CN(.8,4) σ 2 σ 1.5 1.0 1.5 2.0.5 1.0 1.5 2.0.5 1.0 1.5 2.0 n 1 = 10 n 1 = 10 n 1 = 10 n 1 5.5 관측치.651.346.197.131.768.493.320.221.689.484.404.358 목표값.666.364.206.139.666.364.206.139.666.364.206.139 10 1.0 관측치.742.556.369.254.831.612.430.308.776.619.496.419 목표값.745.562.337.259.745.562.337.259.745.562.337.259 15 1.5 관측치.765.641.483.358.865.679.511.377.792.679.547.456 목표값.767.643.483.352.767.643.483.352.767.643.483.352 2- 표본 T- 검정 28
기준모집단 : N(0,2) 기준모집단 : Chi(2) 기준모집단 : CN(.8,4) σ 2 σ 1.5 1.0 1.5 2.0.5 1.0 1.5 2.0.5 1.0 1.5 2.0 n 1 = 10 n 1 = 10 n 1 = 10 n 1 20 2 관측치.774.683.549.417.898.737.565.448.797.716.596.490 목표값.777.686.551.422.777.686.551.422.777.686.551.422 2- 표본 T- 검정 29
표 9 n = 15 일때 α = 0.05 인양측 Welch t- 검정의모의검정력수준 기준모집단 : N(0,2) 기준모집단 : Chi(2) 기준모집단 : CN(.8,4) σ 2 σ 1.5 1.0 1.5 2.0.5 1.0 1.5 2.0.5 1.0 1.5 2.0 n 1 n 1 = 15 n 1 = 15 n 1 = 15 8.53 관측치.857.569.342.229.871.651.421.293.853.632.505.428 목표값.861.568.338.221.861.568.338.221.861.568.338.221 15 1.0 관측치.906.745.535.368.942.763.563.415.891.760.611.500 목표값.910.753.541.379.910.753.541.379.910.753.541.379 23 1.53 관측치.928.831.667.502.975.858.676.517.898.825.698.572 목표값.925.830.670.509.925.830.670.509.925.830.670.509 30 2.0 관측치.933.861.737.589.984.903.750.598.902.847.742.619 목표값.931.863.736.589.931.863.736.589.931.863.736.589 표 10 n = 20 일때 α = 0.05 인양측 Welch t- 검정의모의검정력수준 기준모집단 : N(0,2) 기준모집단 : Chi(2) 기준모집단 : CN(.8,4) σ 2 σ 1.5 1.0 1.5 2.0.5 1.0 1.5 2.0.5 1.0 1.5 2.0 n 1 = 20 n 1 = 20 n 1 = 20 n 1 10.5 관측치.938.687.426.275.920.698.486.333.923.716.568.476 목표값.941.686.424.277.941.686.424.277.941.686.424.277 20 1.0 관측치.971.866.672.485.981.858.670.506.952.856.696.567 목표값.971.869.673.489.971.869.673.489.971.869.673.489 30 1.5 관측치.977.923.791.629.995.932.785.631.960.908.798.662 목표값.978.922.791.628.978.922.791.628.978.922.791.628 2- 표본 T- 검정 30
40 2.0 관측치.983.950.858.724.998.966.864.726.958.929.845.725 목표값.981.945.854.719.981.945.854.719.981.945.854.719 두표본이정규모집단으로부터생성되었을때모의검정력값은표본이매우작을경우에도 이론적검정력값과일치합니다. 그림 7 에나와있는것처럼이론및모의검정력곡선은 사실상구분되지않습니다. 이런결과는정리 B2 와일치합니다. 그림 8 표본크기비율과 2 개의등분산또는이분산정규모집단으로부터생성된표본쌍에 기초한 α = 0.05 인양측 Welch t- 검정의모의및목표이론적검정력수준을나타낸그래프 표본이치우친카이-제곱분포에서생성되었을때표본이매우작을경우모의검정력값은이론적검정력값보다높습니다. 그러나표본크기가커질수록검정력값은점점유사해집니다. 그림 9는두표본의최소크기가 10개이상일때목표이론적검정력곡선과모의검정력곡선이계속가깝게유지됨을보여줍니다. 이는표본이비교적작을때도치우친데이터가 Welch t-검정의검정력함수에큰영향을미치지않음을보여줍니다. 2- 표본 T- 검정 31
그림 9 표본크기비율과 2 개의등분산또는이분산정규모집단으로부터생성된표본쌍에 기초한 α = 0.05 인양측 Welch t- 검정의모의및목표이론적검정력수준을나타낸그래프 또한특이치는표본크기가매우작을때만검정력함수에영향을미치는경향이있습니다. 일반적으로, 특이치가있을때모의검정력값은목표이론적검정력값보다약간높은경향이있습니다. 이내용은모의및이론적검정력곡선이최소표본크기가 15에도달할때까지합당한수준으로가까워지지않는것으로그림 10에나와있습니다. 2- 표본 T- 검정 32
그림 10 표본크기비율과 2 개의등분산또는이분산정규모집단으로부터생성된표본쌍에 기초한 α = 0.05 인양측 Welch t- 검정의모의및목표이론적검정력수준을나타낸그래프 2- 표본 T- 검정 33
부록 D: 정리 B2 증명 2- 표본모형의경우귀무가설하에서다음검정통계량의분포를도출하는 Welch 의방식은 다음분포 x y δ t w (x, y) = s 1 2 n + s 2 2 1 V = s 1 2 + s 2 2 n 1 를카이 - 제곱분포에대한비례로근사하는방법에기초하고있습니다. 더구체적으로말하면, d W V 2 σ 1 n + σ 2 2 1 는자유도가 d W 인카이 - 제곱분포로근사분포됩니다. 여기서 : d W = σ 1 4 ( σ 1 2 n + σ 2 2 1 n ) 2 1 (n 1 1) + σ 2 2 ( 1) ( 참고 : 1-표본설정에서이는 (n 1)s 2 /σ 2 2 ~χ n 1 이라는잘알려진기존결과로감소합니다.) 대립가설 H A : μ 1 μ 2 ( 또는같은말로 δ 0) 에대한귀무가설 H o : μ 1 = μ 2 ( 또는같은말로 δ = 0) 의검정을고려하십시오. 귀무가설하에서검정력함수에대해다음공식이성립합니다. π(n 1,, δ) = π(n 1,, 0) = 1 Pr ( t α/2 x y dw V t α/2 d W ) α 여기서 t d α 는자유도가 d 인 t- 분포의 100 α 상위백분위점을나타냅니다. 대립가설하에서 x y V = x y δ δ + σ 1 2 + σ 2 2 σ 1 2 + σ 2 2 n 1 n 1 2 4 d W V d W ( σ 1 2 + σ 2 2 ) n 1 는자유도가 d W 고비중심모수가다음과같은근사비중심 t 분포를따릅니다. 2- 표본 T- 검정 34
δ λ W = σ 2 1 /n 1 + σ 2 2 / 그이유는앞에서설명한대로 d W V 2 σ 1 n + σ 2 2 1 는자유도가 d W 인카이 - 제곱분포로근사분포되고 x y δ σ 1 2 + σ 2 n 1 는표준정규분포에따라분포되기때문입니다. 따라서대립가설하에서다음이성립됩니다. π(n 1,, δ) = 1 Pr ( t α/2 x y dw V t α/2 d W ) 1 G dw,λ W (t α/2 dw ) + G dw,λ W ( t α/2 dw ) 여기서 G dw,λ(. ) 는자유도가 d W 고비중심모수가위와같은 λ 인비중심 t 분포의 C.D.F 입니다. 2 2- 표본 T- 검정 35
부록 E: 정리 B3 증명 첫째, d W 는다음과같이다시쓸수있습니다. 여기서 ρ = σ 1 /σ 2 입니다. d W = ( 1 n + ρ2 2 1 n ) 2 1 1 (n 1 1) + ρ 4 2 ( 1) 마찬가지로, Welch t- 검정의검정력함수와연관된비중심모수도다음과같이다시쓸수 있습니다. δ/σ 1 λ W = 1/n 1 + ρ 2 / 등분산가정하에서기존 2- 표본 t- 검정과 Welch 검정의검정력함수와연관된비중심모수는 동일합니다. 즉, 다음이성립합니다. δ λ = λ W = σ 1/n 1 + 1/ 여기서 σ 는두모집단의공분산입니다. 따라서두검정의검정력함수간에존재하는유일한 차이점은각각의자유도뿐입니다. 그러나등분산가정하에서 Welch t- 검정의검정력함수와 연관된자유도는다음과같습니다. d W = ( 1 n + 1 2 1 n ) 2 1 1 (n 1 1) + 1 2 ( 1) = (n 1 + ) 2 (n 1 1)( 1) n 1 2 (n 1 1) + 2 ( 1) 정리 1 에따라기존 2- 표본 t- 검정의검정력함수와관련된자유도는 d C = n 1 + 2 입니다. 몇가지대수조작을거치면다음식이얻어집니다. d C d W = (n 1 ) 2 (n 1 + 1) 2 n 1 2 (n 1 1) + 2 ( 1) 0 d d W 0 이라는사실은놀랍지않습니다. 그이유는등분산가정하에서기존 2- 표본 t- 검정이 UMP(uniformly most powerful) 이므로해당검정의검정력함수와연관된자유도가더 높을것이라고기대할수있기때문입니다. 이제 n 1 ~ 면 d~d W 이고, 그결과검정력함수는거의같습니다. 특히 n 1 = 면두검정의 검정력함수는동일합니다. 이로써정리 2.3 의첫부분이증명됩니다. 2- 표본 T- 검정 36
n 1 면 d C d W > 0이므로 Welch t-검정의검정력은기존 2-표본 t-검정보다낮습니다. 또한표본이크면, 즉 n 1 고 면 d C 고 d W 이므로두검정과연관된검정통계의점근분포는표준정규분포입니다. 따라서두검정은점근적으로동일하며같은점근검정력함수를생성합니다. 2015, 2017 Minitab Inc. All rights reserved. Minitab, Quality. Analysis. Results. and the Minitab logo are all registered trademarks of Minitab, Inc., in the United States and other countries. See minitab.com/legal/trademarks for more information. 2- 표본 T- 검정 37