통계학 : 통계적추론 (Statistical Inference) I. 들어가며 이제통계학에서가장중요한토픽이라고할수있는통계적추론에대해서본격적으로공부를해보도록하겠습니다. 통계적추론을통해연구와관련한두가지중요한일을할수가있습니다. i) 한개표본의통계량을토대로모집단에대한결론을내릴수있고 ii) 그결론에어느정도의신뢰를부여할수있는지에대한판단을할수있습니다. 통계적추론은두가지방식으로할수있습니다. 신뢰구간 (confidence interval) 혹은통계적유의성검정 (tests of statistical significance) 입니다. 이노트에서는모집단평균 (µ) 에대한통계적추론을하는법을배우도록하겠습니다. µ 에대한통계적추론을할때모집단표준편차 (σ) 를알고있느냐모르고있느냐에따라그방법이다릅니다. 우선 σ를알고있다는전제하에논의를진행하도록하겠습니다. 물론실제연구를할때는이 σ를알고있는경우는거의없습니다. 따라서나중에는이 σ를모를때통계적추론을어떻게하는지도배우도록하겠습니다. 이노트에서배우게될통계적추론의논리는확률이론을통해이루어지게됩니다. 좀더구체적으로말씀을드리면표본평균 ( x) 과같은통계량의추출분포 (sampling distribution) 를토대로통계적추론을하게됩니다. 모집단에서 n개크기의무작위표본을반복해서추출했을때나오게되는추출분포를이용해계산할수있는확률을이용해통계적추론을한다는것입니다. 명심하셔야할것은표본을모집단에서 무작위 로추출할때만이통계적추론의논리가성립한다는사실입니다. 예를들어자발적응답표본을통해구축한자료를갖고이통계적추론의논리를사용하면안된다는것입니다. II. 신뢰구간을이용한통계적추론 소득수준이낮은가구에학자금을보조하는정책을도입하기위해현재우리나라가구의평균소득수준이얼마나되는지알아보고자합니다. 당연히우리나라모든가구의소득수준을조사할수는없기에무작위로 400 가구를모집단에서추출하였습니다. 이표본의소득수준의평균 (n = 400) 이 x = 250만원으로계산되었습니다. 자이표본통계량을토대로우리나라전체가구의소득수준과관련해서어떤결론을내릴수있을까요? 손호성 1 노트 7
우선지난번에확률변수 x 는모집단 µ 의비편의추정량이라고배웠습니다. 비편의추정량이뭐였죠? 모집단으로부터무작위로표본을추출하면그표본은모집단을잘대표할확률이높고따라서그표본의평균즉 x 는 µ 를과대혹은과소추정할확률이적다는뜻이였습니다. 따라서 x 가비편의추정량이면 x = 250이 µ 와비슷할것이다라고주장할 합리적인 이유가있는것입니다. 하지만한가지문제가있습니다. 과연이 x = 250라는추정값이모집단 µ 와비슷할것이다라고하는주장을어느정도신뢰할수있을까요? 여러분도이제눈치를채셨겠지만추정량으로서표본통계량 x 에얼마나변이가존재하는지에대한정보없이는이 x 추정값에어떤신뢰성을부여하기가어렵습니다. 이확률변수 x 의변이에대한정보를토대로 x = 250라는추정값에얼마나우리가신뢰할수있는지에대해배워보도록하겠습니다. A. 통계적신뢰성 어떤추정량의비편의성 (unbiasedness) 은추정량의추출분포의중앙과관련이깊은개념입니다. 그럼추정량의변이는무엇을뜻할까요? 바로추출분포의산포도를의미하는것입니다. 모집단가구소득수준의평균이 µ 그리고표준편차가 σ라고한다면, n = 400인표본을무작위로반복적으로추출하면 x 의추출분포는 N(µ, σ/ 400) 에근사합니다. 왜그런가요? 바로중심극한정리 (CLT) 때문입니다. 기억하시나요? 기억이안나시면 CLT 부분을다시읽어주시길바랍니다. 어쨌든여기서 σ = 100만원이라고가정을하겠습니다. σ를모르는경우에대해서는나중에다루도록하겠습니다. σ = 100이라면 CLT에의해다음이성립합니다. x N(µ, 100/ 400) = N(µ, 5) 이상황을그림 1에표시했습니다. x 의추출분포의중앙은모집단평균 µ 와같습니다. 그리고그림에중앙에서양방향으로약 1.96 σ/ n, 즉중앙에서약 2 표준오차정도떨어져있는지점을표시했습니다. 표준정규분포표에의하면 µ 1.96σ/ n와 µ + 1.96σ/ n 사이의밀도곡선의넓이는약 95% 정도인것을알수있습니다. 이그림을통해두가지사실을추론할수있습니다. 어떤표본이모집단평균과약 10( 5 1.96) 만원이내로차이가날확률이 95% 정도됩니다. n = 400개크기의표본을백번추출했을때약 95개정도의 표본들은 x 10과 x + 10 구간하에실제모집단평균 µ 를포함하고있을것입니다. 손호성 2 노트 7
그림 1: 가구소득표본평균 ( x) 의추출분포 통계적추론은한개의표본을토대로구한결과에대해얼마나신뢰를부여할수있는지에대해서위와같은사실을이용합니다. 자우리가갖고있는표본에의하면 x = 250 이였습니다. 따라서우리는모집단평균 µ 가 x 10 = 240과 x + 10 = 260 구간하에위치하고있을확률이 95% 정도된다는것입니다. 그러면우리가갖고있는표본을통해구한결과와관련해서두가지가능성이존재한다는것을알수있습니다. 1. 추정한구간 240과 260 사이에모집단평균 µ 가포함되어있거나 2. 추정한구간 240과 260 사이에모집단평균 µ 가포함되어있지않습니다. 다시말해, 우리가갖고있는표본을통해구한구간 (250 ± 10) 이 100개의구간중 µ 를포함하고있는 95개구간중에하나인지아니면 µ 를포함하고있지않은 5개구간중에하나인지알수가없다는말입니다. 좀더이에대해서공부를해보도록하겠습니다. B. 신뢰구간 (Confidence Interval) 위절에서도출한구간 x ± 1.96σ/ n를 µ 의 95% 신뢰구간이라고합니다. 이신뢰구간은다음의형태를갖고있습니다. 추정값 ( x) ± 오차범위 (1.96 σ/ n) 추정값 x = 250만원은모집단평균 µ 에대한추측값이라고할수있습니다. 오차범위 (1.96 σ/ n) 는우리가추측한값이얼마나정확한지를추정량 x 의변이 (σ/ n) 를토대로판단한지표라고생각하면될것같습니다. 손호성 3 노트 7
그림 2: 95% 신뢰구간의예시 그림 2를통해 n이충분히큰상태에서표본을무작위로반복적으로추출했을때도출이되는 95% 신뢰구간이도대체뭔지에대해서공부를해보도록하겠습니다. 맨위의그림은가구소득 (x) 의모집단분포입니다. 보시면모집단분포는정규분포가아닙니다. 그림에서 x의평균즉 µ 의위치를확인하시길바랍니다. 이런모집단에서예를들어 n = 400 정도되는크기의표본을반복적으로추출하고추출할때마다표본평균 x 를계산하고 손호성 4 노트 7
그 x 들의분포 ( 추출분포 ) 를찍으면중간그림을통해알수있듯이정규분포가되는것을알수있습니다. 추정량 x 는모집단평균 µ 의비편의추정량이기때문에 x 의추출분포의중앙은 µ 와같은것을알수있습니다. 자이제 95% 신뢰구간이뭔지에대해서한번공부해보도록하겠습니다. 모집단에서표본크기가 n = 400인표본을총 25번추출했다고하겠습니다. 그럼각각의표본별로 x ± 1.96σ/ n를적용해총 25개의구간을도출할수있습니다. 맞나요? 그 25개의구간을그림 2의맨밑에표시했습니다. 보시면 25개의선이있습니다. 선이구간을표현하는겁니다. 그리고각선별로빨간동그라미가있습니다. 그동그라미가나타내는것은그표본의평균입니다. 즉 x 입니다. 구간의중앙이라고생각해도될것같습니다. 암튼빨간동그라미도당연히 25개가있겠죠? 어떤동그라미는모집단평균 µ 와근사한것도있고또그렇지않은동그라미도있습니다. 왜그럴까요? 추출변이때문에그렇습니다. 어떤표본을택했느냐에따라 x 가달라지기때문입니다. 그럼 95% 신뢰구간이무엇을의미하는걸까요? 바로이 25개의신뢰구간중모집단평균 µ 를포함하고있는구간의개수를의미하는겁니다. 25개의 95% 는약 24개입니다. 보시면 25개중 24개의신뢰구간은모집단평균 µ 값을포함하고있습니다. 세로선이 µ 입니다. 반면한개의신뢰구간은 µ 값을포함하고있지않습니다. 이제 95% 신뢰구간이무엇을의미하는지이해가가시나요? 자다시아까의예로돌아가보도록하겠습니다. 우리는한개의표본만을갖고있습니다. 그표본의평균 x 는 250 만원이였습니다. 이표본과관련해서 95% 신뢰구간은 [250 ± 10] 즉 [240만원, 260만원 ] 입니다. 이신뢰구간이실제모집단가구소득의평균 µ 를포함하고있을확률이 95% 입니다. 다시말해우리의표본을토대로추정한구간 [240만원, 260만원 ] 이그림 2에서 µ 를포함하고있는 24개의구간중에하나일수도있고아니면 µ 를포함하고있지않은 1개의구간일수도있다는것입니다. 신뢰구간, 이제아시겠나요? C. 모집단평균의신뢰구간 지금까지 95% 신뢰구간을추정하는법에대해서공부를했는데요, 예상은하시겠지만당연히다른신뢰구간도추정할수있습니다. 예를들어 84% 신뢰구간, 99% 신뢰구간다추정할수있습니다. 이절에서는모집단평균 µ 의 C% 신뢰구간을추정하는법에대해서배우도록하겠습니다. 신뢰구간추정은표본평균 x 의추출분포를토대로이루어집니다. 모집단분포가정규분포이면 x 의추출분포는 N(µ, σ/ n) 를따르는것을배웠습니다. 그리고모집단분포가정규분포가아닐때도 x 의추출분포는 N(µ, σ/ n) 에근사한다는것을배웠습니다. 어떤경우에그렇다고배웠죠? 바로모집단에서 i) 표본을무작위로추출하고 ii) 한개표본의크기를크게설정하고추출했을때그렇다고배웠습니다. 왜요? 바로 CLT 때문에그렇다고 손호성 5 노트 7
그림 3: C 와 z 의관계 말씀을드렸습니다. 그림 3을보시면 C% 신뢰구간을추정하기위해서먼저해야할것이표준정규분포에서 ±z 사이의밀도곡선의면적을 C로하는 z 값을찾는일입니다. z 값은표준정규분포표를이용해쉽게구할수있습니다. 그림 3을보면 C와 z 간에는밀접한관계가있음을알수있습니다. 표 1에연구에서자주쓰는신뢰구간수준별로 z 이어떻게되는지표시했습니다. 표 1: C에따른 z 값 z 1.645 1.960 2.576 C 90% 95% 99% n 의크기를크게설정한후무작위표본을반복적으로추출하면 CLT 에의해 x 의추 출분포는 N(µ, σ/ n) 에근사하게된다고말씀드렸습니다. 따라서 x 가다음구간에속할 확률이 C% 입니다. µ z σ n µ + z σ n 위사실을달리표현하면, 구간 x ± z σ n 가 µ 를포함하고있을확률이 C% 라는것입 니다. 이 x ± z σ n 가 C% 신뢰구간입니다. 모집단평균 µ 에대한추정치가 x 이고오차 범위가 z σ n 입니다. 예를통해신뢰구간을계산해보도록하겠습니다. 손호성 6 노트 7
2017년 4월 5월 한국보건사회연구원 통계학 및 계량경제학의 기초 및 응용 예1 한 표본조사에 직장인들의 신용카드 빚이 어느 정도 되는지를 물어보는 문항이 있었습 니다. 이 표본조사는 532명의 무작위 표본을 토대로 이루어졌습니다. 신용카드 빚의 표 본 평균은 x = $75.5만원으로 조사되었습니다. 신용카드 빚의 모집단 표준편차가 113 만원이라고 가정하겠습니다. 이 상태에서 모집단 평균의 95% 신뢰구간을 추정해보도록 하겠습니다. <답> 이 문제에서 신뢰구간을 계산할 때 정규분포를 가정해도 되나요? 해도 됩니다. 왜냐 하면 n의 크기도 상당히 크고 또한 표본을 무작위로 추출했기 때문에 CLT가 적용되기 때문입니다. 표준정규분포표를 보면 95% 신뢰구간의 z 값은 1.96입니다. 그리고 오차범 위(m)는 다음과 같습니다. σ m = z n 113 = 1.96 532 9.6 즉, 95% 신뢰구간은 다음과 같습니다. x ± m = 75.5 ± 9.6 = [65.9, 85.1] 추정된 신뢰구간을 해석하면 이 신뢰구간이 실제 모집단 평균 µ를 포함하고 있을 확 률이 95%라는 것입니다. 위 예에서 만약 표본의 크기 n을 다르게 했다면 신뢰구간에 어떤 영향을 끼칠까요? 532명이 아니라 n = 133으로 하고 신뢰구간을 계산해보도록 하겠습니 다. 그러면 오차범위는 다음과 같습니다. σ m = z n 113 = 1.96 133 19.2 손호성 7 노트 7
따라서 95% 신뢰구간은다음과같습니다. x ± m = 75.5 ± 19.2 = [56.3, 94.7] 즉 n을작게하면할수록신뢰구간은넓어지는것을알수있습니다. 극단적인예로 n = N 로하면어떻게될까요? 즉표본의크기가모집단크기와같은것입니다. 이렇게했을때추정되는신뢰구간은모집단평균 µ 와일치할것입니다. 이예를통해 n이신뢰구간에미치는영향이무엇인지알수있게되었으리라생각합니다. D. 신뢰구간의결정요인 어떤표본을토대로모집단에대한결론을도출할때당연히신뢰구간이좁으면좁을수록좋을것입니다. 따라서신뢰구간의크기를결정하는요인에는어떤것이있는지한번알아보겠습니다. C% 신뢰구간의공식을다시살펴보겠습니다. x ± z σ n 위공식을보면신뢰구간은총세가지요인에의해영향을받는다는것을알수있습니다. z 표본크기 n 모집단표준편차 σ 첫번째요인은 z 값입니다. 신뢰구간의수준을높이면 ( 예를들어 95% 에서 99% 로높이면 ) z 값은상승하게됩니다. 결과적으로신뢰구간은넓어집니다. 직관적으로명백하다고생각합니다. 좀더높은확률을원한다면그만큼구간이넓어야겠죠? 두번째요인은표본크기입니다. 공식을보면 n이증가하면오차범위 (z σ ) 가줄어듬 n 을알수있습니다. 따라서신뢰구간의크기가작아지게됩니다. 이요인또한직관적으로명백합니다. 극단적인예로 n = N로하면어떻게될까요? 즉표본의크기가모집단크기와같은것입니다. 이렇게했을때추정되는신뢰구간은모집단평균 µ 와일치할것입니다. 세번째요인은모집단의표준편차입니다. 모집단값들에변이가굉장히크다면어떤표본을토대로모집단값을정확히추정하기가상당히어려울것입니다. 이와관련해서도극단적인예를들어보도록하겠습니다. 예를들어모집단표준편차가 0인상황을생각해보십시오. 즉모집단값에변이가하나도없는것입니다. 이런경우에는어떤표본을택하던그표본평균이모집단평균과일치할것입니다. 손호성 8 노트 7
E. 신뢰구간과관련해서유의해야할점 신뢰구간에대한논의를마치기전에이신뢰구간과관련해서연구자가주의해야할점에대해서공부를하도록하겠습니다. 굉장히중요한사안이니반드시알고계시길바랍니다. 1. 추정한신뢰구간이타당하려면이용한자료가모집단으로부터무작위로추출해서얻은자료여야합니다. 물론실제로완벽하게무작위로추출한자료여야한다는것을의미하는건아닙니다. 각각의관측치가서로독립이고모집단을잘대표한다면큰문제는없습니다. 2. 신뢰구간의공식은자발적응답표본과같은자료에는적용할수없습니다. 왜냐하면자발적응답표본의추출분포는결코 N(µ, σ/ n) 에근사하기않기때문입니다. 3. 신뢰구간은 x 에영향을받습니다. 1에서 x 는특이값에강건한지표가아니라고배웠습니다. 따라서신뢰구간또한특이값에강건하지않습니다. 여러모로특이값은참큰문제를일으키는아이입니다. 4. 표본의크기 n이작고또모집단분포의모양을모른다면 CLT를적용할수없고따라서신뢰구간을추정할수없습니다. 5. 지금까지신뢰구간을추정할때모집단표준편차 σ를알고있다고가정하였습니다. σ를모르면신뢰구간을추정할수없습니다. 물론차후에 σ를모를때사용할수있는신뢰구간추정법에대해서배울것입니다. 6. 신뢰구간과관련해서가장유의하셔야할내용은이신뢰구간이다루는오차범위는표본을추출하는과정에서발생하는추출오류 (sampling error) 뿐이라는사실입니다. 다시말해과소범위 (undercoverage) 나비응답 (nonresponse) 때문에발생하게되는오류를다루지는못합니다. 이러한오류는실제로추출오류보다훨씬클수도있습니다. 즉항상자신이다루고있는자료의질 (quality) 에대해서충분한검토를하시길바랍니다. 갖고있는표본에과소포함이나비응답문제등이존재한다면그러한표본을통해추정한신뢰구간은결코정확하지않습니다. 7. 마지막으로, 추정한신뢰구간의해석과관련해서강조할것이있습니다. 예 1에서추정된 95% 신뢰구간은 [65.9, 85.1] 이였습니다. 많은사람들이이추정된신뢰구간을다음과같이해석을합니다. 모집단평균이 65.9와 85.1에있을확률이 95% 이다. 추정한신뢰구간을이렇게해석할수없습니다. 모집단모수는상수입니다. 다시말해 µ 는이구간에포함되어있거나포함되어있지않습니다. 모수는고정된값이기때문에모수값과관련해서확률을논할수없습니다. 따라서 95% 신뢰구간을손호성 9 노트 7
2017년 4월 5월 한국보건사회연구원 통계학 및 계량경제학의 기초 및 응용 정확하게 해석하면 약 100개의 신뢰구간 중에 실제 모집단 모수를 포함하고 있는 신 뢰구간이 95개 정도 되는데 이 추정된 신뢰구간 [65.9, 85.1]이 그 95개 중에 한 구간일 확률이 95%라는 것입니다. 통계적 유의성 검정(Tests of Statistical Significance) III. 신뢰구간은 대개 모집단 모수에 대한 통계적 추론을 할 때 사용됩니다. 다른 방식으로도 통계적 추론을 하게 되는데 이 두 번째 방식을 통계적 유의성 검정이라고 합니다. 이 유 의성 검정을 이용해 통계적 추론을 할 때는 신뢰구간과는 다른 목적을 갖고 하게 됩니다. 유의성 검정에서는 모집단 모수와 관련해서 어떤 가설을 세우고 자신이 갖고 있는 표본 자료가 그 가설에 얼마나 부합하는지를 판단하게 됩니다. A. 유의성 검정의 논리 유의성 검정은 자신이 갖고 있는 자료와 어떤 가설과 비교하는 절차라고 할 수 있습니다. 가설이란 모집단 모수와 관련한 주장입니다. 예를 통해서 유의성 검정의 논리를 배우도록 하겠습니다. 예2 무작위 표본(n = 500)을 통해 두 가지 정보를 알아냈습니다. 첫째, 직장인들의 신용카드 빚의 평균은 51.6만원이고, 둘째, 자영업자들의 신용카드 빚의 평균은 64.2만원입니다. 두 집단의 차이는 12.6만원으로 상당이 큰 차이가 납니다. 이 차이는 모집단 모수(µ1 µ2 )에 대한 추정값입니다. 다른 표본을 추출했다면 다른 추정값이 도출이 될 것입니다. 어쨌든 이 표본을 토대로 도출한 차이 즉 12.6만원을 토대로 두 집단 간에 신용카드 빚의 평균이 다르다고 결론내릴 수 있을까요? 유의성 검정의 논리를 이용해 위 질문에 대해 답을 할 수가 있는데요, 사용하는 논리가 대충 이런 겁니다. 만약 실제로 모집단에서 두 집단 간에 신용카드 빚의 차이가 없다라고 했을 때(즉 µ1 µ2 = 0) 이와 같은 차이(즉 x 1 x 2 = 12.6)를 관측하게 될 확률이 얼마나 되는지 계산하는 것입니다. 만약 이 12.6 정도의 차이가 관측될 확률이 높다면 두 집단 간 에 실제로 신용카드 빚의 차이가 없다라는 주장이 신빙성이 있다는 것입니다. 예를 들어 이 확률이 0.38이라고 하겠습니다. 즉 µ1 µ2 = 0이 진실일 때, x 1 x 2 = 12.6와 같은 결과를 얻을 확률이 무려 38%나 된다는 것입니다. 즉 이런 차이가 나올 개연성이 상당히 손호성 10 노트 7
2017년 4월 5월 한국보건사회연구원 통계학 및 계량경제학의 기초 및 응용 높다는 것인데 그렇다고 한다면 µ1 µ2 = 0가 틀렸다고 하기에는 설득력이 많이 떨어질 것입니다. 만약 확률이 0.002면 어떨까요? 굉장히 작은 확률입니다. 즉 µ1 µ2 = 0이 진실일 때 x 1 x 2 = 12.6와 같은 결과가 나올 확률이 천 번 중에 두 번 정도라는 것입니다. 그런데도 x 1 x 2 = 12.6의 차이가 관측이 되었다면 그 이유는 두 가지로 설명할 수 있습니다. 1. 굉장한 우연 때문에 이런 차이를 관측하게 된 것입니다. 다시 말해 두 집단 간에 신용카드 빚의 평균 차이는 없는데 우연히 이런 비정상적인 표본을 추출해서 이런 차이가 관측된 것입니다. 2. 확률을 계산할 때 전제한 가정 즉 µ1 µ2 = 0이 진실이 아니라는 것입니다. 여러분. x 1 x 2 = 12.6과 같은 결과가 나올 확률이 0.002라는 것은 그런 결과가 나올 확률이 굉장히 굉장히 드물다는 것입니다. 그렇지 않나요? 따라서 위 두 가지 이유 중에 첫 번째 이유보다는 두 번째 이유가 더 타당하다고 생각되지 않으신가요? 설마 그런 비정상 적인 표본이 추출됐을까요? 물론 그런 표본이 추출됐을 수도 있겠지만 무작위로 추출을 했는데 그런 이상한 표본을 추출했을 것 같지는 않습니다. 유의성 검정의 논리가 바로 이런 겁니다. x 1 x 2 = 12.6과 같은 결과가 나올 확률이 매우 드물기 때문에 µ1 µ2 = 0 라는 가설이 잘못된 것일 거라는 겁니다. B. 가설 설정 위에서 실제 모집단에서 두 집단 간에 차이가 없을 때(µ1 µ2 = 0) 위와 같은 차이(x 1 x 2 ) 를 관측한다는 것이 현실성이 있는 것인지를 물어보았습니다. 다시 말해, 실제 모집단에 차이가 없다라는 가설을 전제했을 때, 우리가 갖고 있는 표본 자료로 도출되는 결과 값 이 이러한 가설에 문제가 있다는 근거로 얼마나 강력하게 작용할 수 있는지 질문을 던진 것입니다. 만약 문제가 있다는 근거가 강력하다면 실제 모집단에서 두 집단 간에 차이가 없다라는 가설은 설득력이 떨어지게 됩니다. 따라서 유의성 검정을 이용해 통계적 추론을 할 때는 기각을 하고 싶은 가설에 대한 설정을 먼저 해야 합니다. 통계학에서 사용하는 가설에는 두 가지가 있습니다. 귀무가설과 대립가설입니다. Definition 1 귀무가설(null hypothesis)이란 차이가 없다 혹은 효과가 없다와 같은 주장 혹은 모집단 모수와 관련한 주장을 말합니다. 귀무가설은 H0 라고 표기합니다. 대개 기각하고 싶은 가설을 귀무가설로 설정합니다. 위 예에서 귀무가설은 다음과 같습니다. 손호성 11 노트 7
H 0 : µ 1 µ 2 = 0 즉직장인의신용카드빚의평균 (µ 1 ) 과자영업자의신용카드빚의평균 (µ 2 ) 의차이는 0 이라는것이귀무가설입니다. Definition 2 대립가설 (alternative hypothesis) 은어떤참이라고생각되는주장을말합니다. 대립가설은 H a 로표기합니다. 위예에서대립가설은다음과같습니다. H a : µ 1 µ 2 0 위대립가설은물론이렇게표현할수있습니다. H a : µ 1 µ 2 귀무가설과대립가설과관련해서두가지주의해야할점이있습니다. 첫째, 항상모수와관련해서가설을설정한다는것입니다. 즉두가설은표본과관련된게아닙니다. 둘째, 대립가설은두방식즉단측 (one-sided) 혹은양측 (two-sided) 으로설정할수있습니다. 위예에서는양측으로대립가설을설정했습니다. 만약단측으로대립가설을설정하면다음과같습니다. H a : µ 1 µ 2 > 0 혹은 H a : µ 1 µ 2 < 0 즉단측대립가설은한방향으로만두집단간에차이가존재하는지를보는것입니다 ( 크거나작거나 ). C. 검정통계량 (Test Statistics) 가설을설정한후통계분석을한후에도출한통계량을토대로유의성검정을하게되는데이때활용되는원칙에대해서공부하도록하겠습니다. 유의성검정은가설에기술한모집단모수를추정할때사용되는 x 와같은통계량을토대로이루어집니다. 귀무가설 H 0 가참이면, 통계량의값이귀무가설에기술한모수의값과비슷하게나올것입니다. 만약통계량의값이귀무가설에기술한값과많이차이가나면, 이는 H 0 에반하는근거가됩니다. 손호성 12 노트 7
통계량의값이귀무가설에기술한값과얼마나차이가나는지를판단할때, 통계량 을표준화한값 (z) 을이용합니다. 통계량을표준화한값, 즉 z 를검정통계량이라고 부릅니다. 검정통계량은대개다음과같은방식으로계산하게됩니다. z = 통계량의추정값 귀무가설에기술한값통계량의표준편차 검정통계량 (z) 은자신이갖고있는표본자료를토대로도출한통계량과귀무가설이얼마나차이가나는지를알려주는지표라고생각하면될것같습니다. 이검정통계량을이용해유의성검정을위해필요한확률을계산하게됩니다. 여기서강조하고싶은것은이검정통계량은확률변수라는사실입니다. 그이유는검정통계량은통계량의추정값에의해결정이되는데이통계량의추정값이확률변수이기때문입니다. 통계량이왜확률변수인지는이제아시리라생각합니다. 신용카드빚예로다시돌아가겠습니다. 이예에서귀무가설과대립가설은다음과같습니다. H 0 : µ 1 µ 2 = 0 H a : µ 1 µ 2 0 즉귀무가설에기술되어있는값은 0입니다. 통계량의추정값은 x 1 x 2 = 12.6만원이였습니다. 그리고일단이예에서통계량의표준편차는 9.5만원이라고가정하겠습니다. 1 이상황하에서검정통계량을계산하면다음과같습니다. z = 통계량의추정값 귀무가설에기술한값통계량의표준편차 = 12.6 0 9.5 1.33 위에서계산한검정통계량을해석해보겠습니다. 1.33이의미하는것은우리가관측한차이 ( 즉 12.6) 는중앙이 0( 귀무가설에기술되어있는값 ) 인추출분포에서이중앙에서약 1.33 표준편차만큼떨어져있다는것입니다. 다시말해, 모집단에서두집단간에차이가없다라고할때, 그런모집단에서무작위로표본을반복적으로추출했을때형성되는추출분포하에서 12.6이라는차이를가져다주는표본을우리가갖고있는것인데이표본은중앙에서약 1.33 표준편차만큼떨어져있는표본이라는것입니다. 내가갖고있는표본이추출분포의중앙에서몇표준편차만큼떨어져있는것을왜알아야하는지는곧다루게될 p값과관련한내용을배우게되면알게될것입니다. 1 추후에통계량의표준편차를어떻게계산하는지배우게될것입니다. 손호성 13 노트 7
2017년 4월 5월 한국보건사회연구원 통계학 및 계량경제학의 기초 및 응용 D. p값(p-value) 검정 통계량은 확률변수라고 발씀을 드렸습니다. 따라서 검정 통계량과 관련해서 추출분 포가 존재하고 이 분포의 중앙, 변이, 그리고 모양에 대해서 논할 수 있습니다. 어떤 검정 통계량이 정규분포를 따른다고 한다면, 우리가 갖고 있는 하나의 표본을 토대로 계산한 검정 통계량이 이러한 추출분포에서 추출될 확률이 얼마인지 계산할 수 있습니다. 그렇 죠? 유의성 검정은 우리가 갖고 있는 하나의 표본을 토대로 계산한 검정 통계량의 값과 동일하거나 그 값보다 더 과도한 값이 나올 확률을 계산해서 이루어집니다. 여기서 과 도한 값이라는 것의 의미는 검정 통계량의 추출분포의 중앙(즉 귀무가설 H0 에서 기술한 값)에서 굉장히 멀리 떨어져 있는 값을 말합니다. 어느 방향으로 떨어져 있어야 하는지는 대립가설에 따라 다릅니다. 예를 들어 양측 대립가설이면 양방향으로 멀리 떨어져 있으면 과도한 값이 되는 것이고 만약 오른쪽 단측 대립가설(예, >)이면 오른쪽 방향으로 멀리 떨어져 있으면 과도한 값입니다. 우선 p값의 정의를 내리고 논의를 더 진행하도록 하겠습니다. Definition 3 p값은 귀무가설 H0 가 참인 상태에서 형성되는 추출분포에서, 관측된 표본 통계량의 값과 같거나 더 과도한 값을 갖는 표본 통계량이 추출될 확률을 말합니다. p값이 작다는 것은 자신이 갖고 있는 표본 통계량이 추출분포의 중앙에서 굉장히 멀리 떨어져 있다는 것을 의미합니다. 따라서 이는 귀무가설에 반하는 근거가 됩니다. p값은 결 국 확률을 말하는 것인데, 이 확률을 계산하기 위해서는 검정 통계량의 추출분포의 중앙, 변이, 그리고 모양을 알고 있어야 합니다. 그래야 표준정규분포표를 이용해 확률을 계산할 수 있기 때문입니다. 신용카드 빚 예를 통해 p값 계산을 해보도록 하겠습니다. 우선 통계량은 두 집단 간의 신용카드 빚의 평균 차이입니다. 이는 확률변수입니다. 그렇죠? 어떤 표본을 추출했냐에 따라 그 값이 달라지기 때문에 그 값을 사전에 확실히 알 수가 없기 때문입니다. 이 통 계량의 추출분포의 중앙은 어떻게 되나요? 0입니다. 왜냐하면 귀무가설이 µ1 µ2 = 0 이기 때문입니다. 그리고 이 추출분포의 변이는 뭔가요? 아까 통계량의 표준편차가 9.5 라고 말씀을 드렸습니다. 따라서 9.5입니다. 그럼 추출분포의 모양은 어떻게 될까요? 정규 분포입니다. 왜냐하면 표본을 무작위로 추출했고 표본의 크기(n = 500) 또한 크기 때문에 CLT에 의해 정규분포인 것을 알 수 있기 때문입니다. 통계량의 추출분포에 대해서 알았습니다. 그럼 검정 통계량의 추출분포는 어떻게 될까 요? 검정 통계량은 통계량을 표준화한 것에 불과합니다. 따라서 검정통계량의 추출분포는 손호성 14 노트 7
그림 4: p 값의예 N(0, 1) 을따릅니다. 기억하시죠? 자 p값을계산해보도록하겠습니다. 우리가갖고있는하나의표본을토대로계산되는검정통계량 z는결국표준정규분포 N(0, 1) 의모양을갖고있는 z의추출분포하의하나의관측치인것입니다. 우리가갖고있는검정통계량은 1.33이므로, p값이란이 1.33과같거나더과도한검정통계량을가져다주는표본을추출할확률을말합니다. 형식적으로우리가계산해야하는확률은다음과같습니다. P ( Z 1.33) = P (Z 1.33 혹은 z 1.33) = P (Z 1.33) + P (z 1.33) = 0.1836 그림 4를보시면정규밀도곡선에서 1.33보다크거나 1.33보다작은부분의면적이바로 p값이되는것입니다. 이렇게두면적을구해야하는이유는양측검정을하기때문입니다. 만약단측검정이면한쪽면의면적만구하면되겠죠? 자이 p값을해석하면다음과같습니다. 만약실제로모집단에서이두집단간의신용카드빚의평균차이가없다라고할때, 두집단간의평균차이가 12.6으로나오는표본을추출할확률이약 18% 다. 이번에는이계산한 p값의크기에대해서해석을해야합니다. 이런표본을추출할확률이 18% 라고합니다. 높은확률은아니지만그렇다고이확률이무슨로또에당첨될확률처럼낮은것도아닙니다. 이런표본이추출될확률이 18% 면충분히그런표본을추출할가능성이존재하는겁니다. 따라서우리가추출한표본을토대로계산한통계량이손호성 15 노트 7
2017년 4월 5월 한국보건사회연구원 통계학 및 계량경제학의 기초 및 응용 귀무가설에 반하는 강력한 근거가 된다고 하기에는 설득력이 떨어지는 겁니다. 동의하시 나요? E. 통계적 유의미성(Statistical Significance) 유의성 검정의 마지막 단계는 바로 결론을 내리는 것입니다. 물론 결론은 p값을 토대로 내리게 됩니다. 그럼 어떻게 결론을 내릴까요? 통계학자들은 어떤 결정적이라고 생각되는 값을 정하고 그 값보다 우리가 계산한 p값이 같거나 작으면, 자신이 갖고 있는 표본이 귀 무가설에 반하는 강력한 근거가 된다고 결론을 내리라고 권합니다. 이와 같이 미리 정한 결정적인 값을 유의수준이라고 하는데요, 대개 α라고 표기합니다. 예를 들어, α = 0.05라고 결정을 했으면, p값이 이 0.05보다 같거나 작으면 귀무가설에 반하는 강력한 근거가 된다고 결론을 내리는 것입니다. p값이 5%라는 것은 귀무가설이 참일 때, 그런 표본을 추출할 확률이 5%라는 것입니다. 5% 정도면 상당히 가능성이 낮은 확률인데 그럼에도 불구하고 그런 표본을 추출했기 때문에 귀무가설에 문제가 있다라고 주장하는 것입니다. 5%가 낮나요? 글쎄요... 이건 정말 정답이 없습니다. 사람에 따라 5% 는 낮은 게 아니라고 하는 사람도 있습니다. 결국 이 결정적인 값은 주관적인 것입니다. 하지만 대부분의 연구자들이 α = 0.05를 결정적인 값으로 활용하기 때문에 우리도 따르는 게 낫지 않을까요? Definition 4 p값이 α와 같거나 작으면 관측된 통계량이 α 수준에서 통계적으로 유의미하다고 합니다. 한 가지 강조할 것이 있습니다. 어떤 통계량이 통계적으로 유의미하다고 해서 그 관측 된 통계량이 굉장히 큰 혹은 중요한 의미를 갖는다는 것을 의미하지 않습니다. 통계적으로 유의미하다는 것은 그냥 어떤 표본이 추출될 확률이 굉장히 낮다는 것을 의미하는 것뿐 입니다. 신용카드 빚 예에서 도출한 p값은 0.18이였습니다. 즉 α = 0.05보다 크기 때문에 통계 량의 추정값이 5% 수준에서 통계적으로 유의미하지 않다고 결론을 내립니다. 물론 통계 적으로 유의미하지 않다고 해서 바로 귀무가설이 참이라고 결론내릴 수는 없습니다. 다른 표본을 추출하면 통계적으로 유의미한 결과가 나올 수도 있기 때문입니다. 결국 통계학 의 논리로 결론을 내릴 수 있는 것은 5% 유의수준에서 귀무가설을 기각 할 수 없다이지, 귀무가설이 참이다가 아닙니다. 귀무가설을 기각할 수 있는 예를 들어보도록 하겠습니다. 손호성 16 노트 7
2017년 4월 5월 한국보건사회연구원 통계학 및 계량경제학의 기초 및 응용 예3 국회의원은 견학 명목으로 때때로 해외 출장을 갑니다. A 비영리단체는 이러한 여행의 1 인당 일일 경비가 N (300만원, 50만원)을 따른다고 주장하였습니다. 이 단체의 주장의 타 당성을 검정하기 위해 해외 출장을 다녀온 25명의 국회의원을 무작위로 추출하여 조사를 했습니다. 이 표본의 평균은 x = 270만원으로 계산되었습니다. 자 이 상태에서 비영리단 체의 주장을 α = 0.05 유의수준에서 검정을 해보도록 하겠습니다. <답> 유의성 검정에서 첫 번째로 해야하는 것이 뭐였죠? 바로 가설을 설정하는 것입니다. 우선 1인당 일일 경비가 300만원보다 큰지 적은지 알 수가 없기 때문에 양측 검정을 하겠 습니다. 가설은 다음과 같습니다. H0 : µ = 300 vs. Ha : µ 6= 300 그 다음에 판단해야 할 것은 이 표본 통계량 x 의 추출분포의 중앙, 변이, 그리고 모양입니 다. 중앙은 뭔가요? E(x ) = µ = 300 왜냐하면 x 는 µ의 비편의 추정량이기 때문입니다. 물론 무작위로 표본을 추출했을 때만 성립하는 사안입니다. 그다음엔 변이입니다. V ar(x ) = σ/ n = 50/ 25 = 10 모양은 뭐죠? 정규분포입니다. 왜죠? CLT 때문인가요? 아닙니다. n이 너무 적습니다. 정 규분포인 이유는 문제에서 모집단이 정규분포를 따른다고 가정했기 때문이고 표본을 무 작위로 추출했기 때문입니다. 혼돈하시면 안됩니다. 다음 단계는 검정 통계량(z)을 계산하는 것입니다. z= x µ 270 300 = = 3 σ/ n 50/ 25 이제 p값을 계산하겠습니다. P ( Z 3) = P (Z 3 혹은 Z 3) = 0.0013 2 = 0.0026 마지막 단계는 이 계산한 p값과 유의수준 α를 비교하는 것입니다. 0.0026 = p값 < α = 0.05 손호성 17 노트 7
따라서우리는 5% 유의수준에서귀무가설을기각할수있습니다. 귀무가설을기각한다는것이무엇을의미하나요? 이예에서는 A 비영리단체의주장이참이라고할수있는근거가부족하다는것을의미합니다. 마지막으로유의성검정을할때밟아야하는절차를설명하고이장을끝맺도록하겠습니다. 1. H 0 와 H a 를설정하십시오. 대립가설을설정할때양측검정을할것인지단측검정을할것인지에대한판단을논리적으로하셔야합니다. 2. 통계량의추출분포의중앙, 변이, 그리고모양에대한판단을하십시오. 3. 검정통계량을계산하십시오. 4. 도출된검정통계량의 p값을계산하십시오. 이 p값은 H 0 가참이다라는가정하에도출이되는확률이라는것을잊지마십시오. 5. 마지막으로 α 수준에서귀무가설을기각할수있는지혹은기각할수없는지에대해결론을내리십시오. IV. 유의성검정과관련해서유의해야할점 유의성검정의논리가워낙에강력해서현재많은연구분야에서이논리를채택하고이유의성검정을토대로연구결과를발표하고있습니다. 컴퓨터의발달로인해유의성검정을수행하는것은굉장히쉬워졌습니다. 이검정을수행하는것은쉬울진모르나 올바로 수행하는것은결코쉽진않습니다. 유의성검정결과가타당하기위해서는많은요건을필요로합니다. 자료의질확보, 무작위표본추출, CLT 등이그런요건의예입니다. 2 장에서신뢰구간과관련해서유의해야할점에대해서배웠듯이이장에서유의성검정과관련해서유의해야할점에대해서배워보도록하겠습니다. A. 유의수준의선택 유의성검정의장점은표본통계량을토대로귀무가설에대한어떤확실한결론을내릴수있게끔하는데있지않나합니다. 검정은 p값을이용해수행합니다만, 여기서반드시알고계셔야하는것은어떤것이 유의미하다 혹은 유의미하지않다 라고할때, 어떤뚜렷한기준이있는것이아니라는것입니다. 단지 p값이작으면작을수록그귀무가설에반하는근거가더강력해질뿐입니다. 손호성 18 노트 7
예를들어 p값이 0.0501이라고하겠습니다. 당연한얘기지만이 p값은 α = 0.05보다큽니다. 따라서이경우에는귀무가설을 5% 유의수준에서기각할수없습니다. 그럼귀무가설이틀리다고주장못하는걸까요? 저는그렇게생각하지않습니다. 비록 p값이 0.0501 이여서 5% 유의수준보다는크지만 0.0501은 0.05와같은것입니다. 따라서저같으면 p 값이 0.0501로나오면귀무가설이틀리다는근거가충분하다고판단합니다. 제가강조하고싶은것은유의수준과 p값을비교해서결론내리는것도중요하지만 p 값자체를무시할필요는없다는것입니다. 그래야적확한결론을내릴수있습니다. B. 통계적으로유의미하다는것이의미하는것 저소득가구의소득수준을높이기위한어떤정책을집행하고, 이정책의효과를추정하는 연구를한다고하겠습니다. 이를위해정책이집행되고 1 년후에모집단에서 10,000 개의 저소득가구를무작위로추출했습니다. 그리고나서이 10,000 가구중정책의수혜를받은 저소득가구의월평균소득수준과수혜를받지못한저소득가구의월평균소득수준을 조사한후에그차이를계산했습니다. 계산된차이의평균은 x = 1, 500 원이였습니다. 모 집단에서의차이의표준편차는 50,000 원이라고가정하겠습니다. 자이상태에서정책의 효과가있었는지없었는지에대한평가를하기위해다음과같은가설을검정하겠습니다. H 0 : µ = 0 vs. H a : µ 0 즉귀무가설은두집단간에소득수준차이가없다는것입니다. 다시말해정책의효과가 없다는것을의미합니다. 검정통계량을계산하면다음과같습니다. z = x µ σ/ n = 1500 0 50000/ 10000 = 3 이제 p 값을계산하겠습니다. 물론확률을계산하기위해서는추출분포의모양을알아야 하는데추출분포의모양은정규분포인것을알수있습니다. 왜냐하면 CLT 때문에그렇 습니다. p 값은다음과같습니다. P (Z 3 혹은 z 3) = P (Z 3) + P (z 3) = 0.0026 p값이 0.0026이므로우리는 5% 유의수준에서귀무가설을기각할수있습니다. 자그렇다면정책의효과가있다라고주장할수있나요? 정책의효과가있기때문에저소득가구의소득수준을높이기위해이정책과관련한예산지출을해야한다고결론내려야하나요? 이정책이저소득가구의소득수준을얼마나높였는지한번보시길바랍니다. 표본통계량이뭐였죠? 1,500원이였습니다. 즉정책의수혜자와비수혜자간에소득수준의차손호성 19 노트 7
이가 1,500 원이라는것입니다. 이정책때문에월 1,500 원이증가했다는것입니다. 1 년에 18,000 원이증가했다는것입니다. 겨우 18,000 원증가한것입니다. 1 년에 18,000 원정도 증가시키기위해이정책을집행해야할까요? 그렇게한다면예산낭비입니다. 이정책 으로인해월 1,500 원정도소득수준이증가했다면결국그건이정책이효과가없었다는 것입니다. 저소득가구의소득수준을올리기위해서는다른정책을개발해야하는거죠. 이예에서알수있듯이어떤결과값이 통계적으로 유의미하다고해서 실질적으로 유의미한것이아닙니다. 통계적유의미성은어떤연구결과의중요성에대해서말해주는 것이아닙니다. 다시말해추정된정책효과가통계적으로유의미하다고해서그정책이 실질적으로효과가있고따라서그정책에예산을더투입해야한다는결론이자동적으로 도출되는것이아닙니다. 논문이나연구보고서를보면통계적유의미성에대해서만결론을내리고실질적유 의미성에대해서는논하지않는경우가굉장히많습니다. 반드시통계적유의미성뿐만 아니라추정한효과값의실질적유의미성또한검토를하시길바랍니다. 위예에서통계적으로유의미하게나온이유는정책의효과가커서가아닙니다. 위 예에서표본을 10,000 가구로했습니다. 만약 100 가구로했다면결과가어떻게달라질지 살펴보겠습니다. 위검정통계량의 p 값은다음과같습니다. z = x µ σ/ n = 1500 0 50000/ 100 = 0.3 P (Z 0.3 혹은 z 0.3) = P (Z 0.3) + P (z 0.3) = 0.7642 즉이경우에는 5% 유의수준에서귀무가설을기각할수없습니다. 이예에서알수있듯이귀무가설을처음에기각할수있었던이유는표본수가컸기때문입니다. 표본수가 100 이면기각을할수없습니다. 자결론입니다. 신뢰구간과같이통계적유의미성은추정한효과값 ( 예, x), 모집단표준편차, 그리고표본수에의해결정된다는것을잊지말아주시길바랍니다. C. 통계적으로유의미하지않다는것이의미하는것 연구를할때만약 p값이설정한유의수준보다높게나오면어떤정책의효과가없다라고결론내리는경향이있습니다. 강조하고싶은것은 근거가강력하지않다고해서근거가없다 라고결론내릴수없다는것입니다. 예를통해이문장이뭘의미하는지알아보도록하겠습니다. 손호성 20 노트 7
저소득가구의소득수준증진정책과관련한예에서추정된효과값이월 100,000 원 으로계산되었다고하겠습니다. 모집단표준편차는 650,000 으로가정하겠습니다. 그리고 표본수는 100 가구입니다. 검정통계량을계산해보면다음과같이나옵니다. z = x µ σ/ n = 100000 0 750000/ 100 = 1.33 p 값은 0.1836 입니다. 자이렇게 p 값이높게나왔으니이정책의효과가없다라고주장하는 것이바람직할까요? 물론통계적으로유의미하지않기때문에귀무가설을기각할강력한 근거가없지만추정된효과값을보면무려 100,000 원이나증가한것을알수있습니다. 이 100,000 원이통계적으로유의미하지는않지만그이유가이표본에만국한된것일수도있 습니다. 다른표본을조사했다면통계적으로유의미한결과가나올수도있습니다. 따라서 다른표본혹은표본수를늘려서후속연구를할이유가충분히있는상황인겁니다. 이와같이효과값은크게추정되었는데통계적으로유의미하지않게나오면그러한 효과값이모호하게 (imprecisely) 추정되었다고합니다. 왜모호하다는거죠? 통계적으로 유의미하게나오지는않았지만추정된효과값이커서정책의효과가없다라고강력하게 주장하기에는좀리스크가있기때문입니다. 이해되시나요? 결론은효과값의크기, p 값의크기, 표본수등에대해서다각도로검토를해야바람 직한결론을내릴수있다는것입니다. D. 통계적추론기법은모든종류의자료에적용할수있지않음 유의성검정, 신뢰구간계산등여기서배운통계적추론기법은모든종류의자료에적용할수있는기법이아닙니다. 이들기법은모두확률의법칙을토대로수행되는것입니다. 이확률의법칙이적용되기위해서는반드시표본을무작위로추출하고대개표본수가커야합니다. 만약자료가이런원칙하에추출된것이아니라고한다면다른통계적추론기법을써야한다는것을알고계시길바랍니다. 현재다양한통계적추론기법이개발되어있습니다. 예를들어붓스트랩 (bootstrap) 이나순열검정 (permutation test) 등을들수있습니다. 이들기법을알기위해서는좀더많은공부를해야하기때문에여기서는다루지못한다는점을이해해주시길바랍니다. V. σ 를모른상태에서모집단평균 (µ) 에대한추론 지금까지모집단평균 µ 에대한통계적추론을하는방법에대해서배웠습니다. 신뢰구간 혹은유의성검정을할때다음과같은공식을이용했습니다. 손호성 21 노트 7
2017년 4월 5월 한국보건사회연구원 통계학 및 계량경제학의 기초 및 응용 σ 신뢰구간: x ± z n 유의성 검정: z = x µ σ/ n 위 공식을 보면 모집단 표준편차 σ가 들어가 있습니다. 지금까지 이 σ를 안다는 가정 하에 논의를 진행했습니다. 하지만 우리는 이 값을 모르는 경우가 대부분입니다. 따라서 지금부터 이 σ를 모를 때 신뢰구간 추정과 유의성 검정을 어떻게 하는지 배우게 될 것입 니다. 우선 결론부터 말씀을 드리겠습니다. σ를 모를 때는 σ의 추정값 으로 대체를 해서 통 계적 추론을 합니다. 그리고 정규분포가 아닌 t분포를 활용해서 확률 계산 혹은 신뢰구간 추정을 합니다. A. t분포 σ를 모를 때 σ의 추정값을 이용한다고 말씀을 드렸는데 어떻게 추정할까요? 바로 우리가 갖고 있는 표본의 표준편차로 추정합니다. 표본 표준편차는 s라고 표기한다고 배웠습니다. 즉 σ를 s로 대체하는 것입니다. 따라서 σ/ n 대신 s/ n를 이용하게 됩니다. 이 s/ n를 표준오차(standard error)라고 합니다. 표준오차는 한마디로 추출분포의 표준편차의 추 정값 인 것입니다. 통계량이 x 라고 한다면 이 x 의 표준오차를 SE(x )로 표기하겠습니다. Definition 5 어떤 통계량의 추출분포의 표준편차(σ/ n)를 표본을 이용해 추정했을 때, 그 추정량을 표준오차(standard error)라고 합니다. 표본 평균 통계량(x )의 표준오차는 다음과 같습니 다. s SE(x ) = n 이제 표준편차와 표준오차의 차이점에 대해서 확실히 이해되시죠? 여기서 이런 의문점이 드실 것 같습니다. σ를 왜 s로 대체하냐는 것입니다. 간단하게 그 이유를 말씀드리면 이 s2 가 σ의 비편의 추정량 이기 때문입니다. 즉 E(s2 ) = σ 2 입니다. µ를 x 로 추정하죠? 왜죠? 바로 x 가 µ의 비편의 추정량이기 때문입니다. 어떤 표본을 무작위로 추출하면 그 표본이 모집단을 잘 대표할 것이라고 말씀을 드렸습니다. 따라서 그 표본의 표준편차와 모집단의 표준편차가 크게 다르지 않을 확률이 큽니다. 따라서 σ를 s로 대체하는 것입니다. 자 더 논의를 진행하도록 하겠습니다. x 에 대한 유의성 검정을 할 때 다음과 같은 검정 통계량(z)을 사용했습니다. z= 손호성 x µ σ/ n 22 노트 7
2017년 4월 5월 한국보건사회연구원 통계학 및 계량경제학의 기초 및 응용 그리고 이 검정 통계량은 모집단이 정규분포일 때 표준정규분포를 따르고 모집단이 정규 분포가 아니여도 표본을 무작위로 추출하고 표본 수가 충분히 크면 CLT에 의해 표준정규 분포를 따른다는 것을 배웠습니다. 그래서 우리는 확률을 계산할 수 있었습니다. 저 검정 통계량 공식 안에 있는 σ를 s로 대체한 검정 통계량(t)은 다음과 같습니다. t= x µ s/ n 문제는 이 검정 통계량 t 즉 표준오차로 대체해서 도출되는 검정 통계량은 정규분포를 따르지 않는다는 것입니다. 그럼 어떡하냐고요? 다행히 어떤 통계학자가 이 검정 통계량 t가 t분포를 따른다는 것을 증명해주었습니다. Theorem 1 n개 크기의 표본을 N (µ, σ)인 모집단에서 무작위로 추출했다고 하겠습니다. 그러면 t 검 정 통계량은 다음과 같습니다. t= x µ s/ n 그리고 이 t 검정 통계량은 자유도가 n 1인 t분포를 따릅니다. 여기서 n은 표본의 크기를 말합니다. 따라서 t분포의 모양은 정규분포와는 달리 자유도에 의해 영향을 받습니다. t분포가 어떻게 생겼는지를 보도록 하겠습니다. 그림 5에 자유도에 따른 t분포와 표준정규분포를 표시했습니다. 그림을 보면 t분포와 표준정규분포의 모양은 비슷하게 생겼습니다. 차이 가 있다면 t분포의 경우 꼬리 부분이 좀 더 두텁고 중앙의 높이가 좀 낮다는 사실입니다. 즉 t분포의 변이가 좀 더 크다는 것을 의미하는데요, 이렇게 변이가 더 큰 이유는 상수인 모집단 표준편차를 확률변수 s로 대체했기 때문에 추가적인 변이가 추가되기 때문입니다. 한 가지 말씀을 드릴 것은 표본 수가 증가할 수록, 즉 자유도가 증가할 수록 t분포는 정규분포에 수렴한다는 것입니다. 왜 수렴하게 될까요? 극단적인 예로 만약 표본 수가 모집단 수와 같다고 하겠습니다. 그럼 어떻게 될까요? s와 σ는 일치할 것입니다. 따라서 정규분포와 같아지는 것입니다. 대체로 사회과학 연구에서는 표본 수가 크기 때문에 t 분포와 정규분포의 구분이 큰 의미가 없습니다. 손호성 23 노트 7
2017년 4월 5월 한국보건사회연구원 통계학 및 계량경제학의 기초 및 응용 그림 5: t분포 vs. 표준정규분포 B. t분포를 이용한 신뢰구간 추정 이제 모집단 표준편차 σ를 모를 때 모집단 평균 µ에 대한 통계적 추론을 할 수 있습니다. 우선 첫 번째 통계적 추론인 신뢰구간을 추정해보도록 하겠습니다. 평균이 µ인 모집단으로 부터 n개 크기의 무작위 표본을 추출했을 때, µ의 C 수준의 신뢰구간은 다음과 같습니다. s x ± t n 위에서 t 는 t(n 1)분포에서 면적을 C로 하는 값을 말합니다. 신뢰구간 추정과 관련한 간단한 예를 풀어보도록 하겠습니다. 예4 세종시에 있는 연구원에 취직한 김경래 연구원은 세종시에 머물기 위해 세종시 주변에 있는 월세방 월세에 대해서 조사를 했습니다. 김경래 연구원은 모든 월세방을 조사할 수 없기 때문에 16개의 월세방을 무작위로 추출하고 이 16개를 대상으로 평균 월세를 계산 했습니다. 세종시에 있는 월세방의 월세는 N (µ, σ)를 따른다고 알려져 있습니다. 계산된 평균 x 는 60만원이였고 표준편차 s는 5.5만원이였습니다. 이 정보를 토대로 세종시에 있 는 모든 월세방의 월세의 95% 신뢰구간을 추정해보겠습니다. <답> 95% 신뢰구간을 추정하기 위해 먼저 해야할 일은 t 값을 찾는 것입니다. 자유도는 16 1 = 15입니다. t분포표를 보면 자유도 15 하의 t 값은 2.131인 것을 알 수 있습니다. 손호성 24 노트 7
2017년 4월 5월 한국보건사회연구원 통계학 및 계량경제학의 기초 및 응용 그림 6: t분포표 표를 보실 때 유의해야할 점은 p = 0.025 열의 숫자를 봐야한다는 것입니다. 왜냐하면 95% 신뢰구간이기 때문에 한 쪽 꼬리의 면적이 2.5%여야 하기 때문입니다. 이제 95% 신뢰구 간을 추정할 수 있습니다. s 5.5 x ± t = 60 ± 2.131 = (57.07, 62.93) n 16 C. t분포를 이용한 유의성 검정 t분포를 이용한 유의성 검정 방식은 표준정규분포표를 이용한 유의성 검정과 거의 흡사 합니다. n개 크기의 무작위 표본을 토대로 귀무가설 H0 : µ = µ0 를 검정할 때는 다음과 같은 t 검정 통계량을 이용합니다. x µ0 t= s/ n 손호성 25 노트 7
그림 7: 대립가설에따른 p 값 p 값을구하기위한면적은그림 7 과같이대립가설이양측이냐단측이냐에따라달라집 니다. 문제를하나풀겠습니다. 예 5 출판협회에따르면우리나라성인은평균적으로일년에 5.4권을읽는다고합니다. 출판협회의주장을검정하기위해 31명의성인을모집단에서무작위로추출하였습니다. 모집단은정규분포를따른다고가정하겠습니다. 이표본의평균 x 는 7.16권, 그리고표준편차 s는 3.56권입니다. 5% 유의수준에서유의성검정을해보겠습니다. < 답 > 출판협회의주장을검정하기위해서다음과같은가설을검정합니다. H 0 : µ 0 = 5.4 vs. H a : µ 5.4 손호성 26 노트 7
t 검정통계량은다음과같습니다. t = x µ 0 s/ n = 7.16 5.4 3.56/ 31 = 2.752 위에도출한검정통계량 2.752가무엇을의미하나요? 이것이뜻하는것은우리가조사한표본평균이귀무가설에기술한추출분포의중앙 5.4에서약 2.75 표준편차만큼떨어져있다는것입니다. 자유도는 n 1 = 30입니다. 위검정통계량 t는 t(30) 분포를따릅니다. 왜냐하면정규분포인모집단으로부터무작위로표본을추출했기때문입니다 (Theorem 1 참고 ). 그림 6에있는 t분포표를보면이검정통계량과관련해서도출되는 p값은 0.005 2 = 0.01 입니다. 따라서이 p값이 0.05보다작으므로우리는 5% 유의수준에서귀무가설을기각할수있습니다. 다시말해출판협회의주장이틀리다고주장할수있는강력한근거가존재한다고할수있습니다. D. t 검정의강건성 (Robustness) 정리 (Theorem) 1 을다시읽어보시길바랍니다. t 검정통계량이 t 분포를따르기위해서는 어떤조건이필요했나요? 하나는무작위추출이고또다른하나는모집단이정규분포를 따라야한다는조건이필요했습니다. 지난번에도말씀을드렸지만모집단이정규분포를 안따르는경우가많습니다. 그렇기때문에이 t 검정의유효성은모집단의비정규성 (nonnormality) 에얼마나민감하냐에달려있습니다. 어떤검정결과가가정등에민감하지 않을때그러한검정절차를강건 (robust) 하다고합니다. 다시 t 검정통계량공식을살펴보도록하겠습니다. t = x µ 0 s/ n 우선공식을보면 t 검정통계량은특이값에강건하지않습니다. 왜냐하면특이값에강건 하지않은 x 와 s 에의해결정이되기때문입니다. 반면 t 검정은모집단의비정규성에는 상당히강건합니다. 특히표본수가클때그렇습니다. 그이유에는두가지가있습니다. n 이크면표본평균 x 의추출분포는 CLT 에의해정규분포에근사하기때문입니다. 또한 n 이증가할수록표준편차 s 가 σ 에수렴하기때문에결국 t 검정통계량은 z 검정통계량에수렴하게되기때문입니다. 많은시뮬레이션결과에의하면 n 30 정도가되면 t 검정이유효하다고알려져있 습니다. 명심해야할것은모집단의정규성가정보다더중요한것이표본을무작위로 추출해야한다는가정입니다. 손호성 27 노트 7