간호학연구를위한표본크기산출법 이원기 Ph.D 경북대학교의학전문대학원조교수 2016 년 4 월 5 일
중재의효과크기 :δ/sd=0.23 유의수준 : 0.05 검정력 : 80% 자료분석 : 반복수가 4 인 2 요인분산분석
간호학연구에서적절한연구대상자수 Sample Size? 연구대상자수를너무작게하여연구를진행하면어떤문제가발생할까? 또는너무많은연구대상자수를대상으로연구를진행하면어떤문제가발생할까? 어떤원칙으로연구대상자수를결정할까?
표본크기와오류와의관계 표본크기가작기때문에 H 1 이참일때 H 0 을거의기각할수없다. 즉 α 오류는작아지고 β 오류는지나치게커지게된다. H 0 : μ = 0 H 1 : μ = μ 1 Type I Error Type II Error 적절한표본크기가되어야적당한 α 및 β 오류를가지는검정을할수있다. 즉 H 0 가참일때 H 0 을기각하지못하고, H 1 이참일때 H 0 을기각할수있다. 표본크기가커지게되면거의항상 H 0 을기각하게되어 α 오류는커지고 β 오류는매우작아진다.
연구대상자수 연구대상자수계산법은계산에사용된추정량과함께연구계획서에제시되어야하며, 추정량의근거도제시되어야한다. 치료효과의차이는환자의관리에임상적관련성이있는최소한의효과혹은새로운치료의기대되는효과에관한판단에근거할수도있다. 전통적으로제 1 종오류의확률은 5% 혹은그이하로정해져있거나, 다중성을고려하여보정되고, 제 2 종오류는전통적으로 10% 에서 20% 로정해져있다. [ 임상시험통계지침서中 ]
전통검정법 vs 동등성검정 H H 0 T A A : : T A H H 0 T A A : T A : H H : 0 T A A : T A
실험연구에서연구설계형태 1) 병행설계 (Parallel Designs) 연구대상자 준비 기간 무작위배정 실험군 A 실험군 B 대조군 2) 교차설계 (Crossover Designs) 중재기간 (Period) 연구대상자 무작위배정 치료순서 1 (Sequence 1) 치료순서 2 (Sequence 2) I 실험군 대조군 세척기간 II 대조군 실험군
연구대상자수결정요인 유의수준크기 ( 제 1 종오류 α 의크기 ) : 일반적으로 0.05 목표검정력 ( 제 2 종오류 β 의크기 ) : 일반적으로 0.10 0.20 연구자가밝히고자하는효과크기의정도 δ (Effect size) : Minimum treatment difference, True mean or proportion difference, Superiority/Non-Inferiority/Equivalence Limit 검정의종류 (Superiority/Equality, Non-Inferiority, Equivalence) 예상되는모집단의표준편차 계획된연구설계와연구분석에사용되는통계기법 : 병행 / 교차설계 계획된분석횟수 단한번의분석을통해결정 여러번의중간분석을통해그때마다피험자수재산정 기타 : 실험군 / 대조군의수및할당비, 추적기간, 중도탈락률, 순응률
연구대상자수결정요인 자료분석방법고려 - 표본수산출시자료분석계획은대부분모수적방법을기본으로한다. - 모수적방법은표본분포의정규성문제 1 모집단이정규분포를따르면표본수가 5-6 정도, 그렇지않은경우 30이상 2 이항분포의경우 nπ 5 and n(1-π) 5. 로지스틱회귀분석의경우각독립변수에대하여종속변수의각수준에서적어도 10개의관측치가있어야. 3 측정오차의잠재성, subgroup analysis 가능성, 모형추정을위한자유도확보 ( 추정모수수의최소 5배, 10배이상권장 ) 등다양한측면을고려하여계획단계에서는충분한크기의표본수설정 4 지나치게큰표본수는측정오차와비용증가뿐만아니라검정의민감도를높아져 False Positive rate( 제 1종오류율 ) 이커진다는점고려 5 해당연구가확증적인지탐색적인지에따라표본수산출의중요성고려 6 표본수산출은계획단계에서결정하는 Guideline이지절대적인 rule은아님
Cohen 이제안한유효크기 Cohen, J. (1977). Statistical power analysis for the behavioral sciences. New York: Academic Press. Cohen, J. (1988). Statistical power analysis for the behavioral sciences. (2nd ed.). Hillsdale, NJ: Erlbaum
표본크기산출소프트웨어 1 (G*Power)
두집단평균비교 ( 병행설계 ) 두집단간에평균이차이난다는것을보이고자할때 - 사전정보및결정사항 : α 오류, β 오류, 공통표준편차 σ, 두그룹의예상평균또는예상되는평균값차이 - 계산방법 : 엑셀파일이표본쉬트 2 20 2 이표본 t- 검정에서의표본크기 유의수준 (α) 검정력 ((1-β)*100) Mean Difference SD 추청치유효크기 δ 표본크기 0.05 80 20 50 0.4 98.11099668 1.959964 0.841621234
실습 1 : 두집단평균비교 중등도의고혈압환자에서 7 일간치료일시중지기동안 24 시간평균활동수축기혈압 (masbp) 의차이가두 Regimen A, B 에서 3mmHg 만큼있음을보이고자할때필요한피험자수? 선행연구로부터각그룹의분산이 (13mmHg) 2 으로추정되었다고하자. 2 2 즉 3, 13 이다. 5% 의유의수준과 80% 의검정력을가지고양측검정을한다고하면, 두그룹에동일한수의환자를할당한다고했을때 n n n ( r 1), 1 2 2 n 2 Z 2 1 / 2 Z1 2 13 2 n 2 2 1.96 0.84 = 3 2 294 각그룹당 294 명씩총 588 명정도의피험자가필요하게된다.
실습 2 : 두집단평균비교 예전에는저효율의투석막 (Low-Flux) 만을사용한투석치료를주로하였으나, 최근에는고효율투석막 (High-Flux) 의사용과함께혈액투석여과 (Hemodiafiltration, HDF) 등의새로운투석방법이발전하게되어중분자물질의제거가용이하게되었다. 따라서말기신부전환자에서혈액투석방법 (Low-Flux HD vs. High-Flux HD+HDF) 에따른인슐린저항성의개선정도에차이가있을것으로생각된다. Table 2. Demographic characteristics of ESRD patients (mean +/- SD) Blood Purif 2008;26:213 220 (Low-Flux) (High-Flux)
평균변화에대한두집단의비교 최종결과변수 : baseline과 intervention 후변화 연구대상자수결정공식 : 2 d n nc nt, n 2 2 ( dc dt ) Z1 / 2 Z1 2 2 (1 ) 2 2 d dc (= 1c- 0c) : 대조군의 baseline 과 intervention 후측정변수의평균변화 dt (= 1t- 0t ) : 실험군의 baseline 과 intervention 후측정변수의평균변화 2 : 측정변수의분산 : baseline 값과 intervention 후측정한값과의상관계수
실습 3 : 평균변화에대한두집단의비교 실험군 (t) 과대조군 (c) : 2집단 결과변수 : intervention 후혈압의변화 대립가설의형태 : 양측검정 최소유의한차의정도 : = 4mmHg 할당비 : 1:1 α = 0.05, β = 0.20 σ = 10mmHg, ρ = 0.3 2 n n n, 2 (1 0.3) 100mmHg 140mmHg c t d 140mmHg n 2 1.96 0.84 2 137명 2 ( 4mmHg)
실습 4 : 평균변화에대한두집단의비교
세집단이상평균비교 ( 병행설계 ) 예제 ) 세집단간평균차이가있는지알아보기위한표본크기를계산해보자. 선행연구에서각군의평균이 60,65,80 이었고이들의공통표준편차가 10 이었다고알려져있는경우, α=0.05 하에서 power 80%(β=0.2) 를얻기위해서는각군 9 명총 27 명이필요하다.
두집단반복측정자료군간비교 예제 ) 두가지진통제가수술후통증에미치는효과를보는연구가있다고가정한다. A 라는약은수술후통증의조절을위하여전통적으로사용되어온약이며, B 라는약은새로개발된약이라고한다. 두가지약의효과를판정하기위하여, 수술후 2 시간, 4 시간, 6 시간에 100 mm 시각통증점수 (visual analogue scale) 를사용하여통증을측정하기로하였다. 이전의연구에서각시간사이에시각통증점수들사이의상관관계는 0.5 였으며, 연구자들은 a =.05, 검정력 80% 를적용하여표본수의계산을수행하고자한다. 만일찾아내고자하는효과크기가알려져있다면이과정은매우쉽게적용할수있다. 본예에서는 Cohen 이제시한 F- 분포에서를선별하기위한표본수를산정하고자한다. 중간크기의효과크기 (effect size = 0.25) Source: Anesth Pain Med 2015; 10: 6-15
Test > Means > Repeated measures,between factors, ANOVA-approach ( 효과크기에대한정보가없어 Cohen 의중간크기사용예 ) 효과크기 비교그룹수반복횟수 군내싯점간상관관계
Test > Means > Repeated measures,between factors, ANOVA-approach ( 효과크기정보가있는경우의예 ) Total sample size=168 한군의표본크기임.
두집단비율비교 Regimen B 가 Regimen A 보다유효율이같지않다는것을보이기위한피함자수계산. 일차변수를일정기간동안의 complete response rate 로정의하고두치료방법의유효성비교를카이제곱검정으로한다고가정하고 두군의할당비를동일하게한경우, 각군에필요한연구대상자수산출공식
실습 5 : 두집단비율비교 주장하고자하는바가특정상수비율과비교하여차이가있다는것을보이고자할때 - 사전정보및결정사항 : α 오류, β 오류, 비교대상상수비율 p 0, 연구자가주장하는비율 p 1 - 계산방법 : 엑셀파일이표본쉬트 이표본 χ 2 - 검정에서의표본크기 유의수준 (α) 검정력 ((1-β)*100) 대조군비율 Pc 실험군비율 Pt 비율차이 실험대조군할당비 r(1:1) 표본크기 0.05 80 0.500 0.300 0.200 2 92.999 1.959964 0.841621234 p=0.4
상관계수추정을위한피험자수 주장하고자하는상관계수 r 이얼마라고주장하고자할때 - 사전정보및결정사항 : α 오류, β 오류, 연구자가주장하는상관계수 r - 계산방법 : 엑셀파일상관계수쉬트 모상관계수 ρ=0 에대하여 ρ 0 아니라고할때 모상관계수 ρ=r 0 에대하여 r 1 이라고주장할때 유의수준 (α) 검정력 ((1-β)*100) 주장하는유효크기 W ES 표본크기 유의수준 (α) 검정력 ((1-β)*100) r 0 r 1 Q 표본크기 0.05 80 0.30 0.310 84.928 0.05 80 0.30 0.70 0.558 53.456
회귀분석에서의피험자수 종속변수에영향을미치는독립변수가둘이상존재하는경우 통제변수 : 종속변수에영향을미치지만관심변수가아닌변수 정의 C : 통제변수 R 2 (C) : 통제변수에의한 R-square T : 독립변수 R 2 (T C) : 변수가통제된상태에서독립변수에의한 R-square α=0.05, β=0.20
example1 : Warfarin 복용환자의 Anti-coagulation 에관한연구 1 차목적 : 심방세동환자에서 Warfarin 의 INR 에미치는대한영향요인분석질환이환율, Vit.K+ 식이, 타질환이환율, 건강문해력, 약물복용순응도 (medication adherence),
< 참고 > Loss to Follow-up and Non-adherence Loss to Follow-up : Outcomes for some subjects may not be available because the subjects fail to return for follow-up evaluations. N = N * / (1-r), Now, N * = 피험자수계산식을만족하는 N r= Proportion Loss to Follow-up Non-adherence : Subjects may fail to receive all or part of the intended therapy. cf) Non-compliance or drop-out
Table. Impact of non-adherence and loss to follow-up on required sample size p+q r 0 10% 20% 30% 40% 50% 0 1000 1111 1250 1429 1667 2000 10% 1235 1372 1543 1764 2058 2469 20% 1562 1736 1953 2232 2604 3125 30% 2041 2268 2551 2915 3401 4082 40% 2778 3086 3472 3968 4630 5556 50% 4000 4444 5000 5714 6667 8000 r = Proportion Loss to Follow-up p = 시험군인데대조군약물을복용한비율 q = 대조군인데시험군약물을복용한비율
참고문헌 1. 김우철외. 통계학개론. 영지문화사 1998 2. 박태성, 이승연. 범주형자료분석개론. 자유아카데미 2007 3. Joseph F. Hair, JR et al. Multivariate data analysis 5th edition. Prentice Hall, 1998. 4. CooK TD, et al. Introduction to Statistical Methods for Clinical Trials. Chapman & Hall/CRC 5. Chow SC, et al. Sample Size Calculations in Clinical Research. Taylor & Francis. 6. Hintze JL et al. PASS 2008. NCSS.
도구를이용한조사연구예 박선정, 강경아, 김신정. 영 유아기부모의양육행위유형 : Q- 방법론적접근. 대한간호학회지 43 권 4 호, 2013 Q 방법론은개인간의차이 (inter-individual difference) 가아니라개인내의중요성의차이 (intra-individual difference in significance) 를다루는것으로주관성을강조하는질적조사연구이다. 이는 P 표본의수에크게제한을받지않으며오히려 P 표본이커지면한요인에여러사람이편중되어그특성을명확하게파악할수없는통계상의문제가발생할가능성이있으므로소표본이론 (small sample doctrine) 을따르게된다 (Kim, 2008). Kim, H. K. (2008). Q methodology: Philosophy, theories, analysis, and application. Seoul: Communication books.
실험후도구를이용한조사연구예 홍정아 양수. 병적도박자가족교육프로그램의적용효과. 대한간호학회지제 43 권제 4 호, 2013 표본의크기는효과크기 0.88, 유의수준 0.05, 검정력 80% 로하여 G*power 3.0 프로그램을활용했을때집단별로 22 명씩총 44 명이필요한것으로산출되었다. 본연구에서는탈락률을고려하여실험군 25 명, 대조군 26 명이선별되었고, 연구진행과정중개인사정으로인해 1 회이상프로그램에불참한실험군 3 명과사후조사에불참한대조군 4 명이제외되어최종연구대상자는실험군 22 명, 대조군 22 명으로총 44 명이었다. - 주연구변수는무엇인가? - 효과크기 0.88 의근거는?
실험후도구를이용한조사연구예 이인숙, 박호란. 북한이탈학령전기아동을위한건강교육프로그램개발및중재효과. 대한간호학회지제 43 권제 4 호, 2013 비동등성대조군전후시차설계의유사실험연구이다. 위의선정기준에합당한대상자가운데연구설계에따라 G*power 3.0 프로그램을활용하여두집단 3 시점의반복측정분산분석법에의해효과크기 0.30, 유의수준 0.05, 검정력 80% 로하여산출하였다. 그결과각집단별로 26 명이필요하였고 20% 의탈락률을예상하여실험군과대조군각각 29 명으로배정하였다. - 주연구변수는무엇인가? - 효과크기 0.30 의근거는?
- 주연구변수는무엇인가? - 연구목적변수가여러개인가? - 실험연구인데 Pretest 를포함시켜분석한다고계획하였는가? or 분석방법이옳은가?