Review Article doi:http://dx.doi.org/10.5397/cise.2013.16.1.53 대한견 주관절학회지제 16 권제 1 호 Clinics in Shoulder and Elbow Volume 16, Number 1, June, 2013 임상연구에서연구표본수의산출 가톨릭대학교의과대학서울성모병원정형외과 이효진 김양수 박박인 Calculation of Sample Size in Clinical Trials Hyo-Jin Lee, M.D., Yang-Soo Kim, M.D., In Park, M.D. Department of Orthopedic Surgery, Seoul St. Mary s Hospital Catholic University of Korea Purpose: This review aims to explain the definition and basic principle of statistical analysis and to clarify statistical issues related to the sample size calculation. Materials and Methods: Many formulas are available that can be applied for different types of data and study design. Results: The sample size is the number of patients or other experimental units that need to be calculated prior to the study. Determining the appropriate sample size is required to answer the research question. Conclusion: Caution is needed when applying formula for the calculation of the sample size, as it is sensitive to error and even small differences in selected parameters can lead to large differences in the sample size. Key Words: Sample size, Statistica analysis, Significance, Power, Effect size 서론연구표본수 (Sample size) 란연구에참여하는환자의수혹은실험단위를뜻하는것으로, 임상연구에서표본수산출의목적은의미있는연구결과혹은치료효과를산출해내기위한참여단위의수적파악에있다. 1,2) 임상연구를시작하기전에연구자는연구표본수를미리결정하여야한다. 3) 엄격하게잘시행된연구라하여도표 본수가충분치않으면원하는연구결과를얻지못하거나, 얻더라도그결과의신뢰도는떨어진다. 반대로연구표본수가너무크다면시간, 비용측면에서비효율적이며, 추적손실이나순응도저하등의관리문제가발생할수있다. 원하는연구의결과가유의한의미를갖기위한최소한의연구표본수를정하는것은초보연구자에게있어서큰부담으로다가오지만, 연구의정당성을뒷받침할수있는표본수산출의정확한기재는현시대의학 통신저자 : 김양수서울특별시서초구반포대로 222 가톨릭대학교서울성모병원정형외과 Tel: 02) 2258-6117, Fax: 02) 535-9834, E-mail: kysoos@catholic.ac.kr 접수일 : 2013 년 6 월 4 일, 1 차심사완료일 : 2013 년 6 월 17 일, 게재확정일 : 2013 일 6 월 20 일 53
대한견 주관절학회지제 16 권제 1 호 술지혹은연구발표의필수적인요소가되었다. 2. 검정력 (Power) 및제 2 종오류 본론모든임상연구는 다른상황을생각하게하는명확한근거가없는한현상적인모든차이는없다 (zero hypothesis, 영가설 ) 라는과학철학적명제로부터시작한다. 새로운치료법의효과를입증하고자한다면 새치료법은효과가없다 라는영가설을전제로하여연구를시작한다. 4) 연구자가증명하고자하는실험가설과반대되는입장, 증명되기전까지는효과도없고차이도없다는영가설을귀무가설 (null hypothesis, H 0 ) 이라하고, 반대로연구자가실험을통해규명하고자하는가설을대립가설 (alternative hypothesis, H 1 ) 이라고한다. 연구표본수산출의첫단계는분석하고자하는변수의성격을이해하는것이다. 변수는크게범주를서로구분하는범주형 (categorical) 과수량화가가능한연속형 (numerical, continuous) 으로구분된다. 그리고범주형자료는서열성여부에따라명목 (nominal) 척도와순위 (ordinal) 척도로나누어지며, 연속형자료는실질적인 0( 영 ) 점유무에따라비척도와구간척도로나뉜다. 가설을검정에사용할통계적모형은결과변수의성격에의해거의결정되는데, 예를들면, 독립표본 t 검정이나일원배치분산분석은연속형변수의비교에쓰이고 ( 예, BMI, ASES score), 카이제곱검정은범주형변수의비교 ( 예, 당뇨와비만과의관계 ) 에이용된다. 이렇게변수의성격과통계적모형이결정되면이제연구표본수를추정할수있다. 이때필요한세가지요소가유의수준, 검정력, 효과크기이다. 이들요소에대해하나씩알아보자. 검정력 (1-β) 이란실제로효과가있는것을통계분석을통해효과가있다고증명할수있는힘으로, 잘못된귀무가설을기각하는능력을말한다. 6) 일반적으로검정력은 0.80(80%) 로설정하고, 그이상의검정력을요구할경우더많은수의연구표본수를필요로한다. 7) 연구표본수가작아지면실제로효과가있지만결과상효과가없다는결론을도출하는제 2종오류 (β) 의가능성이높아지며검정력은감소하게된다. 연구자들은제 1종오류를 5% 로유지하면서검정력을최대화하는통계기법을사용하고자한다. 8-11) 3. 효과크기 (Effect size) 효과크기 (δ) 의통계학적인정의는귀무가설 (H 0 ) 과대립가설 (H 1 ) 간차이의크기로, 12) 비교할두집단간의차이가임상적으로의미가있는정도로설명할수있다. 13) 효과크기를구하는방법은통계모형마다다르다. 예를들어상관분석에서는상관계수 r로, 독립표본 t검정에서는 d로, 분산분석에서는 f로표현된다. 효과크기가 0 이라는것은실험집단의평균과통제집단 (control group 혹은대조군 ) 의평균이같다는뜻이고, + 값이나왔다는것은실험집단의평균이통제집단의평균보다크다는것을의미하고, -값은그반대의경우이다. 절대값이클수록실험집단과통제집단의차이가크다는것을의미하는데, 어느정도의효과크기를사용할것인지는임상적인판단에의한다. 4. 표본수추정을위한공식 1. 유의수준 (Significance level) 및제 1종오류유의수준이란통계분석에서제 1종오류를범할가능성을뜻하는것으로서, p (probability) 값으로표기한다. 여기서제 1종오류 (a) 란실제로효과가없는데결과상효과가있다고나오는오류를일컫는것으로, 귀무가설을거짓으로기각하게된다. 5) 가장문제가되는오류로일반적으로학계에서는이를 5% 미만으로통제하고있다. 바꾸어말하면실제효과가없는데효과가있다는결론이도출될가능성을 5% 미만으로묶어두어야만임상시험결과의유효성을인정하겠다는것이다. 1) 이분형변수 (Dichotomous variables) 에대한표본수산정산정공식 n 1 =n 2 =[(2p m q m ) 1/2 z 1-a/2 +(p 1 q 1 +p 2 q 2 ) 1/2 z 1-β ] 2 /Δ 2 n 1 = 비교군의연구표본수 n 2 = 시험군의연구표본수 p 1, p 2 = 각군의예상되는결과발생율 p m =(p 1 +p 2 )/2 q m =1-p m Δ=p 1 -p 2 Z= 평균이 0, 분산이 1인표준정규분포곡선에서해당하는지점의값시험결과가생존혹은사망, 완치혹은재발등과같 54
이효진 : 임상연구에서연구표본수의산출 이서로상반되는종속변수로표현될경우이분형변수라한다. 효과의차이를계산하기위해서시험군과비교군의차이를미리설정하여야한다. 일반적으로 p 1 값은특정연구와유사한임상시험의결과로부터얻어져야하나기존문헌에서값을얻지못하는경우에는사전연구 (pilot study) 를통해그값을취할수있다. 일반적으로 p 1 값을과대하게추정하면, 연구표본수가필요한수보다적게계산되어문제가될수있다. 2) 연속형변수 (Continuous variables) 에대한표본수산정 n 1 =n 2 =2(σ 2 )(z 1-a/2 +z 1-β ) 2 /Δ 2 n 1 = 비교군의연구표본수 n 2 = 시험군의연구표본수 Δ= 각군의평균값의차이 σ 2 = 시험군, 비교군공통의분산값시험의변수가연속형일때는효과의차이는평균치의함수로표현되며, 이분형결과에서 p 1 을추정하는것과마찬가지로연구표본수를계산하기위해서분산의추정치를필요로한다. 임상연구에서연속형변수의표본수산정의가장중요한요소는임상적인의미를가질수있는두군간의차이를파악하거나, 환자에게영향을끼칠수있는최소한의차이점을파악하는것이다. 5. 탈락자의처리 (Accounting for dropout and loss of follow-up) 6. 웹사이트에서계산하기표본수산정을위해직접위의수식을적용하는데는적잖은노력과시간을요하기때문에, 많은기관에서간단하게표본수를구할수있는서비스를웹상으로제공하고있다. 그중에하나인 University of British Columbia (UBC) 의 Department of Statistics 에서제공하는서비스 (http://stat.ubc.ca/~rollin/stats/ssize/) 를 Is Early Passive Motion Exercise Necessary After Arthroscopic Rotator Cuff Repair 14) 논문을예로들어소개하고자한다. 1) 이분형변수 (Dichotomous variables) 에대한표본수산정회전근개파열환자의수술적치료후, 조기관절운동군과지연관절운동군의재파열율을비교하고자한다. 본연구는 80% 의검정력을갖고유의수준 5% 을유지하고자한다. 웹사이트상에서네번째에있는 Comparing Proportions for Two Independent Samples 를선택한다 (Fig. 1). 문헌고찰을통해회전근개파열수술후일반적인 ( 지연 ) 관절운동을했을경우 30% 의재파열을보였다 (p 1 ). 10% 이상의재파열율감소를효과크기로설정할경우, 조기관절운동군의재파열율을 20% 로설정하여 p 2 값에대입한다. 대입한결과본연구에서는각군당최소 294명의환자가필요하며 (Fig. 2), 10% 의탈락률을고려하면최종적으로각군당 327명을모집하면된다. 연구자는임상연구등록후에명단에서제외되거나추적관찰중누락될수있는탈락자에대해고려하여야한다. 이런이유로연구전추정된표본수보다많은표본수를산정하여야한다. 또한, 추적기간이증가할수록탈락자는증가하게된다. 연구설계와성격에따라다르겠지만, 일반적으로 10% 에서 15% 정도의표본수를증원한다. 2) 연속형변수 (Continuous variables) 에대한표본수산정회전근개파열에대한수술적치료후, 조기관절운동군과지연관절운동군간의치료효과를비교하고자한다. 치료효과를판단할수있는기능평가는 ASES score를사용하기로하였다. 20명의환자를대상으로시행한예비연구를통하여, 조기관절운동군의평균 ASES score 는 75점이었으며 (mu1), 의미있는평균의 Fig. 1. Select Comparing Proportions for Two Independent Samples for sample size calculation on dichotomous variables. 55
대한견 주관절학회지제 16 권제 1 호 차이 (effect size) 를 8점그리고표준편차를 12점으로설정하였다. 이럴경우, 지연관절운동군의평균 (mu2) 값으로는조기관절운동군의평균인 75점에서효과크기인 8점을뺀 67점을대입하면된다. 90% 검정력을갖 고유의수준 5% 를유지하고자한다. 같은방식으로웹사이트에접속하여두번째에있는 Comparing Means for Two Independent Samples 를선택한다 (Fig. 3). 계산하면각군당 48명의환자가산출되며, 결과적으로 Fig. 2. Enter proportion (or expected result) for each group (p 1 & p 2). Enter values for required type I error level (a) and desired power (1-β). After filling out the blanks with appropriate values, press calculate. Fig. 3. Select Comparing Means for Two Independent Samples for sample size calculation on continuous variables. Fig. 4. Enter mean of population from each group (mu1 & 2). Enter standard deviation for sigma value. Enter values for required type I error level (a) and desired power (1-β). After filling out the blanks with appropriate values, press calculate. 56
이효진 : 임상연구에서연구표본수의산출 10% 의탈락률을적용시킨다면본연구의의미있는결과산출을위해서는각군당최소 54명의환자가필요하다 (Fig. 4). 결 론 연구를계획하는데있어, 표본수산출은가장먼저선행되어야함과동시에가장중요한절차라고할수있다. 연구의성격을올바르게파악하여표본수산출에적합한공식을설정하여야하며, 표본수산출을통해충분한검정력여부및임상적으로유의한결과를도출할수있는최소한의효과크기를파악하는것이중요하다. 또한과도한크기의표본수산출은오히려연구를비효율적으로만들기때문에적절한표본수산출은매우중요하다. 표본수산출은오류에매우민감하며그릇된결과를도출할수있기때문에, 세심한주의를요하며필요시전문가의도움을요청하는것에주저하지말아야하겠다. REFERENCES 01) Whitley E, Ball J. Statistics review 4: Sample size calculations. Crit Care. 2002;6:335-41. 02) Kirby A, Gebski V, Keech AC. Determining the sample size in a clinical trial. Med J Aust. 2002;177: 256-7. 03) Altman DG. Practical statistics for medical research. 1st ed. London: Chapman and Hall; 1991. 25-101. 04) Bae JM. An illustrated guide to medical statistics using SPSS. 1st ed. Seoul: Hannarae; 2012. 20-1. 05) Machin D, Campbell MJ, Fayers PM, Pinol APY. Sample size tables for clinical studies. 2nd ed. Oxford: Blackwell Science; 1997. 1-13. 06) Pallant J. SPSS survival manual: A step by step guide to data analysis using SPSS. 4th ed. New York: McGraw-Hill; 2010. 121-202. 07) Siegel S, Castellan NJ. Nonparametric statistics for the behavioral sciences. 2nd ed. New York: McGraw- Hill; 1988. 19-37. 08) Hamilton LC. Data analysis for social scientists: A first course in applied statistics. 1st ed. London: Duxbury Press; 1996. 30-42. 09) Cohen J. Statistical power analysis for the behavioral sciences. 2nd ed. Hillsdale: L. Erlbaum Associates; 1988. 19-74. 10) Bland M. An introduction to medical statistics. 3rd ed. Oxford: Oxford University Press; 2000. 14-32. 11) Munro BH. Statistical methods for health care research. 5th ed. Philadelphia: Lippincott Williams & Wilkins; 2005. 73-106. 12) Thorne BM. Statistics for the behavioral sciences. 1st ed. Houston: Mayfield; 1989. 16-44. 13) Friedman LM, Furberg C, DeMets DL. Fundamentals of clinical trials. 4th ed. New York: Springer; 2010. 133-162. 14) Kim YS, Chung SW, Kim JY, Ok JH, Park I, Oh JH. Is early passive motion exercise necessary after arthroscopic rotator cuff repair? Am J Sports Med. 2012;40:815-21. 초 록 목적 : 임상연구의통계분석에있어서표본수산출의의미와기본방식에대해서알고자한다. 대상및방법 : 자료의분류, 연구디자인및도출하고자하는결과의성격에따라각기다른식을적용시켜표본수를산출한다. 결과 : 표본수산출은임상연구를시작하기전에선행되어야하며, 적절한표본수산출은유의한결론도출에필수불가결하다. 결론 : 표본수산출은에러나작은변수에민감하기때문에특정식에적용시킬때는주의를요한다. 색인단어 : 표본수, 통계학적분석, 유의성, 검정력, 효과크기 57