7. 평균치비교 1
두집단간평균차이검정 2
연속형변수 Interval scale( 간격척도 ) : 20 C, 30 C,, 변수간의가감가능 Ratio scale( 비척도 ) : 12, 13세, 변수간의가감승제모두가능 범주형자료로변환하여다양한분석가능 ( 연령 10 대, 20 대, 30 대.) 3
범주형자료의기술 분할표 (Contingency table) : 범주형자료를각변수별값의 결합에따라도수형식으로정리한표 (4X3 table) Cancer type Blood type Gastric cancer Liver cancer Pancreatic cancer A 13 25 26 B 28 20 19 O 42 44 35 AB 17 11 20 - 차원 (Dimension) : 분할표에있는변수의수 : 2차원 (Blood type, Cancer type) - 수준 (Level) : 각변수가취하는범주의수 : Blood type(4수준 ), Cancer type(3수준 ) 4
연속형자료의기술 대표값 : 평균 (mean), 중앙값또는중위수 (median) 등 산포도 : 분산 (Variance), 표준편차 (Standard deviation), 범위 (Range) 등 구분 고혈압여부 환자정상 P-value 연령 67.0±21.0 65.3±18.2 혈중콜레스테롤 253±36.0 225.3±28.2 5
모수검정 or 비모수검정 비모수검정적용 : 수집한자료가명백하게정규분포를따르지않는경우 표본수가너무작아분포를알수없는경우 한집단의표본수가 10 전후혹은두집단표본수의합이 20 전후일때 자료의관측척도가연속변수가아니라명칭척도혹은순위척도일때 6
비모수적방법 자료의 ( 정규성 ) 분포가정을하지않는다 편하다. 자료의평균과분산이아닌순위를이용한방법을사용한다. outlier 에둔감 7
모수검정과비모수검정의차이 적용자료 모수검정 양적변수 ( 연속변수 ) 자료가정규분포하는경우 표본수가큰경우 비모수검정 질적변수 ( 명목척도또는순위척도 ) 명백히정규분포하지않는양적변수 표본수가적은경우 ( 각집단의표본수가 10 이하 ) 장점 정보의손실이없음 모집단의분포에관한가정이불필요 적용절차가간단 통계적오류의가능성이낮음실측치보다순위적용 - 측정오차에덜민감 대부분의모수검정기법해당하는다양한기법이개발되어있음 단점 적용절차가다소복잡 통계적가정을무시하고적용시분석결과의오류가능성이높음 일부정보의손실 표본의크기가크면비효율적모수적조건을만족하는경우검정력이감소 8
모수또는비모수검정선택 자료의정규성이다소의심되더라도표본이큰경우 ( 절대적인기준은없으나각집단의표본수가 30~100 이상 ] 모수검정기법을적용하여도큰무리는없음 중심극한정리 각집단에서의표본수가 10 이하인경우는비모수검정기법을적용하는것이원칙임 각집단에서의표본수가약 10~30 이라면반드시정규성검정결과에따라선택 9
변수 (Variable) 분류방법변수명칭종류통계량 명목척도 성별, 지역 빈도, 백분율 ( 확인, 구분 ) 측정방법 서열척도등간척도 학력, 석차온도, 주가지수 빈도, 백분율 ( 순위비교 ) 평균, 표준편차 ( 간격 / 정도비교 ) 비척도 강도, 길이, 무게 평균, 표준편차 ( 절대크기비교 ) 종속변수 ( 특성값, 반응변수 ) 독립변수에대한반응으로서측정 되거나관찰이된변수 기능적 관 계 독립변수 ( 인자, 설명변수 ) 종속변수를관찰하기위해서조작, 측정되거나선택되어진변수. 다른변수에영향을줄수있는변수 10
변수 (Variables) 수량적변수 이산변수 (discrete variable) 한측정치와다른측정치간에중간값이존재할수없는변수 명목척도 (nominal scale), 순위척도 (ordinal scale) 예 ) 사망자수, 성별, 교통사고건수 연속변수 (continuous variable) 두개의측정치간에이론적으로무수한중간값존재 간격척도 (interval scale), 비척도 (ratio scale) 예 ) 혈압, 체중, 체온 11
방향성 독립변수 (independent variable) 어떤변수가다른변수의측정치에영향을준다고생각될때, 또는실제로한변수가다른변수의원인이되는경우, 후자의변수에대해전자의변수를독립변수또는예측변수 (predictor variable) 라한다. 예 ) 식사량과비만, 연령과혈압 종속변수 (dependent variable) 독립변수에의해영향을받는변수, 원인이되는변수에의해결과로관찰되는변수 예 ) 혈압, 체중, 체온 12
통계분석법의올바른적용 상황 바른통계분석법선택의포인트 1. 관찰된변수의척도는? 2. 검정하고자하는통계량은무엇인가? 3. 표본의크기는충분한가?, 분포는? 4. 비교표본의수는? 2개인가?, 3개이상인가? 5. 비교대상표본은서로독립적인가? 6. 비교하고자하는속성간에서로관련이 있는가? 7. 위험도추정이요구되는가? 8. 원인 ( 독립 )-결과( 종속 ) 가 1:1의관계인가? 9. 결과 ( 종속 ) 변수가연속변수인가? 10. 결과 ( 종속 ) 변수가이분변수인가? 1. 질적 ( 범주형 ) vs. 양적 ( 연속 ) 2. 평균치 vs. 분포 ( 비율 ) 3. 모수분석 vs. 비모수분석 4. t-test vs. ANOVA 5. Student t-test vs. paired t-test 6. 상관 ( 회귀 ) 분석 7. RR, OR (95% CI) 8. 단변량분석 vs. 다변량분석 9. 선형회귀분석 10. 로지스틱회귀분석 13
목적 ( 상황 ) 에따른통계검정적용 분석목적 2 군간비교 3 군간비교 2 군간 Pair ( 짝, 쌍 ) 비교 상관분석 영향요인분석 비척도 ( 연속자료, 값 ) t- 검정 (Student t-test) 분산분석 (ANOVA, F-test) 대응표본 t- 검정 (paired t-test) Pearson 상관분석 단순선형회귀분석 (Simple linear regression) 다중선형회귀분석 (Multiple linear regression) 명칭척도 ( 범주형자료, 율 [%]) 카이제곱검정 ( 교차분석 ) χ 2 -test (Pearson) χ 2 -test for trend( 경향성분석 ) 피셔직접확률법 ( 피셔의정확검정법 ) (Fisher's exact test) McNemar's test 단순로지스틱회귀분석 (Simple logistic regression) 다중로지스틱회귀분석 (Multiple logistic regression) 14
자료와분석목적에따른모수법과이에대응하는비모수법 모수법 (Parametric) 비모수법 (Nonparametric) 두개의독립된평균치 짝을이루는표본평균 Student s t-test Paired t-test Mann-Whitney(U) test Wilcoxon rank sum test Wilcoxon signed-rank test 3 개이상의평균치 one way ANOVA Kruskal-Wallis test 상관분석 Pearson 상관분석 Spearman 순위상관분석 15
분석전략틀 1 특성분석목적 ( 비교대상 ) 분석법 분포 2 군간 대상자의성 / 연령군 (-49/50-59/60-) 별분포일반적 / 주요특성에대한일원 ( 전체 ) 빈도분포표주요특성의성 / 연령군별빈도분포표고혈압 / 정상군의질병인지도 ( 점수 ) 차이고혈압 / 정상군의정기치료율 (%) 차이합병증여부 (1,0) 에따른치료이행도 ( 평점 ) 차이남 / 여의행복지수차이교육전후의인지도차이사업전후의검진율 (%) 차이 chi-square Summary statistics chi-square t-test chi-square, 위험도 (RR, OR) t-test t-test paired t-test chi-square, McNemar 16
분석전략틀 2 특성분석목적 ( 비교대상 ) 분석법 3 군간 상관 회귀 ( 영향요인 ) 정상 / 전기고혈압 / 고혈압군의비만 / 과체중동반율 (%) 차이 정상 / 전기고혈압 / 고혈압군의검진수검율 (%) 차이 고혈압 / 당뇨 / 양자 (both) 의행복지수비교 정상 / 전기고혈압 / 고혈압군의평균콜레스테롤치차이 인지도점수와실천도점수의상호관계? 순위척도와혈압의상관? 인지혈압군과실제측정혈압군은얼마나일치하는가? 첫번째와두번째응답 (%) 은얼마나일치하는가? 어떤요인들이이행도 ( 점수 ) 에영향을미치는가? ( 어떤요인들을개선하면이행도를개선시킬수있겠는가?) 어떤요인들이수검여부 (1,0) 에영향을미치는가? ( 어떤요인들을개선하면수검율을향상시킬수있겠는가?) chi-square, 위험도경향성분석, 위험도 ANOVA ANOVA 피어슨상관계수스피어만상관계수일치도 (kappa) 다중선형회귀분석다중로지스틱회귀분석 17
검정기법의종류와적용예 독립변수 ( 비교 group) 종속변수 ( 반응변수 ) 흔히적용되는통계적기법 모수검정비모수검정 * 환자군 / 대조군 (2 집단 ) 혈당측정치 ( 비척도 ) Student t-test Mann-Whitney U test Wilcoxon rank sum test 치료전 / 치료후 ( 짝을이룬자료 ) 혈당측정치 ( 비척도 ) paired t-test Wilcoxon signed rank test 대조군 /A 치료군 /B 치료군 (3 집단이상 ) 혈당측정치 ( 비척도 ) ANOVA test with multiple comparisons Kruskal-Wallis test 치료전 / 치료 2 주 / 치료 4 주후 (3 회이상반복측정 ) 혈색소치 ( 비척도 ) repeated measures ANOVA Friedman test 18
검정기법의종류와적용예 독립변수 ( 비교 group) 종속변수 ( 반응변수 ) 흔히적용되는통계적기법 모수검정 비모수검정 * 저소득층 / 중산층 / 고소득층 (2 집단이상 ) 보건소서비스에대한만족여부 ( 명칭척도 ) chi-squared test / Fisher's exact test/ Monte Carlo Test 정상 / 중등도비만 / 비만군 ( 순위척도, 3 구간이상 ) 당뇨발생여부 ( 명칭척도 ) chi-squared test / Score for trend test Mantel-Haenzel test 19
검정기법의종류와적용예 독립변수 ( 비교 group) 종속변수 ( 반응변수 ) 흔히적용되는통계적기법 모수검정비모수검정 * 종속관계가명확하거나예측의필요한연속변수의상관관계예 ) 임신기간 (gestational age) 과출생시체중, B, C, D 등의관련성 종속관계가불명확한두연속변수의상관관계예 ) 일일평균흡연량과알콜 Simple (multiple) linear regression analysis Pearson correlation analysis Spearman correlation analysis 치료군 / 비치료군 (2 집단이상 ) 생존여부 + 생존기간 ( 명칭척도 )( 비척도 ) survival data analysis 다양한위험요인 ( 성, 연령, 흡연여부등 ) 암발생여부 ( 명칭척도 ) multiple logistic regression analysis 20
비연속변수의분석 1 Two-by-two table 2 Two-by-k table 3 R-by-C table 4 Stratified table : Fisher's exact test, Pearson's chi-square test, chi-square test with Yate's correction, unadjusted likelihood ratio test relative risk or odds ratio, confidence limits phi coefficient, : global chi-square test, score test for trend, unadjusted likelihood ratio test for trend : Pearson's chi-square test, score test for trend, ridit analysis Cramer's V, gamma ststistic, Kendall's Tau-b, Stuart's Tau-c, Spearman's rank correlation : Breslow-Day test for homogeneity, adjusted global test, adjusted score test for trend, adjusted likelihood ratio test, adjusted likelihood ratio test for trend adjusted relative risk (Mantel-Haenszel or logit estimator), confidence limits 5 Multivariate Analysis : Multiple logistic regression, log-linear regression, polychotomous logistic regression conditional logistic regression 21