자료의 이해 및 분석

Similar documents
자료의 이해 및 분석

G Power

슬라이드 1

Chapter 분포와 도수분석

모수검정과비모수검정 제 6 강 지리통계학

Microsoft PowerPoint - IPYYUIHNPGFU

<4D F736F F F696E74202D20BBF3B0FCBAD0BCAE5FC0CCB7D0B0ADC0C72E BC0D0B1E220C0FCBFEB5D>

ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행

abstract.dvi

통계분석가이드라인 통계 (Statisitcs) 란? Second Language in Science 전남대학교치의학전문대학원임회정 1 2 모집단 (Population) 과표본 (Sample) 통계분석단계 Sampling 추정 1. 귀무가설수립 2.

PowerPoint 프레젠테이션

(001~006)개념RPM3-2(부속)

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

statistics

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

R t-..

슬라이드 1

PowerPoint Presentation

<31372DB9DABAB4C8A32E687770>

Statistics Basic_ko_chapter_04

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

PowerPoint 프레젠테이션

제장 2 비모수 검정(NONPARAMETRIC ANALYSIS) ③ 연구자는 SPSS 출력결과에서 유의확률을 확인하여 귀무가설(H0 )의 기각, 채택 여부를 결정한다. 예를 들어 연구자가 연구자료의 정규성을 검정하기 위하여 유 의수준을 α = 0.05로 설정하고 SPS

슬라이드 1

시스템경영과 구조방정식모형분석

YBM시사닷컴, 첨단 개인별 맞춤 학습 시스템 개발

제 1 절 two way ANOVA 제1절 1 two way ANOVA 두 요인(factor)의 각 요인의 평균비교와 교호작용(interaction)을 검정하는 것을 이 원배치 분산분석(two way ANalysis Of VAriance; two way ANOVA)이라

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

Microsoft PowerPoint - SBE univariate5.pptx

nonpara1.PDF

Chapter 11 비모수 및 무분포통계학

PowerPoint 프레젠테이션


R

확률과통계 강의자료-1.hwp

untitled


?

수도권과비수도권근로자의임금격차에영향을미치는 집적경제의미시적메커니즘에관한실증연구 I. 서론

(01) hwp

자료분석론 - 국민건강영양조사 분석

PowerPoint 프레젠테이션

Microsoft Word - EDA_Univariate.docx

2156년올림픽 100미터육상경기에서여성의우승기록이남성의기록보다빠른첫해로남을수있음 2156년올림픽에서 100m 우승기록은남성의경우 8.098초, 여성은 8.079초로예측 통계적오차 ( 예측구간 ) 를고려하면빠르면 2064년, 늦어도 2788년에는그렇게될것이라고주장 유사

cha4_ocw.hwp

<B0A3C3DFB0E828C0DBBEF7292E687770>

Microsoft PowerPoint - MDA DA pptx


연속형 자료분석 R commander 예제

<4D F736F F F696E74202D20C0D3BBF3BFACB1B8BFA120C7CABFE4C7D120C5EBB0E820BAD0BCAE F >

슬라이드 1

제 4 장회귀분석

<4D F736F F F696E74202D20342E20B1E8C1F6C7FC28BFACB1B8C0DAB8A620C0A7C7D120B1D7B7A1C7C120B1D7B8AEB1E2292E >

14-X25-JSJ.hwp

DBPIA-NURIMEDIA

고객관계를 리드하는 서비스 리더십 전략

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

의학연구자료의 생존분석

중심경향치 (measure of central tendency) 대표값이란용어이외에자료의중심값또는중심위치의척도 (measure of central location) 라고도함. 예 : 평균 (mean= 산술평균 ; arithmetic mean), 절사평균 (trimmed

methods.hwp

Microsoft Word - SAS_Data Manipulate.docx

(Exposure) Exposure (Exposure Assesment) EMF Unknown to mechanism Health Effect (Effect) Unknown to mechanism Behavior pattern (Micro- Environment) Re

Data Analysis SPSS 첫 시간 강의용

모수검정을위한가정 1 종속변수가양적변수이어야함 2 모집단분포가정규분포 3 등분산가정 (equal variance assumption) 이충족되어야함 error term or residual = 이들가정은약자로 NID (0, σ 2 ) 로표현 : Normally, Ind

슬라이드 1


<4D F736F F F696E74202D EBCADBAF1BDBABDC3BCB3C0C720C0D4C1F6BCB1C1A4205BC8A3C8AF20B8F0B5E55D>

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

Microsoft PowerPoint - MDA DA pptx

슬라이드 1


동아시아국가들의실질환율, 순수출및 경제성장간의상호관계비교연구 : 시계열및패널자료인과관계분석

이다. 즉 μ μ μ : 가아니다. 이러한검정을하기위하여분산분석은다음과같은가정을두고있다. 분산분석의가정 (1) r개모집단분포는모두정규분포를이루고있다. (2) r개모집단의평균은다를수있으나분산은모두같다. (3) r개모집단에서추출한표본은서로독립적이다. 분산분석은집단을구분하는

歯ki 조준모.hwp

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

Microsoft PowerPoint - SPSS14_모듈별 구성소개

가능한연구가설제시 가설 1 : 지지후보의선택은유권자의나이에따라차이가있을것이다. 유권자의나이는지지후보의선택에영향을미칠것이다. 유권자의나이에따라지지후보는다를것이다. 가설 2 : 유권자의사회생활만족도는지지후보의선택에영향을미칠것이다. 지지후보의선택은유권자의사회생활만족도에따라차

한국성인에서초기황반변성질환과 연관된위험요인연구

cat_data3.PDF

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

한국정책학회학회보

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

PPT Template

<33302DB9DABAB4C8A32E687770>

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt

표본재추출(resampling) 방법

PowerPoint 프레젠테이션

Resampling Methods


untitled

Microsoft PowerPoint - ANOVA pptx

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

행정학석사학위논문 사회에대한공정성인식도가 행복에미치는영향 서울시주민을중심으로 년 월 서울대학교대학원 행정학과행정학전공 정영아

untitled

* ** *** ****


Jkafm093.hwp


2011년 제 9회 최우수상.hwp

기술통계

Transcription:

7. 평균치비교 1

두집단간평균차이검정 2

연속형변수 Interval scale( 간격척도 ) : 20 C, 30 C,, 변수간의가감가능 Ratio scale( 비척도 ) : 12, 13세, 변수간의가감승제모두가능 범주형자료로변환하여다양한분석가능 ( 연령 10 대, 20 대, 30 대.) 3

범주형자료의기술 분할표 (Contingency table) : 범주형자료를각변수별값의 결합에따라도수형식으로정리한표 (4X3 table) Cancer type Blood type Gastric cancer Liver cancer Pancreatic cancer A 13 25 26 B 28 20 19 O 42 44 35 AB 17 11 20 - 차원 (Dimension) : 분할표에있는변수의수 : 2차원 (Blood type, Cancer type) - 수준 (Level) : 각변수가취하는범주의수 : Blood type(4수준 ), Cancer type(3수준 ) 4

연속형자료의기술 대표값 : 평균 (mean), 중앙값또는중위수 (median) 등 산포도 : 분산 (Variance), 표준편차 (Standard deviation), 범위 (Range) 등 구분 고혈압여부 환자정상 P-value 연령 67.0±21.0 65.3±18.2 혈중콜레스테롤 253±36.0 225.3±28.2 5

모수검정 or 비모수검정 비모수검정적용 : 수집한자료가명백하게정규분포를따르지않는경우 표본수가너무작아분포를알수없는경우 한집단의표본수가 10 전후혹은두집단표본수의합이 20 전후일때 자료의관측척도가연속변수가아니라명칭척도혹은순위척도일때 6

비모수적방법 자료의 ( 정규성 ) 분포가정을하지않는다 편하다. 자료의평균과분산이아닌순위를이용한방법을사용한다. outlier 에둔감 7

모수검정과비모수검정의차이 적용자료 모수검정 양적변수 ( 연속변수 ) 자료가정규분포하는경우 표본수가큰경우 비모수검정 질적변수 ( 명목척도또는순위척도 ) 명백히정규분포하지않는양적변수 표본수가적은경우 ( 각집단의표본수가 10 이하 ) 장점 정보의손실이없음 모집단의분포에관한가정이불필요 적용절차가간단 통계적오류의가능성이낮음실측치보다순위적용 - 측정오차에덜민감 대부분의모수검정기법해당하는다양한기법이개발되어있음 단점 적용절차가다소복잡 통계적가정을무시하고적용시분석결과의오류가능성이높음 일부정보의손실 표본의크기가크면비효율적모수적조건을만족하는경우검정력이감소 8

모수또는비모수검정선택 자료의정규성이다소의심되더라도표본이큰경우 ( 절대적인기준은없으나각집단의표본수가 30~100 이상 ] 모수검정기법을적용하여도큰무리는없음 중심극한정리 각집단에서의표본수가 10 이하인경우는비모수검정기법을적용하는것이원칙임 각집단에서의표본수가약 10~30 이라면반드시정규성검정결과에따라선택 9

변수 (Variable) 분류방법변수명칭종류통계량 명목척도 성별, 지역 빈도, 백분율 ( 확인, 구분 ) 측정방법 서열척도등간척도 학력, 석차온도, 주가지수 빈도, 백분율 ( 순위비교 ) 평균, 표준편차 ( 간격 / 정도비교 ) 비척도 강도, 길이, 무게 평균, 표준편차 ( 절대크기비교 ) 종속변수 ( 특성값, 반응변수 ) 독립변수에대한반응으로서측정 되거나관찰이된변수 기능적 관 계 독립변수 ( 인자, 설명변수 ) 종속변수를관찰하기위해서조작, 측정되거나선택되어진변수. 다른변수에영향을줄수있는변수 10

변수 (Variables) 수량적변수 이산변수 (discrete variable) 한측정치와다른측정치간에중간값이존재할수없는변수 명목척도 (nominal scale), 순위척도 (ordinal scale) 예 ) 사망자수, 성별, 교통사고건수 연속변수 (continuous variable) 두개의측정치간에이론적으로무수한중간값존재 간격척도 (interval scale), 비척도 (ratio scale) 예 ) 혈압, 체중, 체온 11

방향성 독립변수 (independent variable) 어떤변수가다른변수의측정치에영향을준다고생각될때, 또는실제로한변수가다른변수의원인이되는경우, 후자의변수에대해전자의변수를독립변수또는예측변수 (predictor variable) 라한다. 예 ) 식사량과비만, 연령과혈압 종속변수 (dependent variable) 독립변수에의해영향을받는변수, 원인이되는변수에의해결과로관찰되는변수 예 ) 혈압, 체중, 체온 12

통계분석법의올바른적용 상황 바른통계분석법선택의포인트 1. 관찰된변수의척도는? 2. 검정하고자하는통계량은무엇인가? 3. 표본의크기는충분한가?, 분포는? 4. 비교표본의수는? 2개인가?, 3개이상인가? 5. 비교대상표본은서로독립적인가? 6. 비교하고자하는속성간에서로관련이 있는가? 7. 위험도추정이요구되는가? 8. 원인 ( 독립 )-결과( 종속 ) 가 1:1의관계인가? 9. 결과 ( 종속 ) 변수가연속변수인가? 10. 결과 ( 종속 ) 변수가이분변수인가? 1. 질적 ( 범주형 ) vs. 양적 ( 연속 ) 2. 평균치 vs. 분포 ( 비율 ) 3. 모수분석 vs. 비모수분석 4. t-test vs. ANOVA 5. Student t-test vs. paired t-test 6. 상관 ( 회귀 ) 분석 7. RR, OR (95% CI) 8. 단변량분석 vs. 다변량분석 9. 선형회귀분석 10. 로지스틱회귀분석 13

목적 ( 상황 ) 에따른통계검정적용 분석목적 2 군간비교 3 군간비교 2 군간 Pair ( 짝, 쌍 ) 비교 상관분석 영향요인분석 비척도 ( 연속자료, 값 ) t- 검정 (Student t-test) 분산분석 (ANOVA, F-test) 대응표본 t- 검정 (paired t-test) Pearson 상관분석 단순선형회귀분석 (Simple linear regression) 다중선형회귀분석 (Multiple linear regression) 명칭척도 ( 범주형자료, 율 [%]) 카이제곱검정 ( 교차분석 ) χ 2 -test (Pearson) χ 2 -test for trend( 경향성분석 ) 피셔직접확률법 ( 피셔의정확검정법 ) (Fisher's exact test) McNemar's test 단순로지스틱회귀분석 (Simple logistic regression) 다중로지스틱회귀분석 (Multiple logistic regression) 14

자료와분석목적에따른모수법과이에대응하는비모수법 모수법 (Parametric) 비모수법 (Nonparametric) 두개의독립된평균치 짝을이루는표본평균 Student s t-test Paired t-test Mann-Whitney(U) test Wilcoxon rank sum test Wilcoxon signed-rank test 3 개이상의평균치 one way ANOVA Kruskal-Wallis test 상관분석 Pearson 상관분석 Spearman 순위상관분석 15

분석전략틀 1 특성분석목적 ( 비교대상 ) 분석법 분포 2 군간 대상자의성 / 연령군 (-49/50-59/60-) 별분포일반적 / 주요특성에대한일원 ( 전체 ) 빈도분포표주요특성의성 / 연령군별빈도분포표고혈압 / 정상군의질병인지도 ( 점수 ) 차이고혈압 / 정상군의정기치료율 (%) 차이합병증여부 (1,0) 에따른치료이행도 ( 평점 ) 차이남 / 여의행복지수차이교육전후의인지도차이사업전후의검진율 (%) 차이 chi-square Summary statistics chi-square t-test chi-square, 위험도 (RR, OR) t-test t-test paired t-test chi-square, McNemar 16

분석전략틀 2 특성분석목적 ( 비교대상 ) 분석법 3 군간 상관 회귀 ( 영향요인 ) 정상 / 전기고혈압 / 고혈압군의비만 / 과체중동반율 (%) 차이 정상 / 전기고혈압 / 고혈압군의검진수검율 (%) 차이 고혈압 / 당뇨 / 양자 (both) 의행복지수비교 정상 / 전기고혈압 / 고혈압군의평균콜레스테롤치차이 인지도점수와실천도점수의상호관계? 순위척도와혈압의상관? 인지혈압군과실제측정혈압군은얼마나일치하는가? 첫번째와두번째응답 (%) 은얼마나일치하는가? 어떤요인들이이행도 ( 점수 ) 에영향을미치는가? ( 어떤요인들을개선하면이행도를개선시킬수있겠는가?) 어떤요인들이수검여부 (1,0) 에영향을미치는가? ( 어떤요인들을개선하면수검율을향상시킬수있겠는가?) chi-square, 위험도경향성분석, 위험도 ANOVA ANOVA 피어슨상관계수스피어만상관계수일치도 (kappa) 다중선형회귀분석다중로지스틱회귀분석 17

검정기법의종류와적용예 독립변수 ( 비교 group) 종속변수 ( 반응변수 ) 흔히적용되는통계적기법 모수검정비모수검정 * 환자군 / 대조군 (2 집단 ) 혈당측정치 ( 비척도 ) Student t-test Mann-Whitney U test Wilcoxon rank sum test 치료전 / 치료후 ( 짝을이룬자료 ) 혈당측정치 ( 비척도 ) paired t-test Wilcoxon signed rank test 대조군 /A 치료군 /B 치료군 (3 집단이상 ) 혈당측정치 ( 비척도 ) ANOVA test with multiple comparisons Kruskal-Wallis test 치료전 / 치료 2 주 / 치료 4 주후 (3 회이상반복측정 ) 혈색소치 ( 비척도 ) repeated measures ANOVA Friedman test 18

검정기법의종류와적용예 독립변수 ( 비교 group) 종속변수 ( 반응변수 ) 흔히적용되는통계적기법 모수검정 비모수검정 * 저소득층 / 중산층 / 고소득층 (2 집단이상 ) 보건소서비스에대한만족여부 ( 명칭척도 ) chi-squared test / Fisher's exact test/ Monte Carlo Test 정상 / 중등도비만 / 비만군 ( 순위척도, 3 구간이상 ) 당뇨발생여부 ( 명칭척도 ) chi-squared test / Score for trend test Mantel-Haenzel test 19

검정기법의종류와적용예 독립변수 ( 비교 group) 종속변수 ( 반응변수 ) 흔히적용되는통계적기법 모수검정비모수검정 * 종속관계가명확하거나예측의필요한연속변수의상관관계예 ) 임신기간 (gestational age) 과출생시체중, B, C, D 등의관련성 종속관계가불명확한두연속변수의상관관계예 ) 일일평균흡연량과알콜 Simple (multiple) linear regression analysis Pearson correlation analysis Spearman correlation analysis 치료군 / 비치료군 (2 집단이상 ) 생존여부 + 생존기간 ( 명칭척도 )( 비척도 ) survival data analysis 다양한위험요인 ( 성, 연령, 흡연여부등 ) 암발생여부 ( 명칭척도 ) multiple logistic regression analysis 20

비연속변수의분석 1 Two-by-two table 2 Two-by-k table 3 R-by-C table 4 Stratified table : Fisher's exact test, Pearson's chi-square test, chi-square test with Yate's correction, unadjusted likelihood ratio test relative risk or odds ratio, confidence limits phi coefficient, : global chi-square test, score test for trend, unadjusted likelihood ratio test for trend : Pearson's chi-square test, score test for trend, ridit analysis Cramer's V, gamma ststistic, Kendall's Tau-b, Stuart's Tau-c, Spearman's rank correlation : Breslow-Day test for homogeneity, adjusted global test, adjusted score test for trend, adjusted likelihood ratio test, adjusted likelihood ratio test for trend adjusted relative risk (Mantel-Haenszel or logit estimator), confidence limits 5 Multivariate Analysis : Multiple logistic regression, log-linear regression, polychotomous logistic regression conditional logistic regression 21