모수검정과비모수검정 제 6 강 지리통계학

Similar documents
G Power

슬라이드 1

자료의 이해 및 분석

R t-..

statistics

ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

(001~006)개념RPM3-2(부속)

이다. 즉 μ μ μ : 가아니다. 이러한검정을하기위하여분산분석은다음과같은가정을두고있다. 분산분석의가정 (1) r개모집단분포는모두정규분포를이루고있다. (2) r개모집단의평균은다를수있으나분산은모두같다. (3) r개모집단에서추출한표본은서로독립적이다. 분산분석은집단을구분하는

자료의 이해 및 분석

고객관계를 리드하는 서비스 리더십 전략

제장 2 비모수 검정(NONPARAMETRIC ANALYSIS) ③ 연구자는 SPSS 출력결과에서 유의확률을 확인하여 귀무가설(H0 )의 기각, 채택 여부를 결정한다. 예를 들어 연구자가 연구자료의 정규성을 검정하기 위하여 유 의수준을 α = 0.05로 설정하고 SPS

Microsoft PowerPoint - IPYYUIHNPGFU

10. ..

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

2011년 제 9회 최우수상.hwp

Microsoft PowerPoint - SBE univariate5.pptx

PowerPoint 프레젠테이션

Microsoft Word - Chapter9.doc

중심경향치 (measure of central tendency) 대표값이란용어이외에자료의중심값또는중심위치의척도 (measure of central location) 라고도함. 예 : 평균 (mean= 산술평균 ; arithmetic mean), 절사평균 (trimmed

(3) 추론에서계산이모수적방법보다훨씬단순. (4) 사용자가이의논리를스스로발견하게하며이해하기쉬움. (5) 표본이정규분포를따를때에도검정력에큰손실이없으며, 정규분포와상이한경우에이의검정력은정규분포에의한방법보다크다. 3. 부호검정 (Sg test) 모집단의중앙값에대한검정으로관찰

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

가능한연구가설제시 가설 1 : 지지후보의선택은유권자의나이에따라차이가있을것이다. 유권자의나이는지지후보의선택에영향을미칠것이다. 유권자의나이에따라지지후보는다를것이다. 가설 2 : 유권자의사회생활만족도는지지후보의선택에영향을미칠것이다. 지지후보의선택은유권자의사회생활만족도에따라차

3 장기술통계 : 수치척도 Part B 분포형태, 상대적위치, 극단값 탐색적자료분석 두변수간의관련성측정 가중평균과그룹화자료

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

Microsoft Word - EDA_Univariate.docx

PowerPoint 프레젠테이션

... —....—

제 8 장. 통계적추정 개요 : 통계적추정 ( 추론 ) 은모집단에서추출된표본의정보로모집단에대한값의추측또는그값에대한확신을결정하는과정이며다음의두단계가있다. 2 통계적추정 (statistical estimation): 모수인평균 ( m), 분산 ( s ), 표준편차 ( s

슬라이드 1

... —... ..—

nonpara1.PDF

22 장정규성검정과정규화변환 22.1 시각적방법 Q-Q 플롯과정규확률그림 Q-Q 플롯( 분위수- 분위수플롯, Quantile-Quantile plot) 은하나의자료셋이특정분포( 정규분 포나와이블분포등) 를따르는지또는두개의자료셋이같은모집단분포로부터나왔는지를

untitled

Microsoft PowerPoint - LN05 [호환 모드]

PowerPoint Presentation

<C5EBB0E8C0FBB0A1BCB3B0CBC1F5C0C7C0FDC2F7BFCDB9AEC1A6C1A1B1D7B8AEB0EDB4EBBEC E687770>

모수 θ의 추정량은 추출한 개의 표본값을 어떤 규칙에 의해 처리를 해서 모수의 값을 추정하는 방법입니다. 추정량에서 사용되는 규칙은 어떤 표본을 추출했냐에 따라 변하는 것이 아닌 고정된 규칙입니다. 예를 들어 우리의 관심 모수가 모집단의 평균이라고 하겠습니다. 즉 θ

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

하반기_표지

한국보건사회연구원통계학및계량경제학의기초및응용 강의노트 2017 년 4 월 5 월 통계학 : 통계적추론 (Statistical Inference) I. 들어가며 이제통계학에서가장중요한토픽이라고할수있는통계적추론에대해서본격적으로공부를해보도록하겠습니다. 통계적추론을통해연구와관

Microsoft Word - SAS_Data Manipulate.docx

untitled

LaTeX. [width=1em]Rlogo.jpg Sublime Text. ..

장연립방정식을풀기위한반복법 12.1 선형시스템 : Gauss-Seidel 12.2 비선형시스템 12.1 선형시스템 : Gauss-Seidel (1/10) 반복법은초기근을가정한후에더좋은근의값을추정하는체계적인절차를이용한다. G-S 방법은선형대수방정

모수검정을위한가정 1 종속변수가양적변수이어야함 2 모집단분포가정규분포 3 등분산가정 (equal variance assumption) 이충족되어야함 error term or residual = 이들가정은약자로 NID (0, σ 2 ) 로표현 : Normally, Ind

제 3 장평활법 지수평활법 (exponential smoothing) 최근자료에더큰가중값, 과거로갈수록가중값을지수적으로줄여나가는방법 시스템에변화가있을경우변화에쉽게대처가능 계산이쉽고많은자료의저장이필요없다 예측이주목적단순지수평활법, 이중지수평활법, 삼중지수평활법, Wint

통계자료분석강희모 2013 년 11 월 29 일

歯ki 조준모.hwp

시스템경영과 구조방정식모형분석

텀블러514

Chapter 분포와 도수분석

KOREAN J ANESTHESIOL 문에의학연구자들이비모수통계기법에대해접할수있는기회가모수통계기법에대해상대적으로적었기때문이라고생각된다. 따라서, 이번지면을통하여그동안잘다루어지지않았던비모수통계기법의개념을실례를들어소개하여비모수통계분석에대한이해를높이고자한다. 비모수통계분석의

<C1A4C3A5BAB8B0EDBCAD D325F32B1B32E687770>

Chapter 11 비모수 및 무분포통계학

수도권과비수도권근로자의임금격차에영향을미치는 집적경제의미시적메커니즘에관한실증연구 I. 서론

메타분석: 통계적 방법의 기초

제 1 절 two way ANOVA 제1절 1 two way ANOVA 두 요인(factor)의 각 요인의 평균비교와 교호작용(interaction)을 검정하는 것을 이 원배치 분산분석(two way ANalysis Of VAriance; two way ANOVA)이라

용역보고서

<3235B0AD20BCF6BFADC0C720B1D8C7D120C2FC20B0C5C1FE20322E687770>

목차 1. 통계학이란무엇인가? 2. 통계학의응용분야 3. 통계학의분야들 4. 강의소개 5. 그리고..

위에서 100 단위이상을줄기로하기로결정하였고자료의최소값이 58, 최대값이 1103 이므로 0 부터 11 까지줄기를한열에크기순으로적는다. 줄기 (stem) 옆에잎을그린다. 잎을그리는방법은간단하다. 줄기바로뒤의숫자를줄기옆에차례로적으면된다. CEO 연봉자료는잎이두자리이지만앞

<4D F736F F F696E74202D20BBF3B0FCBAD0BCAE5FC0CCB7D0B0ADC0C72E BC0D0B1E220C0FCBFEB5D>

Microsoft Word - Chapter6.doc

국가기술자격 재위탁 효율성 평가

통계분석가이드라인 통계 (Statisitcs) 란? Second Language in Science 전남대학교치의학전문대학원임회정 1 2 모집단 (Population) 과표본 (Sample) 통계분석단계 Sampling 추정 1. 귀무가설수립 2.

제 장확률의기초 같이정리할수있다.. n 30 일때크기 n 의표본이평균 µ, 표준편차 σ 를갖는모집단으로부터추출되었다면표본평균의표본분포는근사적으로정규분포를따른다.. 모집단이정규분포를따르면표본평균의표본분포는임의의표본크기에대하여정규분포를따른다. 즉, 중심극한정리는모집단이무슨

<4D F736F F F696E74202D2035BBF3C6F2C7FC5FBCF8BCF6B9B0C1FA2E BC8A3C8AF20B8F0B5E55D>

Microsoft PowerPoint - PDF3 SBE pptx

성신여자대학교_2차년도_계획서.hwp

슬라이드 제목 없음

Survey Analyst 2012 년하반기사회조사분석사 2 급필기 제 1 과목조사방법론 1 1. 다음중일반적으로가장높은응답률을확보할수있는조사방법은? 2. 다음중우편조사의특성과가장거리가먼것은? 3. 연구방법으로서의연역적접근법과귀납적접근법에관한설명으로틀린것은? 4. 참여

<B4EBC7D0BCF6C7D02DBBEFB0A2C7D4BCF62E687770>


PPT Template

13. 다차원척도법 (MultiDimensional Scaling) 13.1 개념및목적 다차원척도법 (mds) 는다차원관측값또는개체들간의거리 (distance) 또는비유사성 (dissimilarity) 을이용하여개체들을원래의차원보다낮은차원 ( 보통 2차원 ) 의공간상에

Getting Started

JAVA 프로그래밍실습 실습 1) 실습목표 - 메소드개념이해하기 - 매개변수이해하기 - 새메소드만들기 - Math 클래스의기존메소드이용하기 ( ) 문제 - 직사각형모양의땅이있다. 이땅의둘레, 면적과대각

슬라이드 1

마지막 변경일 2018년 5월 7일 ** 이항분포와 정규분포의 관계 ** Geogebra와 수학의 시각화 책의 3.2소절 내용임. 가장 최근 파일은 링크를 누르면 받아 보실 수 있습니다.

???? 1

Vector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표

<4D F736F F F696E74202D EBCADBAF1BDBABDC3BCB3C0C720C0D4C1F6BCB1C1A4205BC8A3C8AF20B8F0B5E55D>

<B1B3C0B0B0FAC1A45FC3E2B7C22E687770>

데이터정규성 이문서에서는이러한조건이실제로일원분산분석과어떤관계가있는지조사하고보조 도구에서해당조건을확인하기위한가이드라인을정한방법에대해설명합니다. 일원분산분석 2

PowerPoint 프레젠테이션

Microsoft Word - sbe_anova.docx

<B0A3C3DFB0E828C0DBBEF7292E687770>

7.3 Ampee 의주회법칙 Mwell 방정식 Ampee 의주회법칙 Ampee 의주회법칙은폐경로의주변을따른 의접선성분에대한선적분은폐경로에의해둘러싸이는순전류 enc 와같다. 즉 의회전은 enc 와같다. dl enc Ampee 의법칙의적분형 Ampee 의주회법칙유도 enc

..(..) (..) - statistics

<C1A4C3A5BAB8B0EDBCAD2D D30355F33B1B32E687770>

PowerPoint 프레젠테이션

확률과통계6

MINITAB 보조도구백서 이문서는 Minitab Statistical Software 의보조도구에서사용되는방법과데이터검사를 개발하기위해 Minitab 통계학자들이실시한연구에대해설명하는전체백서중하나입니다. 2- 표본 t- 검정 개요 2-표본 t-검정은 2개의독립적인집단

용역보고서

Microsoft PowerPoint - ANOVA pptx

OCW_C언어 기초

Precipitation prediction of numerical analysis for Mg-Al alloys

데이터마이닝 제 1강

Transcription:

모수검정과비모수검정 제 6 강 지리통계학

통계적추정의목적 연구자가주장하는연구가설을입증하기위한것 1 연구목적에맞는연구가설을설정 2 연구목적과수집된자료에부합되는적절한통계적검정방법을선택 3 귀무가설과연구가설 ( 대립가설 ) 을진술 4 유의수준을결정한후각분포유형에따라분포표를이용하여임계치를구하고기각역을설정 5 통계적검정유형에필요한통계량을각검정유형의공식을이용하여계산 6 임계치와통계량을비교하여귀무가설의기각과수용결정 7 연구결과를검정결과에따라밝힘.

모수적통계의전제조건 1 표본의모집단이정규분포를이루어야한다. 2 집단내의분산은같아야한다. 3 변인은등간척도나비율척도로측정되어야한다. à 이조건이충족되지않으면비모수통계를사용

모수검정방법의사용예 모평균과표본평균과의차이 -> z 분포, t 분포 표본평균간의차이 -> z 분포, t 분포 모분산과표본분산과의차의 -> F 분포, 카이제곱분포 표본분산간의차이 -> F 분포, 카이제곱분포

1. 모집단의평균에대한검정 표본집단이클경우 N(μ, δ 2 ), 이경우표본평균 X라고하면귀무가설과모집단평균과표본평균이같은것이된다. 표본집단크기가 n>30 이면정규분포로간주하여 Z 분포를이용한다. 표본집단이작거나모집단의표준편차를모를경우표본통계량의평균과표분편차 (s) 를이용하여통계량을산출. 표본이 30 이하면 t 분포사용, 이때자유도를고려함. Z = X - m s t = X - m s / n

2. 두모집단의평균의차에대한검정 1) 표본집단이클경우

2) 표본집단이작을경우 정규분포를이루지만모집단의분산을모르는경우표본의크기가작을때에는 t 검정을이용하여두표본평균간의차에대한유의성을검정 서로독립적인두모집단의표준편차가동일하다고가정하고, 이들이정규분포를이룬다는전제에서 t 값을도출

3) 동일표본집단의시계열평균에대한비교 한모집단에서시간간격을두고표본을추출한후기간동안에나타난평균의유의적인차이를검정하는경우

두집단의평균비교 Two-sample t-test vs. Paired t-test 9

질문 : 왜평균을비교할까? Þ 대표값질문 : 평균은항상자료들을대표하는값일까? Þ 정규분포일때에만 예. 정규분포가아닌경우 70, 74, 94, 112, 500. 평균 850/5=170. 평균은이상점의영향을받기때문에적절한대표값이될수없다. 중앙값 10

정규분포를하는자료 Þ 모수적검정 정규분포를하지않는자료 Þ 비모수적검정 모수적검정 비모수적검정 Two-sample t-test Þ Wilcoxon rank sum test (Mann-Whitney U test) Paired t-test Þ Wilcoxon signed rank test 11

Two-sample t-test 독립인두집단의평균비교가정 : 정규분포, 두집단의분산동일 비모수적검정 (Wilcoxon rank sum test), 변수변환 Smith-Satterthwaite test, 비모수적검정, 변수변환 12

t 검정 (t-test) 하나또는두집단의평균비교 13

t 검정 하나또는두개집단의평균을비교하는모수적검정법 (parametric test) 평균을비교 : 측정값들이정규분포를하여, 평균이그집단의대표값으로서의역할을하고있다는것을의미 이상점 (outlier) 이있는비정규분포자료는 t 검정의대상이아니다. 14

연속변수 : 구간척도또는비척도로측정된값 t 검정과 Wilcoxon 검정측정값들이정규분포를하는지여부에따라구분 t 분포 William Gosset(1876-1937), Student 라는필명 ( 익명 ) 으로논문을발표 Student t 분포 15

t 분포는 0 을중심으로좌우대칭 표준정규분포 (N(0, 1)) 보다두터운꼬리 분포의모양은자유도 (d.f., degree of freedom) 에따라달라지므로, 자유도가 t 분포의모수 (parameter) 표준정규분포와자유도 5 인 t 분포 자유도가커질수록꼬리가얇아지고중심부분이높아져, 자유도가무한대 ( ) 가되면, 표준정규분포와동일한모양 16

T 분포 : 두집단의평균에대한비교 한집단의평균과다른기준값을비교 다른기준값 - 다른연구결과에서나온값또는지금까지알려져온값 귀무가설 ( 모집단의평균이 μ 0 이다 ) 이옳을때, 자유도 n-1 인 t 분포 17

3. 모집단의분산에대한검정 100 년동안평균기온의표준편차와 15 년간측정한기온의표준편차가유의있게감소하였는지등을조사. 분산에대한가설검정방법에는두가지방법이존재 1 모집단의분산과표본분산을비교하여모집단의분산에대한가설을검정하는경우 2 두표본집단간의분산의차를통해두모집단간의분산의차가유의성이있는지검정하는경우

1) 모집단분산과표본분산을비교하는경우 분산의표본분포는언제나오른쪽꼬리가긴형태를보이며, 표본의크기가커질수록정규분포에가까운형태를이루는 X 2 카이자승 (chi square) 분포를나타낸다. 카이자승분포는자유도에따라분포의형태가바뀐다.

2) 두표본집단의분산의차에대한검정 두표본집단의분산의유의성을검정할경우 F 분포를사용. 분산이같고정규분포를이루는두모집단에서 n 1 과 n 2 의크기의표본을추출하여, 두표본으로부터계산한분산을각각 S 12, S 22 라고할때이두통계량의비를 F 통계량이라고한다. F 분포는 S 12, 의자유도 (n 1-1) 과 S 2 2 의자유도 (n 2-1) 에따라그모양이달라진다. 두개의분산값이비슷하면 1 에가까와진다.

비모수검정 모집단이정규분포한다는가정을할수없는경우 à 모집단의분포유형에관계없이적용할수있는방법 변수가명목척도나서열척도로측정하는경우 à 분류기준과분류방법의독립성검정가능 모집단의특성을나타내는모수에대한검정의목적이아닐경우 à 이론분포와경험분포간의적합도 (goodness of fit test) 를검정가능

비모수검정의종류

검정 기대빈도와관찰빈도와의부합정도, 차이를측정하며, 관찰빈도와기대빈도사이에차이가많이날수록값이커지며귀무가설을기각. 카이자승분포의자유도는표본의크기 (n) 이아니라범주의크기 (k) 에따라달라짐

분할표 (contingency table) 단일표본카이자승검정은모집단의분포와표본분포를비교하는데비해, 두표본간의카이자승검정은범주화된두표본집단간의분포의차이가표본오차에의한우연인지여부를통계적으로검정하는것. 기대빈도와자유도는표본집단이 2 개이상일경우분할표를이용. 분할표는자료를변수별속성별로구분하여그에대응하는관찰빈도를각칸에기록하여작성 자유도는각행과열의범주수에서 1 을뺀것을곱한값.

카이자승검정의제한점 자료변수가이산적이고독립적이며상호배타적이어야한다. 관찰빈도는절대적수치로만관찰되어야하며비율이나비례로나타나는상대적도수자료는적용할수없다. 관찰빈도분할수의칸수가 5 미만이거나, 각칸의기대빈도가운데어느하나라도 5 이상이아니면안된다.( 계급수가 5 이상, 기대빈도최소값 5 이상에만적합도검정이가능 ) 이조건을충족시키기위해변수를조정하여집단을합하는등의조정이필요

콜모고로프 - 스미르노프 (Kolomogorov-Smirnov) D 검정 단일표본검정 각셀의기대빈도 5 미만의경우에도사용가능하며, 연속적변수의확률분포에도적용 통계량 D 는표본의누적확률분포와가설로설정된누적확률분포와의최대차이를의미. D 가클수록귀무가설을기각

맨 - 휘트니 (Mann-Whitney) U 검정 두개의표본집단간의차이검정 정규분포의전제가불필요한비모수검정 표본의관측치가무작위로추출되고, 측정값을순위화하여야함. 등간척도자료를쉽게순위화할수있으므로 t- 검정의대안으로이용 소규모표본의경우에도이용할수있는장점

U 검정계속 U 검정의가장큰특징은 U 의통계치가 U 의임계치보다작아야귀무가설을기각할수있다는점.

크루스칼 - 월리스검정 (Kruskal- Wallis) H 검정 3개의표본집단이상 k (k 2) 에서그차이점에대한유의성을검정하는데이용등간척도나비율척도로측정한자료검정에도서열척도로바꾸어적용가능. 검정방법은각표본집단의측정값을집단이나표본크기에관계없이배열후크기순으로순위를정한다. 각변량에대한순위가정해지면각집단별로순위의평균치를구하고서로비교한다. H 검정은 K-1의자유도를가지며, 카이자승확률분포를이용하여유의수준과자유도에따른임계치를구한다. 사례수가 5 이하일경우 H 검정표를이용한다.

< 예제 14.11> 통계수업이 3 개반으로나뉘어진행 각반에서 10 명씩뽑아시험을치른점수 - 75 - 분반 1 분반 2 분반 3 점수순위점수순위점수순위 83 19 73 13.5 88 24 97 30 66 8 55 1 68 9.5 85 21 73 13.5 95 29 64 7 79 16 86 22 73 13.5 62 6 70 11 80 17 82 18 87 23 60 4 59 3 94 28 61 5 73 13.5 84 20 93 27 89 25 90 26 58 2 68 9.5 r 1 = 217.5 r 2 = 118 r 3 = 129.5 각반에속한학생들의학업성취도가같은가? n1 = n2 = n3 = 10, n = 30

H 의값 : 12 æ r r r ö h = + + - 3 + 1 n n n n n 2 2 2 1 2 3 ç + è 1 2 3 ø ( 1) 2 모든 n i ³ 5 이므로 c 분포를이용하면 ( n ) ( 217.5) ( 118) ( 129.5) 2 2 2 12 ìï üï = í + + ý - 3 31 = 7.65 30 31 îï 10 10 10 þï Þ h = 7.65 > 5.991 = c Þ 2 0.05 0 세반의학업성취도가같지않다고판단. H 를기각 - 76 -