분산분석.pages

Similar documents
Microsoft PowerPoint - IPYYUIHNPGFU

nonpara6.PDF

이다. 즉 μ μ μ : 가아니다. 이러한검정을하기위하여분산분석은다음과같은가정을두고있다. 분산분석의가정 (1) r개모집단분포는모두정규분포를이루고있다. (2) r개모집단의평균은다를수있으나분산은모두같다. (3) r개모집단에서추출한표본은서로독립적이다. 분산분석은집단을구분하는

Microsoft PowerPoint - ANOVA pptx

Microsoft Word - sbe_anova.docx

ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행

고객관계를 리드하는 서비스 리더십 전략

Microsoft Word - sbe13_anova.docx

PPT Template

Microsoft Word - SBE2012_anova.docx

Microsoft Word - Chapter9.doc

G Power

PPT Template

슬라이드 1

statistics

R t-..

제 1 절 two way ANOVA 제1절 1 two way ANOVA 두 요인(factor)의 각 요인의 평균비교와 교호작용(interaction)을 검정하는 것을 이 원배치 분산분석(two way ANalysis Of VAriance; two way ANOVA)이라

abstract.dvi

hwp

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

Chapter 7 분산분석

( )실험계획법-머리말 ok

자료의 이해 및 분석

PowerPoint 프레젠테이션

(001~006)개념RPM3-2(부속)

Chapter 7 분산분석

메타분석: 통계적 방법의 기초

<B0A3C3DFB0E828C0DBBEF7292E687770>

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

Microsoft PowerPoint - MDA DA pptx

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

<4D F736F F F696E74202D20C1A63132C0E520C0CCBFF8BAD0BBEABAD0BCAE205BC8A3C8AF20B8F0B5E55D>

모수검정과비모수검정 제 6 강 지리통계학

Chapter 7 분산분석

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

nonpara1.PDF

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

Resampling Methods

국가기술자격 재위탁 효율성 평가

동아시아국가들의실질환율, 순수출및 경제성장간의상호관계비교연구 : 시계열및패널자료인과관계분석

Microsoft PowerPoint - SBE univariate5.pptx

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

조사연구 aim of this study is to find main cause of the forecasting error and bias of telephone survey. We use the telephone survey paradata released by N

수도권과비수도권근로자의임금격차에영향을미치는 집적경제의미시적메커니즘에관한실증연구 I. 서론

표본재추출(resampling) 방법

10. ..

DBPIA-NURIMEDIA

시스템경영과 구조방정식모형분석

PowerPoint 프레젠테이션

Microsoft Word - SPSS_MDA_Ch6.doc

임정연 이영민 1) 주저자, 숙명여자대학교인력개발정책학박사과정, 2) 교신저자, 숙명여자대학교여성 HRD 대학원부교수,

한국정책학회학회보

슬라이드 1



제 3 장평활법 지수평활법 (exponential smoothing) 최근자료에더큰가중값, 과거로갈수록가중값을지수적으로줄여나가는방법 시스템에변화가있을경우변화에쉽게대처가능 계산이쉽고많은자료의저장이필요없다 예측이주목적단순지수평활법, 이중지수평활법, 삼중지수평활법, Wint

저작자표시 - 비영리 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 이차적저작물을작성할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

슬라이드 1

<C5EBB0E8C0FBB0A1BCB3B0CBC1F5C0C7C0FDC2F7BFCDB9AEC1A6C1A1B1D7B8AEB0EDB4EBBEC E687770>

슬라이드 제목 없음

선형모형_LM.pdf

제 4 장회귀분석


중심경향치 (measure of central tendency) 대표값이란용어이외에자료의중심값또는중심위치의척도 (measure of central location) 라고도함. 예 : 평균 (mean= 산술평균 ; arithmetic mean), 절사평균 (trimmed

- 1 -

歯MW-1000AP_Manual_Kor_HJS.PDF

슬라이드 1

슬라이드 1

methods.hwp

슬라이드 1

부문별 에너지원 수요의 변동특성 및 공통변동에 미치는 거시적 요인들의 영향력 분석

Microsoft Word - skku_TS2.docx

Microsoft PowerPoint - Info R(3) pptx

2011년 제 9회 최우수상.hwp

목차 제1절서론 1 1. 연구배경및목적 1 2. 이론적고찰 2 3. 연구내용및방법 10 제 2 절인구이동의요인분석 전국총이동규모의변동요인 지역별인구이동요인분석 22 제 3 절결론 요약 연구의한계 42 < 부록 > 45

3 장기술통계 : 수치척도 Part B 분포형태, 상대적위치, 극단값 탐색적자료분석 두변수간의관련성측정 가중평균과그룹화자료

공기업정책학석사학위논문 직무순환제도가 직무만족에미치는영향 조직공정성의조절효과를중심으로 년 월 서울대학교행정대학원 공기업정책학과 오석주

가능한연구가설제시 가설 1 : 지지후보의선택은유권자의나이에따라차이가있을것이다. 유권자의나이는지지후보의선택에영향을미칠것이다. 유권자의나이에따라지지후보는다를것이다. 가설 2 : 유권자의사회생활만족도는지지후보의선택에영향을미칠것이다. 지지후보의선택은유권자의사회생활만족도에따라차

제장 2 비모수 검정(NONPARAMETRIC ANALYSIS) ③ 연구자는 SPSS 출력결과에서 유의확률을 확인하여 귀무가설(H0 )의 기각, 채택 여부를 결정한다. 예를 들어 연구자가 연구자료의 정규성을 검정하기 위하여 유 의수준을 α = 0.05로 설정하고 SPS


2156년올림픽 100미터육상경기에서여성의우승기록이남성의기록보다빠른첫해로남을수있음 2156년올림픽에서 100m 우승기록은남성의경우 8.098초, 여성은 8.079초로예측 통계적오차 ( 예측구간 ) 를고려하면빠르면 2064년, 늦어도 2788년에는그렇게될것이라고주장 유사

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

... —... ..—


텀블러514

untitled

True number of clusters = 3 V V1 2 군집의수선택 2.1 군집내와군집간제곱합이용 군집분석은각군집의평균의차이를크게하고 ( 군집간의변동을크게하고 ) 군집내의변동을작게하는 것이좋다. 군집의개수가늘어날수록커지고

Microsoft PowerPoint - LM 2014s_Ch4.pptx

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt

PowerPoint 프레젠테이션

642 또한통계적유의성은실제적유의성과더불어검토되어야할문제이므로통계적유의성만의지나친집착과확대해석은바람직하지않으며, 통계적유의성이검출되지않은연구결과도때로는그자체로휼륭한의미를지닐수있다는점과추후연구에기여할수있다는점에서발표될수있어야할것이다 [6]. 여기에서실제적유의성이란실제적인

데이터마이닝 제 1강

Microsoft Word - ch2_smoothing.doc

Microsoft Word - Chapter6.doc

DBPIA-NURIMEDIA


Communications of the Korean Statistical Society Vol. 15, No. 4, 2008, pp 국소적 강력 단위근 검정 최보승1), 우진욱2), 박유성3) 요약 시계열 자료를 분석할 때, 시계열 자료가 가지고 있는

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

Microsoft Word - EDA_Univariate.docx

Transcription:

예제데이터 R. A. Fisher (1919 영국통계학자, 생물학자, 수학자 - 분산분석창시자 iris 분꽃데이터 - 3 개종, 4 개변수관측데이터 - sepal 꽃받침 ( 길이, 넓이 - petal 꽃잎 ( 길이, 넓이 분산개념정의 변수의데이터흩어짐의척도이다. (x s i x = n 1 활용 변동계수 Coefficient of Variation CV - CV = s x 표준편차를평균으로나눈값으로축정단위가다른데이 터의흩어짐 ( 반대꾸준함 비교할때사용 : > sd(iris$sepal.length/mean(iris$sepal.length 0.1417113 품질 - 분산의역수 의사결정 - 위험, 분산이클수록위럼이높음 분산분석이란 데이터가움직인공간에대한척도, 관측값이큰개체, 작은개체, 개체들간변수관측값왜이렇게변동이있나? 이변동을어떻게설명할수없을까? 꽃받침의길이의변동을설명하는방법? 1 품종에따라 ( 범주형, 정성적 받침의길이는달라지지않을까? - 분산분석 꿏받침넓이에따라 ( 측정형, 정량적 달라지지않을까? - 회귀분석 Y (length = α + βx(width + e 한남대학교권세혁교수 http://wolfpack.hnu.ac.kr 1/ 7 Page

품종에따른받침받침길이차이? 품종에따른꽃받침의길이차이가있는지어떻게증명할까? 각품종의평균이유의적으로다르면품종이꽃받침을값의변동을설명할수있을것이다. µ 1,µ,µ 3 통계적으로증명하려면모수형태로 - 이각각다름을검정하면된다. 폼종이 개이면서로독립인 집단모평균차이 t- 검정을실시하면된다. 품종이 3개이므로 3개의귀무가설 ( H 0 : µ 1 = µ ( H 0 : µ 1 = µ 3 ( H 0 : µ = µ 3 동시에하면된다. 3개가 설을유의수준 5% 에서동시에하게되면, 1 (1 α 3 = 0.14, 즉 14% 가유의수준이다. 일원 ( 요인 1 개 분산분석모형 : One Way ANOVA Model 데이터구조 수준 1 수준 수준 k 행합 y11 y1 y1k y1. y1 y yk y. yn11 yn ynkk ynk. y.1 y. y.k y1. 한남대학교권세혁교수 http://wolfpack.hnu.ac.kr / 7 Page

모형 model : y ij = µ + α i + e ij, ( 가정 e ij ~ (0,σ 기호 : i = 1,,...,k ( 집단의개수 j = 1,,...,n i ( 집단 i 반복크기, n= 총데이터개수 Y ij : 종속변수, 반응변수 response variable - 범주형변수 ( 집단 를이용하여변동을설명하고픈변수 요인 factor : 범주형집단변수, 실험설계에서는처리효과 treatment effect µ i µ =i 모집단평균 = 전체모집단평균 y ij 의관측값의변동은집단의 평균 ( 집단에의해설명되는부분 과 오차 ( 랜덤 부분으로나뉜다. 만약집단의평균의차이 ( µ i = µ + α i 가유의적인차이가있다면집단이종속변수의변동을잘설명함 MVUE 추정 : ˆµ = y.., ˆµ i = y i. 변동분해 1 총변동 total sum of squares SST 종속변수의변동 SST = (y ij - 검은색화살표 y.. (y ij + y i. 집단간변동 between SS, SSB 요인변동이라고도하며총변동중요인의집단 ( 수준 에의해설명되는변동 y 1. y. y 3. SSB = (y i. - 주황색화살표 y 3 3 집단내변동 within SS, SSW 오차변동이라고도하며, 총변동중요인이설명하지못하는변동 SSE = (y ij - 파랑색화살표 한남대학교권세혁교수 http://wolfpack.hnu.ac.kr 3/ 7 Page

3 번째집단, 번째관측값 y3 전체평균으로부터관측값이벗어난변동중집단 3 의평균에의해설명되는부분 ( 주황색 까지는설명이되나, 나머지변동 ( 파랑색 은설명하지못함 y 3 y 3. y. 평균변동 Mean Sum of Squares y.. y 1. 변동 (Sum of Squares 값을자유도로나눈값 : 변동의평균적개념, n= 총관측값개수, k= 집단의개수 집단간평균변동 MSB(Mean SSE = SSB/(k-1 집단내평균변동 MSE(Mean SSW = SSE/(n-k 변동의분포오차의가정 : e ij ~ (0,σ -> y ij ~ (µ i,σ SSB (y i. = ~ χ (n k σ σ / SSE (y ij = ~ χ (n 1 σ σ 평균변동기대값 MSE 기대값 MSB 기대값 EMSE = E( EMSB = E( (y ij = σ (n k (y i. n = σ i (µ i µ + (k 1 k 1 EMSB 그러므로집단간평균의차이가없다면, 차이가유의적이면 1보다많이커진다. EMSE = 1 한남대학교권세혁교수 http://wolfpack.hnu.ac.kr 4/ 7 Page

분산분석표 ANOVA analysis of variance table - F 검정 요인 변동합 자유도 평균변동 F-통계량 집단간 ( 품종 SSB k-1 MSB=SSB/(k-1 MSB/MSE~F 오차 SSE, SSW n-k MSE=SSE/(n-k 총변동 SST=SSB+SSE n-1 귀무가설 : 집단의평균은동일하다. µ 1 = µ =... = µ k, 혹은 α 1 = α =... = α k ( 귀무가설이맞다면 F- 통계량은 1 이다 대립가설 : 적어도하나의집단평균은다르다. <=> 모든집단평균이동일한것은아니다 사후검정 Post Hoc Test 다중비교 Multiple Comparison 데이터분석전에설정된가설에대한검정이아니라분산분석의 F- 검정에관계없이집단간평균의차이가있는지검정함 여러개가설 ( 집단간차이, 집단의수가 k개이면 c = k C 개개별가설필요 을동시에검정하면실제유의수준 5% 가아니라높아진다. 조정된실험유의수준 (controlled experimental error rate 이라하고 1 (1 α 이다 c Fisher s Least Significant Difference 두집단별평균비교검정에사용하나이는다중비교에해당되지는않는다. 두모집단평균차이검정에서통합분산 (pooled variance 대신 MSE 사용한다. LSD = t α / (n k MSE( n 1 i + n 1 j for (y i. y j. Tukey HSD(honestly significant difference procedure HSD = q( MSE( n 1, q에대한분포표제공 i + n 1 j 가장보수적인 ( 귀무가설기각하지않음 방법으로자연과학에서가장많이이용한다. Student-Newman-Keuls procedure Tukey 방법의변형한것으로표만다르다. 즉임계치 (critical value 만차이가있고방법은 Tukey 와동일하다. Duncan Multiple range test Tukey 방법과매우유사하나수준별표본평균을크기순으로나열하여차이가가장큰것을비교해가면서 r 1 (1 α 유의수준을으로조정해가면서검정한다. r은검정단계순서이다. 귀무가설을기각할확률이매우높아자주사용하지않는다. 한남대학교권세혁교수 http://wolfpack.hnu.ac.kr 5/ 7 Page

Scheffe s S method 대비 (contrast 까지고려하여유의수준을고려한다중비교방법으로 (Tukey >Scheffe > Duncan 순으로보수적 사회과학분야에서주로사용 대비 Q = c i µ i, c i = 0 -> 추정치 ˆQ = ci y i., 평균 E( ˆQ = c i µ i, 분산 V( ˆQ σ = c i n i 대비의신뢰구간 ˆQ ± c i MSE F(1,n k ni Dunnett s procedure 처리효과의수준하나가 control ( 실험집단 인경우 ( 예 : placebo 집단, 교육을하지않는집단, 이전약투여집단 이집단과다른집단들을 pairwise 비교할경우사용된다. IN R : IRIS.csv 데이터 이상치가있음 (virginica 종에있음 - 107 번째, 다시이상치존재 - 13 번째, 이를삭제하면 TukeyHSD(iris.aov by(iris$sepal.length,iris$species,sd by(iris$sepal.length,iris$species,mean diff lwr upr p adj versicolor-setosa 0.930 0.694 1.165 0 virginica-setosa 1.61 1.38 1.859 0 virginica-versicolor 0.691 0.45 0.99 0 한남대학교권세혁교수 http://wolfpack.hnu.ac.kr 6/ 7 Page

요인변동합자유도평균변동 F- 통계량 집단간 ( 품종 64.7 3.5 130.8 오차 3.5 145 0.5 (<0.001 총변동 97. 147 품종 평균 (M 표준편차 (SD versicolor (a 5.01 0.35 setosa (b 5.94 0.5 virginica (c 6.63 0.60 분산분석 (F=130.8, 유의확률 <0.001 결과품종간꽃받침길이는차이가있음 Tukey HSD 검정결과쌍체집단의차이는모두유의하여 Virginia 꽃받침길이가가장길고 versicolor 종의길기가가장짧다. 다중비교결과는평균표에알파벳으로표시, 동일알파벳이면유의적차이가없음 Case Study I : ear_infection.csv Keller 9th Managerial Statistics 아이들의귀염증을치료하는방법은 (1 염증제거수술 ( Surfafurazole 약처방 (3 플라시보 placebo 3 가지가있다. 병의치료가효과가있는지다음으로판단한다. a 아픈증상나타난회수 (number of episodes of the illness b 재발로인한소아과의사방문회수 (visits c 처방전회수 (prescription d 호흡기염증지속기간 (days 어떤치료방법이가장효과적인지분석하시오. Case Study II : Jobs.csv Keller 9th Managerial Statistics 성별, 학력 (E1= 고졸미만,E= 고졸, E3= 대학수료 E4= 대졸 에따른직장의수에차이가있는지 (37 세 ~45 세 분석하시오. 일단개별변인으로판단하시오. Case Study III : bank.csv Keller 9th Managerial Statistics 여성 CEO 에대한차별분석에서 (1 승인률은차이가없었고 ( 이자율에서는남성 CEO 에비해높아, 차별이있다고분석되었다. 그러나은행은이자율을결정할때는대출신청기업의기업형태를보고결정한다고했다. 이를알아보기위한분석을실시하시오. Business 종류 1= 개인, = 파트너쉽, 3= 주식회사 한남대학교권세혁교수 http://wolfpack.hnu.ac.kr 7/ 7 Page