PowerPoint 프레젠테이션

Similar documents
PowerPoint 프레젠테이션

PowerPoint 프레젠테이션

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

G Power

슬라이드 1

2156년올림픽 100미터육상경기에서여성의우승기록이남성의기록보다빠른첫해로남을수있음 2156년올림픽에서 100m 우승기록은남성의경우 8.098초, 여성은 8.079초로예측 통계적오차 ( 예측구간 ) 를고려하면빠르면 2064년, 늦어도 2788년에는그렇게될것이라고주장 유사

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

PowerPoint Presentation

Microsoft Word - SPSS_MDA_Ch6.doc

제 4 장회귀분석

Microsoft PowerPoint - Info R(3) pptx

R

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

<C0E5B7C1BBF328BEEEB8B0C0CCB5E9C0C729202D20C3D6C1BE2E687770>

슬라이드 1

자료의 이해 및 분석

제 1 절 two way ANOVA 제1절 1 two way ANOVA 두 요인(factor)의 각 요인의 평균비교와 교호작용(interaction)을 검정하는 것을 이 원배치 분산분석(two way ANalysis Of VAriance; two way ANOVA)이라

<4D F736F F F696E74202D20BBF3B0FCBAD0BCAE5FC0CCB7D0B0ADC0C72E BC0D0B1E220C0FCBFEB5D>

untitled

<B0A3C3DFB0E828C0DBBEF7292E687770>

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

(3) 추론에서계산이모수적방법보다훨씬단순. (4) 사용자가이의논리를스스로발견하게하며이해하기쉬움. (5) 표본이정규분포를따를때에도검정력에큰손실이없으며, 정규분포와상이한경우에이의검정력은정규분포에의한방법보다크다. 3. 부호검정 (Sg test) 모집단의중앙값에대한검정으로관찰

MATLAB for C/C++ Programmers

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

<4D F736F F D20C0C0BFEBB0E8B7AE20C1A B0AD202D20B0E8B7AEB0E6C1A6C7D E646F63>

Microsoft Word - ch2_simple.doc


... —... ..—


Microsoft PowerPoint - IPYYUIHNPGFU

<4D F736F F D20C0C0BFEBB0E8B7AE20C1A B0AD202D20B0E8B7AEB0E6C1A6C7D E646F63>

프로그래밍개론및실습 2015 년 2 학기프로그래밍개론및실습과목으로본내용은강의교재인생능출판사, 두근두근 C 언어수업, 천인국지음을발췌수정하였음

R t-..

Ⅰ. 1 Ⅱ. 1 Ⅲ. 1 Ⅳ. 3 Ⅴ. 3 Ⅵ. 4. ph 4 1). ph 4 2). ph 1. ph 16 1). ph 16 Ⅶ. 23 Ⅷ. 24 Ⅸ. 24


제 3 장평활법 지수평활법 (exponential smoothing) 최근자료에더큰가중값, 과거로갈수록가중값을지수적으로줄여나가는방법 시스템에변화가있을경우변화에쉽게대처가능 계산이쉽고많은자료의저장이필요없다 예측이주목적단순지수평활법, 이중지수평활법, 삼중지수평활법, Wint

Microsoft Word - skku_TS2.docx

선형모형_LM.pdf

Microsoft Word - sbe13_reg.docx

ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행

Microsoft PowerPoint - ANOVA pptx

시스템경영과 구조방정식모형분석

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

Microsoft PowerPoint - LM 2014s_Ch4.pptx

핵 1 학년 2 학년 3 학년합계 문학과예술 역사와철학 사회와이념 선택 학점계 학년 2 학년 3 학년합계비고 14 (15) 13 (14) 27 (29) 2

<5B30385DC0D3BBF3C8ADC7D0B0CBBBE72DC0E5BBF3BFEC2E687770>

14-X25-JSJ.hwp

표본재추출(resampling) 방법

Resampling Methods

슬라이드 1

Statistics Basic_ko_chapter_04

제장 2 비모수 검정(NONPARAMETRIC ANALYSIS) ③ 연구자는 SPSS 출력결과에서 유의확률을 확인하여 귀무가설(H0 )의 기각, 채택 여부를 결정한다. 예를 들어 연구자가 연구자료의 정규성을 검정하기 위하여 유 의수준을 α = 0.05로 설정하고 SPS

자료의 이해 및 분석

시계열분석의개요 (the nature of time series analysis) 확률과정 (stochastic processes) 이란시간으로순서가매겨진확률변수들의집합임. 만일확률변수 y 가연속이라면 y(t) 라고표기하지만이산이라면 y t 라고표기함 ( 대부분의경제자

Microsoft PowerPoint - PDF3 SBE pptx

슬라이드 1

Microsoft PowerPoint Relations.pptx

<4D F736F F F696E74202D FC0E5B4DCB1E220BCF6BFE4BFB9C3F8205BC8A3C8AF20B8F0B5E55D>


exp

모수 θ의 추정량은 추출한 개의 표본값을 어떤 규칙에 의해 처리를 해서 모수의 값을 추정하는 방법입니다. 추정량에서 사용되는 규칙은 어떤 표본을 추출했냐에 따라 변하는 것이 아닌 고정된 규칙입니다. 예를 들어 우리의 관심 모수가 모집단의 평균이라고 하겠습니다. 즉 θ

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

Microsoft Word - ch8_influence.doc

Microsoft PowerPoint - MDA DA pptx

Microsoft Word - Ch1_Introduction_EDA.docx

3 장기술통계 : 수치척도 Part B 분포형태, 상대적위치, 극단값 탐색적자료분석 두변수간의관련성측정 가중평균과그룹화자료

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

statistics

슬라이드 1

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

MATLAB for C/C++ Programmers

Microsoft PowerPoint - 26.pptx

한국보건사회연구원통계학및계량경제학의기초및응용 강의노트 2017 년 4 월 5 월 통계학 : 통계적추론 (Statistical Inference) I. 들어가며 이제통계학에서가장중요한토픽이라고할수있는통계적추론에대해서본격적으로공부를해보도록하겠습니다. 통계적추론을통해연구와관

가능한연구가설제시 가설 1 : 지지후보의선택은유권자의나이에따라차이가있을것이다. 유권자의나이는지지후보의선택에영향을미칠것이다. 유권자의나이에따라지지후보는다를것이다. 가설 2 : 유권자의사회생활만족도는지지후보의선택에영향을미칠것이다. 지지후보의선택은유권자의사회생활만족도에따라차

슬라이드 제목 없음

Communications of the Korean Statistical Society Vol. 15, No. 4, 2008, pp 국소적 강력 단위근 검정 최보승1), 우진욱2), 박유성3) 요약 시계열 자료를 분석할 때, 시계열 자료가 가지고 있는

데이터마이닝 제 1강

위에서 100 단위이상을줄기로하기로결정하였고자료의최소값이 58, 최대값이 1103 이므로 0 부터 11 까지줄기를한열에크기순으로적는다. 줄기 (stem) 옆에잎을그린다. 잎을그리는방법은간단하다. 줄기바로뒤의숫자를줄기옆에차례로적으면된다. CEO 연봉자료는잎이두자리이지만앞

고객관계를 리드하는 서비스 리더십 전략

Microsoft PowerPoint - SBE univariate5.pptx

<B0E6B7CEBAD0BCAE2E687770>

모수검정과비모수검정 제 6 강 지리통계학

고차원에서의 유의성 검정

Microsoft Word - EDA_Univariate.docx

슬라이드 1

01

용역보고서

핵 심 교 양 1 학년 2 학년 3 학년합계 문학과예술 역사와철학 사회와이념 선택 교양학점계 학년 2 학년 3 학년합계비고 14 (15) 13 (

Microsoft Word - ch3_residual.doc

통계적 학습(statistical learning)


빅데이터_DAY key

2 / 27 목차 1. M-plus 소개 2. 중다회귀 3. 경로모형 4. 확인적요인분석 5. 구조방정식모형 6. 잠재성장모형 7. 교차지연자기회귀모형

<B3EDB4DC28B1E8BCAEC7F6292E687770>

eda_ch7.doc

642 또한통계적유의성은실제적유의성과더불어검토되어야할문제이므로통계적유의성만의지나친집착과확대해석은바람직하지않으며, 통계적유의성이검출되지않은연구결과도때로는그자체로휼륭한의미를지닐수있다는점과추후연구에기여할수있다는점에서발표될수있어야할것이다 [6]. 여기에서실제적유의성이란실제적인

자연채무에대한재검토 1. 서론 2. 선행연구 9 Journal of Digital Convergence 214 May; 12(5): 89-99

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

Microsoft Word - ch4_multiple.doc

... —....—

Transcription:

응용식물통계학 Statistics of Applied Plants Science 친환경식물학부유기농생태학전공황선구

13 장상관분석 1. 상관계수 2. 상관분석의가정과특성 3. 모상관계수의검정과신뢰한계 4. 순위상관 14 장회귀분석 1. 회귀직선의추정 2. 회귀직선의검정및추론 3. 모집단절편과회귀계수의구간추정 4. 곡선회귀 - 실습 -

상관분석 지금까지한가지확률변수에의한현상을검정하였다. 즉, 확률변수의변이를가져오는여러인자들의수준에따른차이또는영향을분석하였다. 그러나생물현상은직접적으로영향하는한가지요인에의하여독립적으로발생하기도하지만다른현상과밀접한상호작용을통하여발생하기도한다. 예 ) 병에저항성을가지는식물은저항성이없는식물보다처리한상태에서잎의길이가크고또한잎색이더욱녹색을띈다. 1. 상관계수 상관분석 : 특정한현상들간에서로관계가있는지와얼마만큼있는지를분석하는통계적방법.

상관분석 표본상관계수 (r, gamma) = r ( 1 r +1) 산포도 ( 산점도 ): 두변수의관계를 X 축, Y 축으로각각설정하고각변수의값을나타내는점을찍어변수간관계를파악할수있는도표 유사한관계관계없음반대의관계 그림출처 : http://m.blog.daum.net/ilovedominic/3206232

상관분석 2. 상관분석의가정과특성 상관분석은두임의변수간의관계에대한분석 분석을위한조건 1 2 3 4 두변수 X와 Y는확률변수및정규분포이면서서로대응되는이변량정규분포 (bivariate normal distribution) 이여야한다. X와 Y의분산은일정상관관계는두변수간직선적인관계를측정하는것. 따라서두확률변수가곡선적인관계를가진다면상관관계의측정이어려우므로직선적인연관가능성을검토하는것임을분명히해야함. 상관관계는두변수간의인과관계가있다는것을말하는것이아니다. 즉, X와 Y가상관관계가있다고해서 X가 Y의원인이라고해석할수없다.

상관분석 3. 모상관계수의검정과신뢰한계 모상관계수 : 상관분석에서는상관관계의정도를나타내는단위, ρ rho gamma 위그림에서모상관계수 ρ 의값에따른표본상관계수 r 의분포는 ρ = 0, 상관관계가없을경우 표본상관계수는평균 0 을중심으로대칭인확률분포. 하지만, ρ = 0.8 이되면표본상관계수는평균 0.8 을중심으로하는비대칭분포. 즉, r 은 ρ 의값에영향을받음.

상관분석 상관계수의수식, 상관계수의신뢰한계 : (r - t α/2,v s r, r + t α/2,v s r ) n 2 r t = 1 r 2 예 ) 저항성과잎수의상관관계를분석하라 (5% 유의수준 ) 저항성 (1: 약 ~ 5: 강 ) 1 2 3 4 5 잎수 5 4 6 7 8 1) 상관계수 = 1 3 5 6 + 2 3 4 6 + 3 3 6 6 + 4 3 7 6 + 5 3 8 6 1 3 2 + 2 3 2 + 3 3 2 + 4 3 2 + 5 3 2 + 5 6 2 + 4 6 2 + 6 6 2 + 7 6 2 + 8 6 2 = 0.9 2) 귀무가설 : 모상관계수는 0이다. 대립가설 : 모상관계수는 0이아니다. n 2 r 5 2 0.9 검정통계량 t = = = 3.58 1 r 2 1 (0.9) 2 3) t 0.05/2,3 = 3.182 이므로 P(t > 3.58) < 0.05, 따라서귀무가설기각 1 r 4) s r 은 r의표준편차, s r = 2 = 1 0.9 2 = 0.25, n 2 5 2 신뢰한계는 r - t α/2,v s r = 0.9-3.182 0.25 = 0.10, r + t α/2,v s r = 0.9 + 3.182 0.25 = 1.69, 1 ( 1 r 1), 즉 신뢰한계는 (0.10, 1). 잎수 s r = 저항성 1 r 2 n 2

상관분석 4. 순위상관 질적변량또는순위변량과같이상관분석의가정이충족되지않는자료일경우비모수방법인순위상관 (rank correlation) 을사용. 실제관측치대신에 X와 Y의관측치 x i 와 y i 의순위를결정하고순위의경향성이같은지여부를 순위상관계수 (r s : Spearman rank correlation coefficient) 를토대로검정. n di 2 수식 ) r s = 1 6 σ i=1 ( 단, d n(n 2 1) i = x i y i )

상관분석 예 ) 벼 12 개체의신장을당해년도와전년도의동일한시기에조사하였다. 다음표를토대로 5% 유의수준에서순위상관을단측검정하자. 벼 1 2 3 4 5 6 7 8 9 10 11 12 전년도 66 62 32 51 36 61 43 64 50 78 57 52 순위 11 9 1 5 2 8 3 10 4 12 7 6 당해년도 65 49 54 54 37 52 43 61 48 78 59 45 순위 11 5 7.5 7.5 1 6 2 10 4 12 9 3 차이 0 4-6.5-2.5 1 2 1 0 0 0-2 3 1) 순위상관계수추정 n di 2 r s = 1 6 σ i=1 = 1 6 83.5 = 1 0.29 = 0.71이다. n n 2 1 12 143 2) 귀무가설 : 모상관계수는 0이다. 대립가설 : 모상관계수는 0이아니다. n 2 r 12 2 0.71 검정통계량 t = = = 3.17 1 r 2 1 0.71 2 3) t 0.05,10 = 2.228 이므로 P(t > 3.17) < 0.05, 따라서귀무가설기각. 전년도와당해년도벼신장의길이는 상관관계가있다.

13 장상관분석 1. 상관계수 2. 상관분석의가정과특성 3. 모상관계수의검정과신뢰한계 4. 순위상관 14 장회귀분석 1. 회귀직선의추정 2. 회귀직선의검정및추론 3. 모집단절편과회귀계수의구간추정 4. 곡선회귀 - 실습 -

회귀분석 두확률변수간에관계가있는지검정 상관분석 두확률변수간에인과관계성립하는지검정 회귀분석 예 ) 사람의몸무게는키와직선적인관계가있다. 키를알면정상적인몸무게를추정할수있으므로비만 여부판단가능 두확률변수 X와 Y 간에 Y=f(X) 의관계가성립할경우 Y는 X에회귀, X가 Y의원인이고 Y에의존함이없이 Y를설명하는변수이므로설명변수 ( 독립변수 ), 여기서 Y는 X의함수가되므로반응변수 ( 종속변수 ). 위의예에서반응변수는몸무게, 키는설명변수

회귀분석 1. 회귀직선의추정 위의예에대한산점도는상관관계에서나타난그림과유사. 회귀분석은상관이있는지없는지질적검사를하는상관분석과달리얼마나 Y를추정할수있는지를 검정하는양적검사이다. 수식 ) y i = തy + b(x i - x), ҧ b = σ n i=1 (x i ҧ n (x i ҧ σ i=1 x)(y i തy) x) 2, 의수식을통해회귀직선의절편은 തy-b xҧ

회귀분석 예 ) 임의로선발된벼 5 개체의뿌리길이와벼의생체중을측정하여아래표와같은결과를얻었다. 벼의 생체중을반응변수 (Y) 로뿌리길이를설명변수 (X) 로하는회귀직선식을구하라. y i = തy + b(x i - x), ҧ b = σ n i=1 (x i x)(y ҧ i തy), തy-b xҧ n (x i x) ҧ 2 b = 575 / 250 = 2.3, തy-b x ҧ = 40 2.3(25) = -17.5 즉, 직선회귀방정식의절편 (a) 은 -17.5. 따라서추정된회귀방정식은 തy = -17.5 +2.3X σ i=1 X Y X-평균 Y-평균 (x i x)(y ҧ i തy) (x i x)2 ҧ 1 15 20-10 -20 200 100 2 20 25-5 -15 75 25 3 25 40 0 0 0 0 4 30 50 5 10 50 25 5 35 65 10 25 250 100 평균 25 40 575 250

회귀분석 앞의예에서회귀방정식을구하였으나이직선식이의미를가지기위해서회귀계수와절편이유의하다는증거가있어야함. 즉, 반응변수 Y가설명변수 X의함수라고할수있는가를밝히는회귀직선의유의성검정이필요. MSE = 모회귀계수의유의성검정은모회귀계수가 0과같은지를검정. 모회귀계수가 0과유의하게다를때비로소독립변수 x로종속변수 y를설명가능 귀무가설 : 모회귀계수는 0이다. 대립가설 : 모회귀계수는 0이아니다. 독립변수로종속변수를설명가능.

회귀분석 (1350 2.3(575)) / 3 = 9.17 = MSE X Y X-평균 Y-평균 (x i x)(y ҧ i തy) (x i x)2 ҧ 1 15 20-10 -20 200 100 2 20 25-5 -15 75 25 3 25 40 0 0 0 0 4 30 50 5 10 50 25 5 35 65 10 25 250 100 평균 25 40 575 250 S a = 9.17 ( 1 5 + 625/250) = 4.98, t = -17.5/4.98 = -3.51. t 분포표에서 t 0.05/2,3 = 3.182, 따라서 귀무가설기각.

회귀분석 결정계수 : 표본자료를회귀분석으로검정함에적합성이있는가를결정하는계수 앞의예제의결정계수 (r 2 ) 를구하여라. 575 2 / (250 1350) = 0.97963. 앞의예제에서뿌리길이는생체중의변이중약 98% 를설명한다.

13 장상관분석 1. 상관계수 2. 상관분석의가정과특성 3. 모상관계수의검정과신뢰한계 4. 순위상관 14 장회귀분석 1. 회귀직선의추정 2. 회귀직선의검정및추론 3. 모집단절편과회귀계수의구간추정 4. 곡선회귀 - 실습 -

실습준비 R과 R studio 설치 https://cran.r-project.org/bin/windows/base/ R 다운로드후설치 https://www.rstudio.com/products/rstudio/download/#download RStudio 1.2.1335 - Windows 7+ 다운로드후설치 통계교재 RAW files 다운로드 https://drive.google.com/drive/folders/0b98qpkk5ejemynj1aja1zvjwmzg

실습준비 프로그램검색에서 Rstudio 검색후실행 (R 아님에주의 )

실습 File 클릭 New Project 클릭 RAW file 다운경로지정 ( 분석대상파일경로지정 ) 후 open

실습 1 psds_data 압축해제한폴더지정

실습 상관계수구하기 > etfs <- sp500_px[row.names(sp500_px)>"2012-07-01",sp500_sym[sp500_sym$sector=="etf",'symbol']] > install.packages( corrplot ) > library(corrplot)

실습 > corrplot(cor(etfs),method="ellipse")

실습 > corrplot(cor(etfs),method= number")

실습 > cor(sp500_px$tmo, sp500_px$pki, method="pearson") [1] 0.3658109 > cor(sp500_px$tmo, sp500_px$pki, method="spearman") [1] 0.3868074 > plot(sp500_px$tmo, sp500_px$pki,xlab="tmo",ylab="pki")

실습 > install.packages("ggplot2") > library(ggplot2) >ggplot(sp500_px,aes(x=tmo,y=pki))+geom_point(size=1,colour="blue")+stat_smooth(method=lm,level=.95,colou r="red") + ggtitle("scatter plot : TMI vs PKI + 선형회귀선 ") + theme(plot.title=element_text(size=20))