PowerPoint Presentation

Similar documents
R

G Power

<4D F736F F F696E74202D20BBF3B0FCBAD0BCAE5FC0CCB7D0B0ADC0C72E BC0D0B1E220C0FCBFEB5D>

PowerPoint 프레젠테이션

3 장기술통계 : 수치척도 Part B 분포형태, 상대적위치, 극단값 탐색적자료분석 두변수간의관련성측정 가중평균과그룹화자료

R t-..

슬라이드 1

untitled

(001~006)개념RPM3-2(부속)

methods.hwp

자료의 이해 및 분석

제 5강 리만적분

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

2156년올림픽 100미터육상경기에서여성의우승기록이남성의기록보다빠른첫해로남을수있음 2156년올림픽에서 100m 우승기록은남성의경우 8.098초, 여성은 8.079초로예측 통계적오차 ( 예측구간 ) 를고려하면빠르면 2064년, 늦어도 2788년에는그렇게될것이라고주장 유사

Microsoft PowerPoint - IPYYUIHNPGFU

<B0A3C3DFB0E828C0DBBEF7292E687770>

<C0E5B7C1BBF328BEEEB8B0C0CCB5E9C0C729202D20C3D6C1BE2E687770>

(Exposure) Exposure (Exposure Assesment) EMF Unknown to mechanism Health Effect (Effect) Unknown to mechanism Behavior pattern (Micro- Environment) Re

abstract.dvi

DBPIA-NURIMEDIA


저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

statistics

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

제 4 장회귀분석


조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

Act84_

31. 을전개한식에서 의계수는? 를전개한식이 일 때, 의값은? 을전개했을때, 의계수와상수항의합을구하면? 을전개했을때, 의 계수는? 를전개했을때, 상수항을 구하여라. 37

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt

용역보고서

歯ki 조준모.hwp

자료의 이해 및 분석

012임수진

제 3강 역함수의 미분과 로피탈의 정리

2 장수의체계 1. 10진수 2. 2진수 3. 8진수와 16진수 4. 진법변환 5. 2진정수연산과보수 6. 2진부동소수점수의표현 한국기술교육대학교전기전자통신공학부전자전공 1

DBPIA-NURIMEDIA

한국성인에서초기황반변성질환과 연관된위험요인연구

Microsoft Word - SPSS_MDA_Ch6.doc

DBPIA-NURIMEDIA

모수검정과비모수검정 제 6 강 지리통계학

서론 34 2

Microsoft PowerPoint - chap_2_rep.ppt [호환 모드]

ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행

5 3

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

경찰공무원의사회적지지와직무열정과의관계에서자아탄력성의매개효과 경찰공무원의사회적지지와직무열정과의관계에서자아탄력성의매개효과 * The Mediating Effect of Social Support on the Relationship between Ego-Resiliency

Microsoft PowerPoint - Stat03_Numerical technique(New) [Compatibility Mode]

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

제 1 부 연구 개요

비트와바이트 비트와바이트 비트 (Bit) : 2진수값하나 (0 또는 1) 를저장할수있는최소메모리공간 1비트 2비트 3비트... n비트 2^1 = 2개 2^2 = 4개 2^3 = 8개... 2^n 개 1 바이트는 8 비트 2 2

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

1~10

달생산이 초산모 분만시간에 미치는 영향 Ⅰ. 서 론 Ⅱ. 연구대상 및 방법 達 은 23) 의 丹 溪 에 최초로 기 재된 처방으로, 에 복용하면 한 다하여 난산의 예방과 및, 등에 널리 활용되어 왔다. 達 은 이 毒 하고 는 甘 苦 하여 氣, 氣 寬,, 結 의 효능이 있

텀블러514

투자의 기초 저축에서 투자의 시대로!

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA

시스템경영과 구조방정식모형분석

09È«¼®¿µ 5~152s

DBPIA-NURIMEDIA

FGB-P 학번수학과권혁준 2008 년 5 월 19 일 Lemma 1 p 를 C([0, 1]) 에속하는음수가되지않는함수라하자. 이때 y C 2 (0, 1) C([0, 1]) 가미분방정식 y (t) + p(t)y(t) = 0, t (0, 1), y(0)

기술통계

전립선암발생률추정과관련요인분석 : The Korean Cancer Prevention Study-II (KCPS-II)

The characteristic analysis of winners and losers in curling: Focused on shot type, shot accuracy, blank end and average score SungGeon Park 1 & Soowo

(3) 추론에서계산이모수적방법보다훨씬단순. (4) 사용자가이의논리를스스로발견하게하며이해하기쉬움. (5) 표본이정규분포를따를때에도검정력에큰손실이없으며, 정규분포와상이한경우에이의검정력은정규분포에의한방법보다크다. 3. 부호검정 (Sg test) 모집단의중앙값에대한검정으로관찰

( )실험계획법-머리말 ok


歯4차학술대회원고(장지연).PDF

슬라이드 제목 없음

DBPIA-NURIMEDIA

Chapter 분포와 도수분석

<31372DB9DABAB4C8A32E687770>

DBPIA-NURIMEDIA

Buy one get one with discount promotional strategy

14-X25-JSJ.hwp

Statistics Basic_ko_chapter_04

,126,865 43% (, 2015).,.....,..,.,,,,,, (AMA) Lazer(1963)..,. 1977, (1992)

, ( ) * 1) *** *** (KCGS) 2003, 2004 (CGI),. (+),.,,,.,. (endogeneity) (reverse causality),.,,,. I ( ) *. ** ***


체의원소를계수로가지는다항식환 Theorem 0.1. ( 나눗셈알고리듬 (Division Algorithm)) F 가체일때 F [x] 의두다항식 f(x) = a 0 + a 1 x + + a n x n, a n 0 F 와 g(x) = b 0 + b 1 x + + b m x

슬라이드 1

< FC7D1BEE7B4EB2DB9FDC7D0B3EDC3D132382D332E687770>


Microsoft PowerPoint - chap-05.pptx

시계열분석의개요 (the nature of time series analysis) 확률과정 (stochastic processes) 이란시간으로순서가매겨진확률변수들의집합임. 만일확률변수 y 가연속이라면 y(t) 라고표기하지만이산이라면 y t 라고표기함 ( 대부분의경제자

Microsoft PowerPoint - 26.pptx

PowerPoint 프레젠테이션

제장 2 비모수 검정(NONPARAMETRIC ANALYSIS) ③ 연구자는 SPSS 출력결과에서 유의확률을 확인하여 귀무가설(H0 )의 기각, 채택 여부를 결정한다. 예를 들어 연구자가 연구자료의 정규성을 검정하기 위하여 유 의수준을 α = 0.05로 설정하고 SPS

광덕산 레이더 자료를 이용한 강원중북부 내륙지방의 강수특성 연구

상담학연구,, SPSS 21.0., t,.,,,..,.,.. (Corresponding Author): / / / Tel: /


- 1 -

에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 -

고차원에서의 유의성 검정

<4D F736F F F696E74202D2035BBF3C6F2C7FC5FBCF8BCF6B9B0C1FA2E BC8A3C8AF20B8F0B5E55D>

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Nov.; 26(11),

27 2, 1-16, * **,,,,. KS,,,., PC,.,,.,,. :,,, : 2009/08/12 : 2009/09/03 : 2009/09/30 * ** ( :

hwp

Microsoft PowerPoint - chap_11_rep.ppt [호환 모드]

Transcription:

09 th Week Correlation Analysis 상관관계분석 Jongseok Lee Business Administration Hallym University

변수형태와통계적분석방법 H 0 : X ㅗ Y H 1 : X ~ Y X Categorical Y Categorical Chi-square Test X Categorical Y Numerical One-way ANOVA X Numerical Y Numerical Correlation Analysis

Numerical 49.0 kg 1.284 g/cm 2 X Body Weight ~ Y Bone Mineral Density

BMD, bond mineral density 1.284 g/cm 2

Weight and BMD X Body Weight ~ Y Bone Mineral Density 49.0 kg 1.284 g/cm 2 Is BMD associated with body weight?

Act 1

Scatter Plot : Relationship between Weight and BMD Y BMD (112, 1.591) X Weight

가설 : 귀무가설과대립가설 영가설 / 귀무가설 연구가설 / 대립가설 Null Hypothesis X : Weight Y : BMD Alternative Hypothesis 체중에따른 체중에따른 골밀도에차이가없다. 골밀도에차이가있다. H 0 : X ㅗ Y H 1 : X ~ Y 체중 (X) 은골밀도 (Y) 와 관련이없다 독립이다. 체중 (X) 은골밀도 (Y) 와 관련이있다.

Is BMD associated with body weight? X Body Weight ~ Y Bone Mineral Density 49.0 kg 1.284 g/cm 2 Numerical Numerical

Population Correlation Coefficient X Body Weight ~ Y Bone Mineral Density 49.0 kg 1.284 g/cm 2 Numerical Numerical Correlation Coefficient -1 r xy +1-1 r xy 0 +1

가설의설정 영가설 / 귀무가설 연구가설 / 대립가설 Null Hypothesis X : Weight Y : BMD Alternative Hypothesis 체중에따른 체중에따른 골밀도에차이가없다. 골밀도에차이가있다. r xy = 0 r xy 0 H 0 : X ㅗ Y H 1 : X ~ Y 체중 (X) 은골밀도 (Y) 와 관련이없다 독립이다. 체중 (X) 은골밀도 (Y) 와 관련이있다.

일부분 표본 Sample r xy 전체모두 모집단 Population r xy

Sample Correlation Coefficient 1. 상관관계분석은두변수가 (1) 선형관계를갖는지, (2) 선형관계를갖는다면어느방향인지 (+ 인지아니면 인지 ), 그리고 (3) 그관계가얼마나강한지를파악하기위한것 2. 표본상관계수 r 은모상관계수 r (rho) 의추정치 (estimate) 3. 표본상관계수의범위는항상 -1 r +1 임 (1) +1에가까우면두변수사이에강한양의관계가있음을의미 (2) -1에가까우면두변수사이에강한음의관계가있음을의미 (3) 0에가까우면가까울수록두변수사이에선형관계가없음을의미 4. 곡선관계는매우다양할수있으므로상관관계분석에서는선형관계에만초점 Linear Relationship

직관적이해 X : Weight Y : BMD r xy 귀무가설기각 p-value? -1 H 0 : r xy = 0 0 +1 H 1 : r xy 0 직관 : (1) r XY 가 0 에가까울수록독립이라는증거! (2) r XY 가 +1 또는 -1 에가까울수록관련이있다는증거! H 0 : X ㅗ Y H 1 : X ~ Y 체중 (X) 은골밀도 (Y) 와 관련이없다 독립이다. 체중 (X) 은골밀도 (Y) 와 관련이있다.

SPSS 를이용한상관관계분석

Pearson 상관관계분석결과 상관계수는방향성를갖지않는다. 즉 x 와 y 의상관계수는 y 와 x 의상관계수와같다.

Act 2

Table. Descriptive Statistics

Table. Mean Comparisons of Each Variable according to L-spine BMD Status

Table. Bivariate Correlations between Variables

Relationship between Age and BMD Normal Osteopenia Osteoporosis

체중 골밀도 나이

혼동효과 confounding effect 체중 통제 Control 골밀도 나이

SPSS 를이용한편상관관계분석

편상관관계분석결과

Partial Correlation X Body Weight ~ Y Bone Mineral Density 49.0 kg 1.284 g/cm 2 1. Sample Correlation Coefficient r xy = + 0.248*** ( p =.000, n = 2,106 ) 2. Sample Partial Correlation Coefficient r xy ㅣ z = + 0.326 ( p =.000, n = 2,106 ) where z = Age

체중 골밀도 골량

혼동효과 confounding effect 체중 통제 Control 골밀도 골량

Is BMD associated with body weight? X Body Weight ~ Y Bone Mineral Density 49.0 kg 1.284 g/cm 2 1. Sample Correlation Coefficient r xy = + 0.271*** ( p =.000, n = 547 ) 2. Sample Partial Correlation Coefficient r xy ㅣ z = + 0.050 ( p =.242, n = 547 ) where z = bone mineral content BMD is associated with body weight, really?

Act 3

변수의척도 모상관계수에대한 t 검정을위한필요조건은두변수가 이변량정규분포 를따라야 한다는것이다. 그러나두변수중하나라도 서열척도 인경우이러한조건을만족시 키지못하며, 등갂이상인경우도이러한조건을만족시키지못할수있다. Question 그러면두변수가이변량정규분포를따르지않는다면어떻게해야하는가? 또는두변수중하나라도서열척도라면어떻게해야하는가? 비모수적통계방법인 Kendall's Tau-b 혹은 Spearman Correlation을사용!

모상관계수 Population Correlation Coefficient r x xy y where xy N i 1 ( x i x N )( y i y ) 모공분산 (population covariance)

표본상관계수 Sample Correlation Coefficient r s s x xy s y where s xy n i 1 ( x i x )( n 1 y i y ) 표본공분산 (sample covariance)

표본상관계수 Sample Correlation Coefficient

표본공분산 sample covariance In Excel, use =COVAR(array1,array2)*n/(n-1) r s s x xy s y where s xy n i 1 ( x i x )( y n 1 i y )

PreTxch 152.45 300 270 240 249.35 210 180 150 100 120 140 160 180 200 PreTxBP

공분산과상관계수의이해

공분산의이해 Data Set 1에서 x 가증가함에따라 y 도증가 x 가평균보다작을때는 y 도평균보다작거나같음 ( x 1 =2, y 1 = 13 ) x 가평균보다클때는 y 도평균보다크거나같음 ( x 2 = 6, y 2 = 20) ( x 3 = 7, y 3 = 27 ) 따라서 (x i x) 와 (y i y) 는같은부호또는 0의값을가짐즉 (x i x)(y i y) 는양 (+) 의값또는 0이됨 일반적으로두변수가같은방향으로움직일때, 공분산은큰양수가됨 ( s xy = 17.5 )

공분산의이해 Data Set 2에서 x 가증가함에따라 y 는감소 x 가평균보다작을때는 y 도평균보다크거나같음 ( x 1 =2, y 1 = 27 ) x 가평균보다클때는 y 도평균보다작거나같음 ( x 2 = 6, y 2 = 20) ( x 3 = 7, y 3 = 13 ) 따라서 (x i x) 와 (y i y) 는다른부호또는 0의값을가짐즉 (x i x)(y i y) 는음 (-) 의값또는 0이됨 일반적으로두변수가반대방향으로움직일때, 공분산은큰음수값을가짐 ( s xy = -17.5 )

공분산의이해 Data Set 3 에서 x 가증가함에따라 y 는어느특정한방향으로움직임을보이지않음 따라서 (x i x)(y i y) 는양 (+) 의값, 0, 음 (-) 의값모두가가능 일반적으로두변수가특별한패턴없이움직일때, 공분산은작은값을가짐 ( s xy = -3.5 )

공분산의이해 공분산의부호는두변수의관계가가지는특성을의미 (1) 공분산값이양 (+) 의값이면, 두변수는양의선형관계가있음 (2) 공분산값이음 (-) 의값이면, 두변수는음의선형관계가있음 하지만두변수의관계의강도는표현하지못함즉 값이크다고해서관계의강도가크다 고말할수없음

상관계수의이해 상관계수는두변수의선형관계의강도를표현하기위한것 공분산을각변수의표준편차의곱으로나눔으로써 -1과 +1 사이의값으로표현 상이한자료들의선형관계의강도에대한비교가가능

상관계수의특징 1. 상관계수가공분산에대해갖는장점은표준화되었다는것이다. 즉 (1) 표본상관계수 r 은항상 -1 r +1의범위에있다. (2) r = +1 이면, 두변수는완젂한양의선형관계이다. (3) r = -1 이면, 두변수는완젂한음의선형관계이다. (4) r = 0 이면, 두변수갂에는선형관계가졲재하지않는다. 2. 상관계수는단위를갖지않는다. 따라서측정단위와독립적으로정의된다. 즉하나의변수가취하는모듞값에상수를더하거나빼거나 양의상수를곱하거나나누는변환을해도상관계수는변하지않는다. 3. 상관계수는방향성를갖지않는다. 즉 x 와 y 의상관계수는 y 와 x 의상관계수와같다.

Quiz y=3x 이고 z=5x 의관계가있다. r xy 와 r xz 중어느것이더크겠는가?

PreTxch 300 270 240 210 180 150 100 120 140 160 180 200 PreTxBP 상관계수의의미 그러면두변수의상관계수가 +0.877 라는것은무엇을의미하는가? (1) 두변수가양의선형관계가있다. (2) 0.8 보다크므로 매우강한양 의선형관계가있다. 그러면그수치의의미는? 상관계수가산포도상에서젂체적으로하나의선주위에밀집해있는지를의미 모듞점들의 87.7% 가선위에있다는것을의미하지는않음 상관계수가 0.8 이라는것이 0.4 보다두배선형관계가강하다는것을의미하지않음

결정계수 Coefficient of Determination, R 2 결정계수는 상관계수의제곱값, r 2 으로서다음과같은정보를제공한다. (1) 두변수가공유하는분산의비율로서 (2) 하나의변수의변동이다른변수의변동에의하여설명되는정도를의미한다. 상관계수 r을제곱한값을결정계수 (coefficient of determination) 이라고하고두변수가공유하는분산의비율을말한다. 여기서는 r² = 0.769가된다. 즉, 혈압수치는 cholesterol 수치의 77% 를설명하고있고, 23% 는다른인자에의해설명된다고할수있다. 물론 cholesterol 수치가혈압수치의 77% 를설명하고있다고해도된다.

표본크기의역할 The Role of Sample Size 표본크기가크면당연히모상관계수의실제값에대한좋은추정치를획득함따라서표본이매우큰경우, 상관계수가작더라도유의하게될가능성이높음 This makes it easier for smaller values of the sample correlation coefficient to be considered significant. 이와관련해서혼돆하지말아야할것은 (1) 표본크기로인해유의성이졲재한다는것이강한상관관계를의미하는것은아님 (2) 유의성의증가가변수관계의중요성을의미하는것은아님 A larger sample does not mean that the correlation is stronger nor does its significance imply importance.

상관관계 vs. 인과관계 두변수, X와 Y 사이에상관관계가있다는것이반드시그들사이에직접적인인과관계가있다는것을의미하지않는다. 두변수사이에인과관계가졲재하기위해서는다음세가지조건을만족하여야한다. X Y 1 변수 X가변수 Y보다시갂적으로먼저졲재해야한다. 2 두변수, X와 Y는공변량 (covariates) 이어야한다. 즉상관관계가있어야한다. 3 두변수, X와 Y에다같이원인이되는허구변수 (spurious variable) 가없어야한다. 즉허구변수를통제하여도변수 X와 Y 사이의상관관계가졲재하여야한다. 따라서변수 X와 Y 사이의상관관계가있다는것은인과관계의필요조건이지충분조건은되지못한다. 특히 3번조건인허구변수를밝히는데젂술한편상관계수가사용될수있다.