상관분석 (Correlation)
목차 1. 상관분석은? 2. 분산, 공분산, 상관 3. 상관계수 4. 상관분석해석의유의점 5. 상관분석실제
상관분석은? 상관관계는서열척도, 등간척도, 비율척도로측정된변수들간의관련성정도를알아보기위한것 하나의변수가다른변수와의어느정도밀접한관련성을갖고변화하는가를알아보기위해사용 두변수간의관련성을구할경우단순상관관계를실시하며, 부분또는편상관관계는어떤변수를통제한상태에서두변수의상관관계를구하는것 중다상관관계는두개이상의독립변수에가중치를부여하여상관관계를구하는것
변인 한변인이측정또는분류되었을때어떤사물사람또는속성을분류하기위한목적 계량의의미가없으며, 질적인성격을가짐 빈도분석, 교차분석, 카이검정등 명목 ( 명명 ) 척도서열척도 한변인이측정또는분류되었을때같다, 다르다라는정보뿐만아니라크다, 작다라는서열에관한정보를제공하는척도 서열상의관계등이있음. 서열상뿐만아니라어느만큼차이가있는가하는동간성에관한정보를갖고있는척도 서열화된척도, 동시에척도간의간격이같음. 평균, 표준편차, 정규분포검정 등간척도 ( 분류, 순위, 동간격 ) 비율척도 서열성, 동간성의정보를제공해줄뿐아니라, 절대영점 (0) 을갖고있는척도로한측정치는다른측정치의두배, 세배또는 10 배등의비율에관한정보를갖고있는척도를말함 평균, 표준편차, 정규분포검정등등간척도와같음
변인 변인의분류특성보기 비율변인 절대영점을갖고있다측정치는비율또는퍼센트로비교될수있다. 거리, 시간, 무게등 등간변인 동간적이다. 측정시간의거리가비교될수있다. 연 (year), 온도, IQ 등 서열변인순위의정보만있다. 백분위수, 랭킹, 순위 ( 학업성적 ) 등 명목변인서로다른속성의정보만있다. 성별, 국적, 눈의색깔, 출신학교등
상관분석은? 두변수사이의관계를측정하고묘사하기위해이용되는통계학의한기법 (Gravetter, Wallnau, 2009) Y Y Y 관계의방향 Positively related X Negatively related X Not related X 관계의정도
600 500 400 300 200 100 r=+1.00 100 150 200 250 300 350 400 450 500 550 Total Cholesterol Level 120 110 100 90 80 70 60 50 r=+0.80 80 100 120 140 160 180 200 Systolic Blood Pressure 200 r=-1.00 150 100 80 100 120 140 160 180 200 X T o t a l C h o l e s t e r o l L e v e D ia s t o lic B lo o d P r e s s u re Y 76 r=-0.25 74 72 70 68 66 64 62 60 10 20 30 40 50 60 70 80 Age H eight
분산, 공분산, 상관계수 분산 공분산 상관계수
공분산 (Covariance) 두변수의관계를나타내는양 Subject 1 2 3 4 5 Mean S Adverts Watched 5 4 4 6 8 5.4 1.67 Packets Bought 8 9 10 13 15 11.0 2.92
상관계수 (Correlation coefficient) 변수간의관계의정도나방향을하나의수치로요약해표시해주는지수임 상관관계정도는수치의 0 에서 ±1 사이의절대값으로나타냄 상관계수는 -1 에서 0, 0 에서 1 사이의값을취함. 이때 0 에가까울수록상관관계는낮아지며, 1 에가까울수록상관관계는높아짐 변수관계의방향은 +,- 로표현함. 관계의방향에따라한쪽이증가할때다른쪽도증가하게되는관계, 즉증감의방향이같은경우 +( 양, 정적인 ) 의상관관계가있는것이며, 즉증감의방향이반대인경우 - 의 ( 음, 부적인 ) 상관관계가있는것으로볼수있음.
상관계수 (Correlation coefficient) Field (2009) ±.1 small effect ±.3 medium effect ±.5 large effect 류청산 (2006) r.2 매우약한상관.2 < r.4 약한상관.4 < r.6 보통상관.6 < r.8 강한상관 원태연, 정성원 (2010) r >.8 매우강한상관 r.1 거의무시될수있는선형관계.1 < r.3 약한선형관계.3 < r.7 뚜렷한선형관계 r >.7 강한선형관계
( 확인 ) 변수에따른상관관계분석 독립변수 종속변수 이분화된질적변수 ( 명목변수 ) 이분화된양적변수 서열변수 등간변수비율변수 이분화된질적변수 ( 명목변수 ) Phi 계수, 유관계수, Lambda 이분화된양적변수 Yule s Q 사분상관관계 서열변수 등위양분상관관계 Spearman s rho Kendall s tau-b 등간변수비율변수 Cramer s V 양류상관관계 양분상관관계 다류상관관계 Pearson( 적률 ) 상관관계
상관분석해석의유의점 _ Causality 두변수중한변수가증가할때다른변수가증가하거나, 또는한변수가감소할때다른변수가감소되어도이둘간에영향관계가없다고할수없는이유는크게두가지로볼수있음. 1 The third-variable problem 측정되거나측정되지않는다른변수들이결과에영향을주기때문에 2 Direction of causality 상관계수는인과관계의방향에대해나타내지않음
상관분석해석의유의점 _ Causality 상관관계를인과관계로보기는어려움 서울시내의자동차수와교통사고수의상관관계 - 교통사고원인의직접적원인이자동차수의증가라고판단할수없음 - 도로사정, 초보운전자증가등의다른요인들이있음 아버지와아들의체중의상관관계 - 체중의유전론이확증되지않음 - 음식물, 식습관이원인일수있음 실험설계에서의상관관계는인과관계로해석할수있음 알코올이인간의수면시간에미치는연구를위해통제된환경에서흰쥐를대상으로실험 - 세집단의흰쥐에게물과알코올일정량을투여한후수면시간을측정한다면인과관계성립 - 단, 세집단의쥐들은다른매개변수를통제하고똑같은종의쥐들이어야함 상관관계는인과관계보다는상호관계 (interaction) 즉, 한변수가다른변수에영향을주고, 역으로다른변수가한변수에영향을주는관계라고볼수있음 중 3학생의국어점수와영어점수의상관관계 - 국어능력이영어를습득하는능력에영향을주고영어를습득하는능력이국어를습득하는능력에상호영향을줌 - 실험통제가아닌사회현상에서의상관이란 상호작용 의의미
상관분석 using SPSS 상관분석은크게이변량상관, 편상관으로볼수있음 1 이변량상관계수 ( bivariate correlation) 앞서다른것과같이두변수간의상관을일반적으로말하는것 2 편 ( 부분 ) 상관계수 (partial correlation) 두변수간의관계가다른변수들에의해영향을통제
상관분석 using SPSS ⑴ 이변량상관계수 ( bivariate correlation) 상관분석 이변량상관계수 Exam Anxiety. sav
상관분석 using SPSS SPSS 에서의상관계수는 Pearson s r, Spearman s rs, Kendall s tau-b 가있음 1 Pearson s r - 데이터가 interval 일때 - 표집분포가정규분포일때 상관계수 r=-.441, 제곱하면 0.194 가됨. 설명량은 19.4%
상관분석 using SPSS 2 Spearman s rs - 서열척도로측정된변수간관계측정가능 - 비선형적관계를나타내는데이터분석 The Biggest Liar. sav
상관분석 using SPSS 3 Kendall s tau - Spearman 과마찬가지로비모수상관 - 비선형적관계를나타내는데이터분석 The Biggest Liar. sav
상관분석 using SPSS ⑴ 이변량상관계수 ( bivariate correlation) 양류상관계수 (point-biserial correlation) - rpb 로표시 - 독립변수가명목척도에의해이분화된질적변수로이분변수이며종속변수는연속적양적변수일때두변수의상관정도를추정하기위해쓰이는상관계수 pbcorr. sav
상관분석 using SPSS ⑴ 이변량상관계수 ( bivariate correlation) 양분상관계수 (biserial correlation) - rb 로표시 - 독립변수, 종속변수모두양적변수였으나양적인독립변수를연구자가임의기준에의해이분하여인위적으로이분된독립변수와양적인종속변수의상관을추정하기위해사용 φ 계수 (phi coefficient) - 독립변수와종속변수가모두이분화된질적변수일때두변수의상관정도를파악하기위해쓰이며 φ 로표기함
상관분석 using SPSS ⑵ 부분 ( 편 ) 상관계수 (partial correlation) 부분상관관계 ( 편상관관계, Partial Correlation) 는제 3 의변수를제어하였을때, 두변수가가지는상관관계를구하는것으로이제 3 의변수를제어변수라고함. 제어란제 3 의변수의영향을제거시킴으로써두변수에미치는영향을고정시켜보다정확한상관관계를구할수있게함 부분상관관계를구할경우제어변수에 Time Spent Revising 을이동하고, 변수에 Exam Anxiety 와 Exam Performance 를이동시키면됨. 옵션 (o) 을선택하여평균과표준편차 (M) 또는 0 차상관 (Z) 표시하면됨
상관분석 using SPSS ⑵ 부분 ( 편 ) 상관계수 (partial correlation)
상관분석 using SPSS ⑵ 부분 ( 편 ) 상관계수 (partial correlation) Exam Anxiety. sav
상관분석 using SPSS ⑵ 부분 ( 편 ) 상관계수 ( partial correlation) Exam performance Exam performance Revision time Exam performance Revision time Exam anxiety Exam anxiety Variance accounted for by exam anxiety(19.4%) Variance accounted for by revision time(15.7%) Unique variance explained by exam anxiety(6.0%)
감사합니다