Microsoft Word - SPSS_MDA_Ch6.doc

Similar documents
공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

PowerPoint 프레젠테이션


<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

Microsoft Word - skku_TS2.docx

R

4 장주성분분석 ( PCA: Principal Component Analysis) 예 1 ) 바지구입 - 우리몸의치수모두를알아야하는가? - 변수 : 허리둘레, 기장, 엉덩이둘레, 허벅지둘레, 무릎높이 - 허리둘레, 기장두변수면충분 ( 이것이주성분분석의개념 ) 즉, 원변

G Power

제 4 장회귀분석

슬라이드 1

Microsoft PowerPoint - IPYYUIHNPGFU

Microsoft PowerPoint - MDA 2008Fall Ch2 Matrix.pptx


슬라이드 1

동아시아국가들의실질환율, 순수출및 경제성장간의상호관계비교연구 : 시계열및패널자료인과관계분석


Microsoft PowerPoint - LM 2014s_Ch4.pptx

2007백서-001-특집

¾Ë·¹¸£±âÁöħ¼�1-ÃÖÁ¾

01....b

00목차

(291)본문7

PowerPoint 프레젠테이션

LM_matrix.pages

시계열분석의개요 (the nature of time series analysis) 확률과정 (stochastic processes) 이란시간으로순서가매겨진확률변수들의집합임. 만일확률변수 y 가연속이라면 y(t) 라고표기하지만이산이라면 y t 라고표기함 ( 대부분의경제자

외국인투자유치성과평가기준개발

완벽한개념정립 _ 행렬의참, 거짓 수학전문가 NAMU 선생 1. 행렬의참, 거짓개념정리 1. 교환법칙과관련한내용, 는항상성립하지만 는항상성립하지는않는다. < 참인명제 > (1),, (2) ( ) 인경우에는 가성립한다.,,, (3) 다음과같은관계식을만족하는두행렬 A,B에

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

Microsoft Word - ch8_influence.doc

PowerPoint 프레젠테이션

자료의 이해 및 분석

비트와바이트 비트와바이트 비트 (Bit) : 2진수값하나 (0 또는 1) 를저장할수있는최소메모리공간 1비트 2비트 3비트... n비트 2^1 = 2개 2^2 = 4개 2^3 = 8개... 2^n 개 1 바이트는 8 비트 2 2

Microsoft PowerPoint - Info R(3) pptx

슬라이드 1

이 장에서 사용되는 MATLAB 명령어들은 비교적 복잡하므로 MATLAB 창에서 명령어를 직접 입력하지 않고 확장자가 m 인 text 파일을 작성하여 실행을 한다

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

- 1 -

Microsoft PowerPoint - ANOVA pptx

<B0A3C3DFB0E828C0DBBEF7292E687770>

제 1 절 two way ANOVA 제1절 1 two way ANOVA 두 요인(factor)의 각 요인의 평균비교와 교호작용(interaction)을 검정하는 것을 이 원배치 분산분석(two way ANalysis Of VAriance; two way ANOVA)이라

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

nonpara6.PDF

exp

Microsoft PowerPoint - MDA DA pptx

Microsoft PowerPoint - 26.pptx

<4D F736F F F696E74202D20BBF3B0FCBAD0BCAE5FC0CCB7D0B0ADC0C72E BC0D0B1E220C0FCBFEB5D>

KSKSKSKS SKSKSKS KSKSKS SKSKS KSKS SKS KS KS C 3004 KS C

제 3 장평활법 지수평활법 (exponential smoothing) 최근자료에더큰가중값, 과거로갈수록가중값을지수적으로줄여나가는방법 시스템에변화가있을경우변화에쉽게대처가능 계산이쉽고많은자료의저장이필요없다 예측이주목적단순지수평활법, 이중지수평활법, 삼중지수평활법, Wint


저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

선형모형_LM.pdf

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

Microsoft Word - sbe13_reg.docx

Microsoft Word - 동태적 모형.doc

Microsoft PowerPoint - ch02-1.ppt

Microsoft PowerPoint - LA_ch6_1 [호환 모드]


eda_ch7.doc

Microsoft Word - ch2_simple.doc

statistics

R t-..

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

에듀데이터_자료집_완성본.hwp

Microsoft PowerPoint Relations.pptx

프로그래밍개론및실습 2015 년 2 학기프로그래밍개론및실습과목으로본내용은강의교재인생능출판사, 두근두근 C 언어수업, 천인국지음을발췌수정하였음

고객관계를 리드하는 서비스 리더십 전략

Microsoft Word - sbe_anova.docx

Microsoft PowerPoint - chap04-연산자.pptx

슬라이드 1

한국정책학회학회보

PowerPoint Presentation


OBJ_DOKU fm

고차원에서의 유의성 검정

.4 편파 편파 전파방향에수직인평면의주어진점에서시간의함수로 벡터의모양과궤적을나타냄. 편파상태 polriion s 타원편파 llipill polrid: 가장일반적인경우 의궤적은타원 원형편파 irulr polrid 선형편파 linr polrid k k 복소량 편파는 와 의

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

Microsoft Word - Chapter7.doc

(Microsoft PowerPoint - Ch19_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345])

14-X25-JSJ.hwp

Chapter 5. Factor Analysis ( 요인분석 ) 5.1 개요 * 변수들의상관관계를이용하여요인 ( 공통개념 ) 을구하고이를이용하여 1) 변수들을분류 2) 그룹에적절한의미를부여 Ex) * 학생들의학교만족도 조교, 행정인력, 강의실, * A 기업지원자 48

Microsoft Word - ch3_residual.doc

Microsoft PowerPoint - chap06-2pointer.ppt

Statistics Basic_ko_chapter_04


<B3EDB4DC28B1E8BCAEC7F6292E687770>

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

제장 2 비모수 검정(NONPARAMETRIC ANALYSIS) ③ 연구자는 SPSS 출력결과에서 유의확률을 확인하여 귀무가설(H0 )의 기각, 채택 여부를 결정한다. 예를 들어 연구자가 연구자료의 정규성을 검정하기 위하여 유 의수준을 α = 0.05로 설정하고 SPS

2156년올림픽 100미터육상경기에서여성의우승기록이남성의기록보다빠른첫해로남을수있음 2156년올림픽에서 100m 우승기록은남성의경우 8.098초, 여성은 8.079초로예측 통계적오차 ( 예측구간 ) 를고려하면빠르면 2064년, 늦어도 2788년에는그렇게될것이라고주장 유사


2011년 제 9회 최우수상.hwp

<3235B0AD20BCF6BFADC0C720B1D8C7D120C2FC20B0C5C1FE20322E687770>

OCW_C언어 기초

Microsoft Word - ch4_multiple.doc

LIDAR와 영상 Data Fusion에 의한 건물 자동추출

<4D F736F F D20C0C0BFEBB0E8B7AE20C1A B0AD202D20B0E8B7AEB0E6C1A6C7D E646F63>

제 3강 역함수의 미분과 로피탈의 정리

2 / 27 목차 1. M-plus 소개 2. 중다회귀 3. 경로모형 4. 확인적요인분석 5. 구조방정식모형 6. 잠재성장모형 7. 교차지연자기회귀모형

MATLAB for C/C++ Programmers

Microsoft PowerPoint - MDA DA pptx


Transcription:

Chapter 6. 정준상관분석 6.1 정준상관분석 정준상관분석 (Canonical Correlation Analysis) 은변수들의군집간선형상관관계를파악하는분석방법이다. 예를들어신체적조건 ( 키, 몸무게, 가슴둘레 ) 과운동력 ( 달리기, 윗몸일으키기, 턱걸이 ) 사이의선형상관관계가있는지알아보고, 관계가있다면어떤관계가있는지분석하는것이다. 정준상관분석은 ( X 1, X,..., X m ) 변수군과 ( Y 1, Y,..., Yn ) 변수군의선형관계를분석한다. p 개원변수를 개의변수군으로나눌수있다고가정하자. x1 x x3 x1 μ 1 Σ11 x = = ~ Normal(, x4 x μ Σ 1... x p Σ1 ) Σ 다음은정준상관분석의특수한예이다. 1) 벡터변수 ( x 1, x ) 에변수가하나이면단순상관계수가된다. ) 하나의벡터변수만변수가하나이면이는다중회귀모형에서결정계수이다. 다중회귀의결정계수는종속변수 ( 변수가하나인벡터 ) 와설명변수의선형결합 ( a X1 + a X +... + a p X p 1 ) 간상관계수가된다. R 6.1.1 정준변수구하기 제일정준변수 두변수군의선형결합간상관계수를가장크게하는선형결합을생각해보자. ρ 1 = max corr( V1, W1 ) where V 1 = a1 x1, W1 = b1 x a= b 0

위의조건을만족하는 a 1, b 1 를제일정준변수 (first canonical variate) 라하고그중다음식을만족하는 a 1, b 1 을구하면된다. 이때 ρ1 을제일정준상관계수 (first canonical correlation) 라한다. var( V 1 ) = var( W1 ) = 1 a1σ 11a1, b1σ b1 제이정준변수 = a x1 W b 이라놓고다음조건을만족하는, b V, = x a 를제이정준변수라한다. (1)V 와 W 은각각 V 1 과 W 1 들과독립이다. () var( V ) = var( W ) = 1 ρ = corr V, ) 을제이정준상관계수라한다. ( W 다른정준변수도같은방법으로구하면된다. 해석의어려움이있어실제사용되는정준변수의수는 개를넘지않는다. 6.1. 정준상관계수개수 두벡터변수의차수중낮은차수수만큼존재한다. 즉변수군을형성하는변수의수가적은변수군의변수수만큼정준상관계수값이존재한다. 한변수군의변수수가 p 이면다른변수군의변수수는 q 이면정준상관계수의수는 min( p, q) 이다. 정준상관계수의유의성검정은다음과같이실시하면된다. (1) H ρ 0 vs. H ρ 0 H Σ 0 vs. H Σ 0 01 : 1 = 01 : 1 () H : ρ 0 vs. H : ρ 0 0 r r = 01 : 1 = 01 : 1 Σˆ k 검정통계량 (1 ˆ T = = Π ρ ) ˆ ˆ i, k = min( q, p q) Σ Σ i= 1 0r r 11 k 검정통계량 T = Π (1 ˆ ρ ), 검정통계량분포 r i= r i α log( Tr ) ~ χ α,( q r+ 1)( p q r + 1) 6.1.3 예제 밀예제자료 (WHEAT.txt) 에서밀의오른쪽면의측정변수 ( 면적, 원주, 길이폭 ) 와아래쪽면의측정변수 ( 면적, 원주, 길이폭 ) 간에상관관계를분석해보자.

6.1 정준상관분석 3 SPSS 에는정준상관분석을위한메뉴가없다. 대신매크로프로그램을실행할수있도록했다. 우선 WHEAT.SAV 데이터를열고매크로프로그램작성을위해편집기를연다. 편집기창이나타나면아래프로그램을작성하고실행한다. Canonical Correlation.sps 파일은 SPSS 가설치된루트파일에있다. SET1, SET 는집단내변수를지정해주면된다. 마침표 (.) 는프로그램문장이끝났음을알려주는것이다. 프로그램이실행되면출력창에가저장된다. 엄청나게많은결과가출력되고데이터에는정준변수 원변수상관계수 변수그룹내의변수들간의상관계수, 변수그룹간변수들의상관계수가된다. 정준상관분석의개략적인결과를예상할수있다. SET1 군에서는 D4 가다른변수와상관관계가낮고, SET 에서는 R4 가군내다른변수와상관관계가낮음을알수있다.

CANONICAL 상관계수 ˆρ 1 ˆρ ˆρ 3 정준상관계수의수는 4 개이다. ( 각그룹내의변수의개수가각각 4 개이므로 ) 정준상관계수는 Corr ( V1, W1) = 0.88, Corr( V, W ) = 0.398, Corr( V 3, W 3) = 0.5, Corr( V 4, W 4) = 0. 004 상관계수이다. 그럼 Corr( V1, W ) 는얼마인가? 당연히 0이다. CANONICAL 상관계수유의성검정 각열은정준상관계수의유의성을검정한다. 귀무가설은 현재열포함이후정준상관계수는 0 이다 이다. 그러므로귀무가설이기각된다는것은그열의정준상관계수는 0 이아니라는것을포함하고있다. 3 번째열의유의확률이 0.03 으로일반적인유의수준 0.05 보다작으므로귀무가설이기각된다. 그러므로제삼정준상관계수는유의하다. 4 열의유의확률은 0.9617 이므로제사정준상관계수는유의하지않다.

6.1 정준상관분석 5 제일, 제이정준변수 RAW( 원점수 ) 와 STANDARDIZED( 표준화점수 ) 개의출력결과가나타나는데 RAW 는변수의원래값으로구한것이고 STANDADIZED 는원변수를표준화하여구한것이다. 밀예제의경우원변수는측정단위다르므로표준화변수를사용하는것이좋다. 다음 V 출력결과는 1 = a1 x1, W1 = b1 x V, = a x1, W = b x a, a, b 이다. 의 1, b 1 아래면변수그룹의제일정준변수 V1 = DOWN1 = 0.016* Z _ D1 0.894* Z _ D 0.16* Z _ D3 0.041* Z _ D4 오른쪽면변수그룹의제일정준변수 W 1 = RIGHT1 = 08* Z _ D1 0.777* Z _ D 0.54* Z _ D3 + 0.54* Z _ D4 단. Z _* = * 평균로각변수의표준화값이다. 표준펀차 이계수를이용하여정준변수이름을붙일수있다. SET1 군의제일정준변수는 D, 제이정준변수 (D1, D3), SET 군의제일정준변수는 R, 제이정준변수는 R3 영향이크므로이를고려하여이름을부여할수있다. 이름을부여하는것은주성분이름부여처럼다소주관적이다. 정준변수와동일군집원변수간의상관관계 계수를이용하기보다는정준변수의이름은정준변수와그그룹변수들간의상관계수값을이용하여명명하는것이좋다. 다시한번강조하지만 V1 과 V, W1 과 W 는서로독립이다. 공통된정보가없다.

아래면변수그룹제일정준변수는면적, 원주, 길이와상관관계가높으므로크기로아래면제이정준변수는길이로이름붙이면적절할것같다. 오른쪽면제일정준변수도크기로이름을붙일수있다. 제일정준변수와제이정준변수의상관계수는 0.88 이었다. 즉오른쪽면의크기가커지면아래면크기도커진다고해석할수있다. 정준변수와다른군집원변수간의상관관계 아래면의크기 ( 제일주성분 ) 는오른쪽면의면적, 원주, 길이, 폭과양의상관관계가존재한다. 상관계수는부호가음인이유는정준변수가반대개념으로계산되었기때문이다. 제일주성분과군내다른변수들간의상관계수를보라. 음이다 (-0.835, -0.994, -0.881, -0.388). 정준변수가계산될때계수가음인것의영향을많이받았기때문이다. 오른쪽면의크기 ( 제일주성분 ) 는아래면의면적, 원주, 길이와양의상관관계가있다. 데이터에는정준변수들이저장되어있다. S1_CV001 은 SET1 의제일정준변수, S_CV001 은 SET 의제일정준변수를의미한다. 산점도행렬을그려보자.

6.1 정준상관분석 7 제일정준변수간상관관계가가장높고 ( 1 ) 그다음은제이정준변수간상관관계 ( ) 이다. 제일과제이정준변수간상관관계는 0이다. (1), () 산점도에서떨어진한두개의점들은변수들간의상관관계면에서이상치이다.

다음은정준변수들간의 Pearson 상관계수를구한결과이다. 위의상관관계를값으로나타낸것이다. 제일, 제이, 제삼, 제사정분변수간상관계수는앞의결과와동일하다.