응용통계연구 (2009) 22(6), 복합구조반복측정자료에대한모형연구 이재훈 1 박태성 2 1 서울대학교통계학과, 2 서울대학교통계학과 (2009 년 11 월접수, 2009 년 11 월채택 ) 요약 본논문에서는반복인자가여러개인반복측정자료에대하여반복인자

Similar documents
???? 1

878 Yu Kim, Dongjae Kim 지막 용량수준까지도 멈춤 규칙이 만족되지 않아 시행이 종료되지 않는 경우에는 MTD의 추정이 불가 능하다는 단점이 있다. 최근 이 SM방법의 단점을 보완하기 위해 O Quigley 등 (1990)이 제안한 CRM(Continu

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a


Vector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표

???? 1

시스템경영과 구조방정식모형분석


abstract.dvi


DBPIA-NURIMEDIA

서론 34 2

Resampling Methods

Microsoft PowerPoint - MDA 2008Fall Ch2 Matrix.pptx

완벽한개념정립 _ 행렬의참, 거짓 수학전문가 NAMU 선생 1. 행렬의참, 거짓개념정리 1. 교환법칙과관련한내용, 는항상성립하지만 는항상성립하지는않는다. < 참인명제 > (1),, (2) ( ) 인경우에는 가성립한다.,,, (3) 다음과같은관계식을만족하는두행렬 A,B에

DBPIA-NURIMEDIA

에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 -

표본재추출(resampling) 방법

590호(01-11)

Kor. J. Aesthet. Cosmetol., 및 자아존중감과 스트레스와도 밀접한 관계가 있고, 만족 정도 에 따라 전반적인 생활에도 영향을 미치므로 신체는 갈수록 개 인적, 사회적 차원에서 중요해지고 있다(안희진, 2010). 따라서 외모만족도는 개인의 신체는 타

Kor. J. Aesthet. Cosmetol., 라이프스타일은 개인 생활에 있어 심리적 문화적 사회적 모든 측면의 생활방식과 차이 전체를 말한다. 이러한 라이프스 타일은 사람의 내재된 가치관이나 욕구, 행동 변화를 파악하여 소비행동과 심리를 추측할 수 있고, 개인의

Lumbar spine

44-4대지.07이영희532~

Microsoft PowerPoint - 26.pptx

OCW_C언어 기초

04김호걸(39~50)ok

Journal of Educational Innovation Research 2017, Vol. 27, No. 4, pp DOI: * A Study on Teache

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할


<352EC7E3C5C2BFB55FB1B3C5EBB5A5C0CCC5CD5FC0DABFACB0FAC7D0B4EBC7D02E687770>

<C7A5C1F620BEE7BDC4>

methods.hwp


DBPIA-NURIMEDIA

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Nov.; 26(11),

<3136C1FD31C8A35FC3D6BCBAC8A3BFDC5F706466BAAFC8AFBFE4C3BB2E687770>

Microsoft PowerPoint Relations.pptx

G Power

슬라이드 1

Journal of Educational Innovation Research 2018, Vol. 28, No. 3, pp DOI: The Effect of Caree

자료의 이해 및 분석

Microsoft Word - SPSS_MDA_Ch6.doc


제 1 절 two way ANOVA 제1절 1 two way ANOVA 두 요인(factor)의 각 요인의 평균비교와 교호작용(interaction)을 검정하는 것을 이 원배치 분산분석(two way ANalysis Of VAriance; two way ANOVA)이라

<B4EBC7D0BCF6C7D02DBBEFB0A2C7D4BCF62E687770>

10(3)-09.fm

슬라이드 제목 없음


Microsoft PowerPoint - ch02-1.ppt

(JBE Vol. 21, No. 1, January 2016) (Regular Paper) 21 1, (JBE Vol. 21, No. 1, January 2016) ISSN 228

, ( ) 1) *.. I. (batch). (production planning). (downstream stage) (stockout).... (endangered). (utilization). *

<352E20BAAFBCF6BCB1C5C320B1E2B9FDC0BB20C0CCBFEBC7D120C7D1B1B920C7C1B7CEBEDFB1B8C0C720B5E6C1A1B0FA20BDC7C1A120BCB3B8ED D2DB1E8C7F5C1D62E687770>

09권오설_ok.hwp

16(1)-3(국문)(p.40-45).fm

Journal of Educational Innovation Research 2017, Vol. 27, No. 2, pp DOI: : Researc

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

012임수진

(Exposure) Exposure (Exposure Assesment) EMF Unknown to mechanism Health Effect (Effect) Unknown to mechanism Behavior pattern (Micro- Environment) Re

ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행

SPSS를 이용한 반복측정 및 종단자료의 분석: 다층모형을 중심으로

,,,.,,,, (, 2013).,.,, (,, 2011). (, 2007;, 2008), (, 2005;,, 2007).,, (,, 2010;, 2010), (2012),,,.. (, 2011:,, 2012). (2007) 26%., (,,, 2011;, 2006;

DBPIA-NURIMEDIA


164

Æ÷Àå82š

한국성인에서초기황반변성질환과 연관된위험요인연구

Microsoft Word - skku_TS2.docx

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

실험 5


Journal of Educational Innovation Research 2018, Vol. 28, No. 3, pp DOI: * Strenghening the Cap


<30382E20B1C7BCF8C0E720C6EDC1FD5FC3D6C1BEBABB2E687770>

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 29, no. 10, Oct ,,. 0.5 %.., cm mm FR4 (ε r =4.4)


슬라이드 1

Journal of Educational Innovation Research 2016, Vol. 26, No. 3, pp.1-16 DOI: * A Study on Good School

Journal of Educational Innovation Research 2019, Vol. 29, No. 2, pp DOI: * The Effect of Paren

( )실험계획법-머리말 ok



44-6대지.08김정희-5



원위부요척골관절질환에서의초음파 유도하스테로이드주사치료의효과 - 후향적 1 년경과관찰연구 - 연세대학교대학원 의학과 남상현

<35335FBCDBC7D1C1A42DB8E2B8AEBDBAC5CDC0C720C0FCB1E2C0FB20C6AFBCBA20BAD0BCAE2E687770>

Journal of Educational Innovation Research 2016, Vol. 26, No. 2, pp DOI: * The Mediating Eff

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할


Journal of Educational Innovation Research 2019, Vol. 29, No. 1, pp DOI: : * Research Subject

278 경찰학연구제 12 권제 3 호 ( 통권제 31 호 )

Journal of Educational Innovation Research 2017, Vol. 27, No. 4, pp DOI: A Study on the Opti

27 2, 17-31, , * ** ***,. K 1 2 2,.,,,.,.,.,,.,. :,,, : 2009/08/19 : 2009/09/09 : 2009/09/30 * 2007 ** *** ( :

동아시아국가들의실질환율, 순수출및 경제성장간의상호관계비교연구 : 시계열및패널자료인과관계분석

DBPIA-NURIMEDIA

untitled


백서2011표지

09구자용(489~500)

,......

Transcription:

응용통계연구 (009) (6), 165 175 복합구조반복측정자료에대한모형연구 이재훈 1 박태성 1 서울대학교통계학과, 서울대학교통계학과 (009 년 11 월접수, 009 년 11 월채택 ) 요약 본논문에서는반복인자가여러개인반복측정자료에대하여반복인자간의상관성을고려한복합공분산 (composite covariance) 모형을살펴보았다. 그러나반복인자가 3 개이상인경우에는기존의통계프로그램을이용하여적합하는것이불가능하다. 복합공분산모형을실제자료에적합하기위해반복인자의차원을축소한모형과랜덤효과모형을이용하여근사적으로적합하는방법을제시하고 883 명으로부터수집한반복인자가 3 개인혈압자료에적용하였다. 주요용어 : 반복측정자료, 복합공분산구조, 랜덤효과, 반복인자. 1. 개요 (Introduction) 반복측정자료는같은실험단위혹은개체로부터여러관측시간이나정해진실험조건하에서반복적으로 측정하여얻어지는자료로서최근의학, 심리학, 교육등매우다양한분야에서많이연구되고있다. 이 러한반복측정자료는동일한개체를대상으로하여얻어진값들이므로분석시에이들사이에존재하는 상관관계를고려해야하며이것은공분산행렬로나타내어진다. 따라서효과적인반복측정분석을위해 서는적절한공분산구조를선택하는일이중요하다. 반복측정횟수가작은경우에는비구조적 (Unstructured; UN) 공분산모형이널리사용되고있으나반복 측정횟수가많은경우에는추정해야할모수의수가많이증가하기때문에특정한구조를가정하여모수 의수를적게하는구조적모형을사용하는것이좋다. 복합대칭성 (compound symmetry; CS) 구조나 제 1 차자기상관 (first order auto correlation; AR-1) 이널리사용되는구조적모형이다 (Laird 와 Ware, 198; Jenrich 와 Schluchter, 1986; Fitzmaurice 등, 004). 최근에는사전정보나관측된데이터를통 해적절한공분산구조를선택할수있는방법이제시되고있다 (Keselman 등, 1998; Littell 등, 000) 기존의 SAS 의 PROC GLM 이나 PROC MIXED 와같은여러통계패키지에서다양한반복측정분석 툴을제공하고있으며 (Liang 과 Zeger, 1986; West 등, 007) 특히 SAS PROC MIXED 에서는 CS, AR-1 이외에 Toepliz 등과같은다양한공분산구조를제공하고있다. 반복인자가 1 개인경우는이러한간단한구조의공분산행렬을가정하고 SAS, R, SPSS 와같은기존의 통계패키지를이용해서적합할수있다. 그러나반복인자의수가 개인경우에는 Park 과 Lee (00) 와 강성현등 (004) 에서고려한복합공분산모형을이용하는것이바람직하다. 그러나이러한복합공분산 모형은 SAS PROC MIXED 를이용해서만모형을적합할수있으며반복인자가 3 개이상인경우에는 SAS PROC MIXED 에서도다룰수가없다. 이논문은 004 년도한국학술진흥재단의지원에의하여연구되었음 (KRF-004-015-C00086). 교신저자 : (151-747) 서울시관악구신림동, 서울대학교통계학과, 교수. E-mail: taesungp@gmail.com

166 이재훈, 박태성 SIDE Left Right TYPE SBP1 DBP1 SBP1 DBP1 1st SBP DBP SBP DBP SBP1 SBP 5 DBP1 DBP 5 SBP3 DBP3 SBP3 DBP3 nd 3rd 그림.1. 양평혈압자료수집과정에서의반복측정구조모형 본논문에서는반복인자가 3개이상인반복측정자료에대해먼저복합구조 (composite structure) 의공분산모형을실제자료에적합하기위해 (i) 반복인자의차원을축소하여적합하는방법과 (ii) 랜덤효과모형을이용하여근사적으로적합하는방법을제시하였다. 실제예제로는 001년경기도양평지역의주민 880여명을대상으로얻어진혈압자료를사용하였다 ( 강성현등, 004). 이자료에서반복인자는반복측정횟수, 혈압의종류 ( 수축기혈압, 이완기혈압 ), SIDE( 오른쪽, 왼쪽 ) 세개다. 자료의변수들에대해서는 절에서자세히설명하고있다. 3절에서이자료를분석하기위한복합공분산구조와혼합선형모형의여러형태들을소개하였고분석결과는 4절에서설명하였다.. 자료구조및변수소개본논문에서사용한자료는한양대의대에서 001년도에경기도양평지역의주민 880명을대상으로조사한혈압자료이다. 혈압측정방법은 5명의측정자 ( 의사 ) 가연구대상자에대해서왼쪽과오른쪽에대한수축기혈압 (SBP) 와이완기혈압 (DBP) 을각각 회씩측정한후에 회측정된 SBP, DBP가각각 5mmHg이상차이가나는경우에는 1회를추가측정하였다 (JNC 6th Report, 1997). 따라서각주민들은 번측정이된경우에는총 8개의혈압자료를또 3번측정이된경우에는총 1개의혈압자료를갖고있다. 이때조사된변수들은성별 (SEX), 나이 (AGE), 체질량지수 (BMI) 가있다. DOCTOR는조사를실시한의사 (5명) 을나타내며 BP는측정된혈압수치이다. TYPE(1 = SBP, 0 = DBP) 은수축기혈압과이완기혈압을나타내는변수이다. 그리고각연구대상자에대해왼쪽과오른쪽을구분하는변수는 SIDE(1 = 왼쪽, 0 = 오른쪽 ) 이며 GRP(1 = 회측정군, 0 = 3회측정군 ) 는각연구대상자가 회측정되었는지 3회측정되었는지를나타내는변수이다. SICK(1 = 고혈압, 0 = 정상군 ) 는혈압을측정하기전에고혈압에대한사전병력을나타내는변수이며고혈압과정상군의최종판정은사전병력을물어본정보와측정된혈압자료를이용하여최종적으로고혈압 / 정상군의여부를판정하게되는데 SICKF(1 = 고혈압, 0 = 정상군 ) 가각조사대상자의최종적인고혈압판정결과를나타내는변수이다. 마지막으로 REPE변수는측정횟수 (1회, 회, 3회 ) 를나타내는변수이다. 3. 혼합모형과공분산구조모형 혼합선형모형 (Mixed linear model) 은반복측정분산분석 (Repeated measure ANOVA) 모형을다변량

복합구조반복측정자료에대한모형연구 167 표 3.1. 복합구조 (composite structure) 의여러가지형태 복합구조의 첫번째 repeated factor의 두번째 repeated factor의 표기 공분산행렬구조 공분산행렬구조 UN@CS 비구조 (unstructured) 복합대칭성 (compound symmetry) CS@UN 복합대칭성 (compound symmetry) 비구조 (unstructured) UN@AR-1 비구조 (unstructured) 자기상관회귀모형 (AR-1) UN@UN 비구조 (unstructured) 비구조 (unstructured) 모형으로확장시킨형태로서다양한형태의공분산구조행렬을사용할수있으며개체들간의변동에대 한효과를나타내는랜덤효과항을포함할수있는모형이다. 고정효과와랜덤효과를모두포함하고있 는일반적인형태의혼합선형모형은다음과같다. y i = X i β + Z i γ i + ϵ i, γ i N(0, B), ϵ i N(0, Σ), 여기서, y i 는 i번째개체로부터관찰된모든혈압값으로구성된반응변수 (response) 벡터이고 β는모수벡터 (vector of unknown parameters), X i 는공변량행렬 (covariate matrix) 이다. Z i 는랜덤효과항의계획행렬 (design matrix) 을나타낸다. γ i 는랜덤효과항으로정규분포를따른다고가정한다. ϵ i 는오차항을나타낸다. B와 Σ는랜덤효과항와오차항의공분산행렬을나타낸다. 혈압자료에대해서 y i 는 8 1 또는 1 1 반응벡터가된다. 이때반복인자는 SIDE, TYPE, REPE 세개이며 i번째연구대상자에대한반응변수는 y ijhk 로표시할수있다. 여기서 y i 의각원소는실제측정된혈압 (blood pressure; BP) 를나타낸다. 각첨자 i는개체 (1,..., 883) 를나타내고, j는각개체의 SIDE(1, ), h는각개체의 TYPE(1, ) 그리고 k는각개체의 REPE(1,, 3) 를나타낸다. 본논문에서는복합공분산구조에대한연구가주목적이므로다음과같은간단한평균모형을고정시켜놓고공분산구조모형을바꿔가면서공분산구조와랜덤효과를바꾸어가면서최적의모형을찾아보았다. y ijhk = β 0 + β 1(age) + β (bmi) + β 3(side) ij + β 4(type) ih + β 5(repe) ik + β 6(sex) i + β 7(doctor) i + β 8(grp) + β 9(side type) ijh + β 10(age type) ih + ϵ ijhk. 반복인자가여러개인경우에는복합구조 (composite structure) 를갖는공분산행렬을사용할수있다. 이복합구조는각반복인자 (repeated factor) 의공분산구조 (covariance structure) 를각각지정한구조로서반복인자가 개이상일경우에유용하게사용될수있다. 반복인자가 개인복합구조 (composite structure) 의여러형태는표 3.1과같다. 표 3.1에있는여러구조의공분산행렬중에서 UN@CS, CS@UN, UN@UN 복합구조행렬을첫번째반복인자의수준수가 개이고두번째반복인자의수준수가 개인경우에대해나타내보면표 3.와같다. 위와같이반복인자가 개인간단한경우에는공분산행렬로는비구조행렬을사용할수있다. 이경우에각개체로부터얻은반복자료의수가 4개이므로공분산행렬의전체모수의수는 4 5/ = 10이된다. 그러나복합구조를사용하는경우, 가장많은모수를필요로하는 UN@UN 구조를사용하더라도모수의수는최대 6개가된다. 즉, 복합구조를사용하게되면적은수의모수를사용하여반복측정된반응변수들간의상관관계를설명할수있게된다. 반복인자의수준수가더큰경우나반복인자의수가 보다큰경우에는모수의수가훨씬더줄어들게된다. 따라서이복합구조모형은반복인자수가 보다큰경우와반복인자의수준수가큰경우에유용하게쓸수있는모형이다. 예를들어반복인자가 3개인경우는 UN@UN@UN이고 4개인경우는 UN@UN@UN@UN 형식으로확장할수있다.

168 이재훈, 박태성 표 3.. 복합구조공분산행렬의구조 복합구조공분산행렬의형태 (i = 1,, j = 1,, i = 첫번째반복인자의수준, j = 두번째반복인자의수준 ) (σ ii : 첫번째반복인자의공분산행렬원소, σ jj : 두번째반복인자의공분산행렬원소 ) UN@CS CS@UN UN@UN σ 11 ρσ 11 σ 1 ρσ 1 ρσ 11 σ 11 ρσ 1 σ 1 σ 1 ρσ 1 σ ρσ ρσ 1 σ 1 ρσ σ σ 11 σ 1 ρσ 11 ρσ 1 σ 1 σ ρσ 1 ρσ ρσ 11 ρσ 1 σ 11 σ 1 ρσ 1 ρσ σ 1 σ σ 11 σ 11 σ 11σ 1 σ 1σ 11 σ 1σ 1 σ 11 σ 1 σ 11σ σ 1σ 1 σ 1σ σ 1 σ 11 σ 1σ 1 σ σ 11 σ σ 1 σ 1 σ 1 σ 1σ σ σ 1 σ σ 그러나이복합구조의공분산행렬의모수추정은간단하지않은단점이있다. 본논문에서는 Σ구조를복합구조로가정하여모형을설정하고직접모수를추정하는방법대신에 (i) 반복인자의차원을축소하여적합하는방법과 (ii) 랜덤효과모형을이용하여근사적으로적합하는방법을제시하였다. 본논문의아이디어는반복인자가 1개이고 Σ의구조가 CS인모형과간단한랜덤개체효과를갖는랜덤모형이서로동치관계가성립한다는사실을이용한것이다. 반복인자가 개이상인경우에도이런아이디어가그대로확장할수있다. 즉 CS@CS 형태의구조를두개의서로독립인랜덤효과를가정해서유도해낼수있다. 그러나반복인자가 1개인경우와는달리추가적인제약조건이필요하다. 3.1. 반복인자의차원을 차로축소하여적합하는방법혈압자료와같이반복인자가 3개 (SIDE, TYPE, REPE) 인경우에대해복합구조 (composite structure) 의공분산행렬을사용할때는 UN@UN@UN 또는 CS@CS@CS와같은구조를사용하는것이타당하다. 그러나 SAS PROC MIXED에서는 개의반복인자의경우만다룰수있으며이경우에도 UN@CS, UN@UN, UN@AR-1의구조만지정할수있다. 따라서 3개의반복인자가존재할때는세인자에대한복합구조를지정할수없다. 이러한문제를해결하기위해 SIDE와 TYPE을하나의변수 (SIDE TYPE) 로묶어서 4개의 level을가진하나의반복인자로지정하게되면 REPE와 SIDE TYPE에대해 개의반복인자를가진반복측정자료분석방법을이용할수있다. 이렇게반복인자가 REPE와 SIDE TBP 두개인경우에대해네가지공분산구조를비교하였다. 다음은각공분산구조의정의이다. (a) UN@UN ( 비구조 @ 비구조 ): 랜덤효과는주지않되 개의반복인자에모두비구조적모형을가정하는경우 (b) UN/UN ( 비구조 / 비구조 ): REPE인자와 SIDE TYPE인자각각에비구조적 (unstructured) 공분산구조의랜덤효과를가정하고오차항에는단일공분산구조를가정하는경우 (c) UN/CS ( 비구조 / 복합대칭구조 ): REPE인자에비구조적공분산구조를, SIDE TYPE인자에복합대칭공분산구조를가정하고오차항에단일공분산구조를가정하는경우 (d) UN@CS ( 비구조 @ 복합대칭구조 ): 랜덤효과는주지않되오차항이비구조공분산과복합대칭구조공분산의복합공분산구조를갖도록가정하는경우 3.1.1. 차원을축소한경우복합공분산구조와랜덤효과모형의비교반복인자 REPE 와 SIDE TYPE 에대한공분산행렬을각각 Unstructured 로정의하면다음과같다.

복합구조반복측정자료에대한모형연구 169 σr,1 σr, σr,3 Σ (UN) R = σr,4 σr,5, σr,6 Σ (UN) = σ,1 σ, σ,3 σ,4 σ,5 σ,6 σ,7 σ,8 σ,9 σ,10 앞서말한네가지형태의공분산구조에따른전체모형의공분산행렬은다음처럼주어진다. 단여기 에서 J n 은모든원소가 1 인 n n 행렬을의미하고 I n 은 n n 단위행렬을의미한다.. (1) UN@UN 의경우 : Σ (UN@UN) = σr,1i 4 Σ (UN) σr,i 4 Σ (UN) σr,4i 4 Σ (UN) σr,3i 4 Σ (UN) σr,5i 4 Σ (UN) σr,6i 4 Σ (UN). () UN/UN 의경우 : Σ (UN/UN) = σr,1j 4 + Σ (UN) σr,j 4 + Σ (UN) σr,4j 4 + Σ (UN) σr,3j 4 + Σ (UN) σr,5j 4 + Σ (UN) σr,6j 4 + Σ (UN) + σϵ I 1. SIDE TYPE 에대한공분산을 CS 로정의할경우는다음과같다 σ,1 σ, σ, σ, Σ (CS) σ,1 σ, σ, = σ,1 σ,. σ,1 (3) UN@CS 의경우 : Σ (UN@CS) = σr,1i 4Σ (CS) σr,i 4Σ (CS) σr,4i 4Σ (CS) σr,3i 4Σ (CS) σr,5i 4Σ (CS) σr,6i 4Σ (CS). (4) UN/CS 의경우 : Σ (UN/CS) = σr,1j 4 + Σ (CS) σr,j 4 + Σ (CS) σr,4j 4 + Σ (CS) σr,3j 4 + Σ (CS) σr,5j 4 + Σ (CS) σr,6j 4 + Σ (CS) + σϵ I J. 각각의공분산구조의원소들을비교해보면 UN@UN과 UN/UN 그리고 UN@CS와 UN/CS가각각비슷한구조를갖고있음을알수있다. 즉 UN@UN과 UN/UN의경우를예로들면 i j일때 UN@UN의공분산구조의 i번째행, j번째열의원소는 σr,iσ,j 이라고한다면 UN/UN의공분산구조의 i번째행, j번째열의원소는 σr,i + σ,j 가된다. 이는전체공분산의구조모형을 REPE의공분산구조와 SIDE TYPE의공분산구조로나눌수있는데이에대해각각 multiplicative모형과 additive모형으로나타나게된다. UN@CS와 UN/CS도마찬가지형태를띠고있으며이를통해볼때복합공분산구조를랜덤효과로근사할수있는가능성을볼수있다.

170 이재훈, 박태성 반복인자을 차원으로축소한경우에 3 차원복합구조모형을적합하기위해필요한제약조건을알 아보자. 여기에서는 UN@UN@UN 과 UN@UN 을비교해보도록한다. REPE 와 SIDE TYPE 의반 복인자두개를사용한 UN@UN 을이용하여 REPE, SIDE, TYPE 세개의반복인자를사용한 UN@UN@UN 을얼마나잘근사할수있을지알아보기위해두공분산구조를비교해보도록하자. 우선 UN@UN@UN의구조는다음과같다. σr,1 σr, σ ( ) ( ) R,3 Σ (UN@UN@UN) = σr,4 σr,5 σs,1 σs, σt,1 σt, σr,6 σs,3 σt,3 그리고 UN@UN의구조는다음과같다. σr,1 σr, σ σ,1 σ, σ,3 σ,4 R,3 Σ (UN@UN) = σr,4 σr,5 σ,5 σ,6 σ,7 σr,6 σ,8 σ,9. σ,10 두구조를비교해보았을때다음과같은조건이성립하면두공분산구조가같은구조를갖게됨을알수 있다. σ,4 = σ,6, σ,1 σ, = p σ,3 σ,4 = q σ,8 σ,9, for p, q > 0. (3.1) σ,5 σ,7 σ,10 식 (3.1) 의조건들이정확히성립한다면 UN@UN 의공분산구조의추정값과 UN@UN@UN 의공분산구 조의추정값이동일하게나올것이다. 3.. 랜덤효과모형을이용하여근사적으로적합하는방법 반복인자가세개인경우에복합공분산구조를랜덤효과모형으로근사할수있는방법을생각해보자. 대표적인복합공분산구조의경우로 CS@CS@CS 인경우와 UN@UN@UN 인경우가있다. 3..1. CS@CS@CS 와랜덤효과모형다음은 CS@CS@CS 의형태로공분산구조를지정하였을때 얻을수있는구조식이다. Σ (CS@CS@CS) = σ 1 ρ R ρ R 1 ρ R 1 ( 1 ρ S 1 ) ( 1 ρ T 1 ) 단, σ = var(y ijhk ), ρ R = corr(y ijhk, y ij hk), j, j = 1,, 3, j j ρ S = corr(y ij1k, y ijk ), ρ T = corr(y ijh1, y ijh ). 다음모형은각반복인자에대해단일랜덤효과를적용한모형의공분산구조이다. Σ (single) = σi J 1 + σgi 3 J J + σsj I J + σt J J I + σϵ I 1. CS@CS@CS의공분산구조와단일랜덤효과의공분산구조가서로같기위한각원소의관계는다음과같다.

복합구조반복측정자료에대한모형연구 171 σ = σ I + σ R + σ S + σ T + σ e σi + σs + σt ρ R = σi + σ R + σ S + σ T + σ e σi + σs = σi + σ R + σ S σi + σt = σi + σ R + σ T σ I = σi + σ R (3.) σi + σr + σs ρ T = σi + σ R + σ S + σ T + σ e σi + σr = σi + σ R + σ T σi + σs = σi + σ S + σ T σ I = σi + σ T (3.3) σi + σr + σt ρ S = σi + σ R + σ S + σ T + σ e σi + σr = σi + σ R + σ S σi + σt = σi + σ T + σ S σ I = σi + σ S (3.4) SAS의 PROC MIXED에서는 CS@CS@CS의형태로공분산구조를모형화하지못하지만그대신단일랜덤효과 model로적합한후얻어진 ˆσ I, ˆσ R, ˆσ S, ˆσ T, ˆσ e 을이용한다. 식 (3.), (3.3), (3.4) 의등식이성립한다면위의식을이용하여 CS@CS@CS에해당하는공분산행렬의추정값을구할수있다. ˆρ R, ˆρ S, ˆρ T 의경우는위에서보는것처럼각각네개의등식으로나타낼수있다. 실제자료의분석에서는이들의평균값을추정값으로사용한다. 3... UN@UN@UN 과 UN/UN/UN 의비교반복인자가두개일때 UN@UN 과 UN/UN 이비 슷한구조를가졌던점을확장하여 UN@UN@UN 을대신하여 UN/UN/UN 으로랜덤효과를고려하여 분석할수있다. 즉오차항은단일공분산구조를가정하고 REPE, SIDE, TBP 각각에대해 UN 공분산 구조의랜덤효과를가정한다. 그공분산구조는다음과같이구한다 σr,1 σr, σ ( ) ( ) R,3 Σ (UN/UN/UN) = σr,4 σr,5 σs,1 σs, σt,1 σt, J J +J 3 J +J 3 J +σ σr,6 σs,3 σt,3 ϵ I 1 Σ R,1 Σ R, Σ R,3 = Σ R,4 Σ R,5, Σ R,6 Σ R,i = σr,i σ (i),1 σ(i), σ(i),3 σ (i),5 σ(i),6 σ (i),8 σ(i),4 σ(i) 7 σ(i),9 σ (i),10 이경우에는각 Σ R,i (i = 1,..., 6) 에대해 UN@UN@UN 공분산구조와같기위한조건식을다음과같이. 구할수있다. 이경우에는 ˆσ,4 와 ˆσ,6 는항상같게추정된다. σ (i),1 σ (i), σ (i),5 = p (i) σ (i),3 σ (i),4 σ (i),7 = q (i) σ (i),8 σ (i),9 σ (i),10, for p (i), q (i) > 0, i = 1,..., 6. (3.5) 3..3. UN@UN@UN과 UN@UN+/UN의비교 UN@UN의공분산구조는 SIDE TBP와 REPE 의복합공분산구조로서 SIDE와 TBP 각각의공분산의효과가구별되지않는단점이있다. 따라서이공분산구조에 SIDE나 TYPE의랜덤효과를추가하는것도한방법이다. 예를들어 UN@UN의공분산구조에 TYPE의 UN공분산구조의랜덤효과를추가하면 (UN@UN+/UN TYPE 으로표시 ) 이전체공분산구조에미치는영향이더잘드러나게된다.

17 이재훈, 박태성 UN@UN 의공분산구조에 TYPE 에대한 UN 공분산구조의랜덤효과를추가한전체공분산구조는다음 과같다 σr,1 σr, σ σ,1 σ, σ,3 σ,4 ( ) R,3 Σ (UN@UN+UN T Y P E ) = σr,4 σr,5 σ,5 σ,6 σ,7 σr,6 σ,8 σ,9 +J σt,1 σt, 3 J σt,3 σ,10 Σ R,1 Σ R, Σ R,3 = Σ R,4 Σ R,5, Σ R,6 Σ R,j = σr,j σ (j),1 σ(j), σ(j),3 σ (j),5 σ(j),6 σ (j),8 σ(j),4 σ(j) 7 σ(j),9 σ (j),10 이경우에는각 Σ R,j (j = 1,..., 6) 에대해 UN@UN@UN 공분산구조와같기위한조건식을다음과같 이구할수있다. σ (i),4 = σ(i),6, σ (j),1 σ (j), σ (j),5 = p (j) σ (j),3 σ (j),4 =q (j) σ (j),7 σ (j),8 σ (j),9 σ (j),10, for p (j), q (j) > 0, j = 1,..., 6 (3.6) 또한 UN@UN 의공분산구조에 SIDE 에대한 UN 공분산구조의랜덤효과를추가한공분산구조및조건 식도같은방법으로구할수있다. 4. 분석결과 4.1. 반복인자의차원축소후복합공분산구조와랜덤효과모형비교반복인자의차원을축소한반복측정자료의분석결과를비교하기위해 3절에서정의한평균모형에대해 UN@UN, UN/UN, UN@CS, UN/CS 공분산구조를가정한후에모형을적합하였다. 이경우총 15개의모수추정값이얻어진다. 이추정값들을표준화하여서로비교한결과, UN@UN과 UN/UN의경우가비교적비슷한모수추정값의분포를가지며, UN@CS와 UN/CS의경우가비슷한모수추정값의분포를가짐을확인할수있었다. 4.. 반복인자의차원축소를통해복합구조를근사하는방법 (UN@UN) SAS 의 PROC MIXED 를통하여 UN@UN 의공분산구조를지정하여분석하면 SIDE TYPE 에해당하 는공분산의원소 σ,1 σ,10 의추정값을각각얻을수있다. 이추정값을이용하여앞에서살펴본 필요한조건식 (3.1) 이성립하는지확인해본결과는다음과같다. ˆσ,4 = 0.367, ˆσ,6 = 0.3617 ( ) 1 ( ) 0.8078 ( ) 0.9710 0.4145 0.369, 0.3617 0.763, 0.3999 0.3663 의각각의 correlation의평균은 0.997이다. 즉, ˆσ,4 와 ˆσ,6 은약간 차이가나지만세벡터의 correlation은 0.997이므로 UN@UN으로 UN@UN@UN을근사할수있다.

복합구조반복측정자료에대한모형연구 173 4.3. 랜덤효과모형을이용하여복합구조를근사하는방법 4.3.1. CS@CS@CS와단일랜덤효과의비교 SAS의 PROC MIXED에서는세반복인자에대해단 일랜덤효과를적용한모형으로적합하면공분산모수들의추정값을얻을수있다. ˆσ I = 133.350, ˆσ G = 4.9711, ˆσ S = 3.9941, ˆσ T = 60.7137, ˆσ ϵ = 1.847 이값들을 3..1절에서설명한관계식에대입하면 ˆσ = 15.8536을얻게된다. 또한식 (3.) (3.4) 을 이용하여 CS@CS@CS의공분산모수별로다음과같은 4개의추정값을얻을수있다. ˆρ G = (0.9176, 0.9651, 0.9751, 0.9641) ˆρ T = (0.6593, 0.6950, 0.6935, 0.6871) ˆρ S = (0.91, 0.9719, 0.9798, 0.9709) ˆρ G, ˆρ T, ˆρ S 에대한추정값들대체적으로값들이비슷하기때문에어느정도복합공분산구조에필요한 가정을만족시키는것으로볼수있다. 최종모수추정값은각각관계식에서얻어지는네값들의평균값 을사용할수있다. 4.3.. UN@UN@UN와 UN/UN/UN의비교 UN/UN/UN 공분산구조모형을적합을시키면각반복인자에해당하는 UN구조의공분산추정행렬을얻을수있고이를이용하여식 (3.5) 를계산함으로써 UN@UN@UN으로의근사가능성을확인할수있다. 단식 (3.5) 에서는 REPE의공분산원소첨자 i에따라총 6개의조건식을얻을수있다. 이들 6개의상관계수의평균값을 0.9984로이조건식이만족된다고볼수있다. 즉, UN/UN/UN을이용하여근사하는것이타당함을알수있다. 4.3.3. UN@UN@UN와 UN@UN+/UN TYPE 의비교 UN@UN의복합공분산구조모형에 TYP E에해당하는 UN구조의랜덤효과를포함하는모형을적합한후에조건식 (3.6) 의벡터에대한상관계수의평균값을구하면 0.9987이므로 UN@UN+/UN TYPE 을이용하여 UN@UN@UN구조를근사하는것이타당함을알수있다. 또한 ˆσ,4 과 ˆσ,6 의차이는 0.001로구해졌다. 4.3.4. UN@UN@UN와 UN@UN+/UN SIDE 의비교 UN@UN의복합공분산구조모형에 SIDE 에해당하는 UN구조의랜덤효과를포함하는모형을적합한후에조건식 (3.6) 의벡터에대한상관계수의평균값을구하면 0.9975가된다. 따라서이조건식이만족된다고볼수있다. 즉, UN@UN+/ UN SIDE 을이용하여 UN@UN@UN구조를근사하는것이타당함을알수있다. 또한 ˆσ,4 과 ˆσ,6 의차이는 0.004로구해졌다. 지금까지 UN@UN@UN 등의복합공분산구조모형을근사하기위해여러다른랜덤효과모형들을적합하였다. 그결과대부분의모형들이잘근사가되었으며특히 UN/UN/UN과 UN@UN+/UN TYPE 에서조건식을가장잘만족한것을알수있다. 표 4.1은각각의공분산구조를적용했을때혼합선형모형에대한적합결과이다. 위의표에서 AIC와 BIC를비교하였을때 UN@UN의복합공분산구조에 TYPE의랜덤효과를추가하였을경우에가장적합결과가좋았고그다음으로는세개의반복인자에각각 UN 공분산구조의랜덤효과를주었을때가적합이잘되었으며 UN@UN의복합공분산구조만을주었을경우에 AIC와 BIC를통해볼때모형의적합도가비교적좋지않음을알수있다. 이결과는조건식을이용한 UN@UN@UN 공분산구조와의유사성을비교하였을때의결과와도일치한다.

174 이재훈, 박태성 표 4.1. 공분산구조에따른혼합선형모형의적합결과 Model 모형별적합도검정 df chi-square p-value AIC BIC # of covariance parameters UN@UN 14 1147.35 0.0001 48879.3 490. 16 UN@UN+UN TYPE 17 1301.48 0.0001 48011.1 48168.3 19 UN@UN+UN SIDE 17 13850.11 0.0001 4718.5 47339.7 19 UN/UN/UN 10 13149.57 0.0001 47869.1 4799.9 13 5. 결론 (Conclusion) 지금까지복합공분산모형을실제자료에적합하기위해반복인자의차원을축소한모형과랜덤효과모형을이용하여근사적으로적합하는방법을제시하고이를반복인자가 3개인실제데이터에적용한결과를살펴보았다. 기존의프로그램에서 CS@CS@CS나 UN@UN@UN 등과같은세가지요인의복합공분산구조를지정할수없기때문에우선은 개의반복인자을하나의변수로지정하여 개의반복인자의구조로바꾸어분석하는방법을고려해보았다. 이경우 UN@UN의공분산구조의경우와각반복인자에 UN공분산구조의랜덤효과를주는경우가서로비슷한모형의모수추정값을가짐을알수있었다. 그리고 CS@CS@CS와 UN@UN@UN의경우를근사하기위해여러형태의랜덤효과모형을고려했었는데혈압데이터에대해서 UN@UN@UN과가장비슷한효과를내는것으로파악되는 UN@UN+UN TYPE 와 UN/UN/UN 이가장최적의모형으로선정되었다. 본논문에서고려한방법은반복인자가 3개이상인경우에대해같은방법으로확장이가능하다. 즉, 복합구조의공분산모형을실제자료에적합하기위해 (i) 반복인자의차원을축소하여적합하는방법과 (ii) 랜덤효과모형을이용하여근사적으로적합하는방법을결합하여모형을적합할수있다. 참고문헌 강성현, 박태성, 이성곤, 김창훈, 김명희, 최보율 (004). 반복인자가 3 개인반복측정자료에대한통계적분석방법 양평주민혈압자료를이용하여, < 응용통계연구 >, 17, 1 1. Fitzmaurice, G. M., Laird, N. M. and Ware, J. H. (004). Applied Longitudinal Analysis, Wiley, Hoboken, New Jersey. Jenrich, R. I. and Schluchter, M. D. (1986). Unbalanced repeated-measures models with structured covariance matrices, Biometrics, 4, 805 80. Keselman, H. J., Algina, J., Kowalchuk, R. K. and Wolfinger, R. D. (1998). A comparison of two approaches for selecting covariance structures in the analysis of repeated measurements, Communications in Statistics -Simulation and Computation, 7, 591 604. Laird, N. M. and Ware, J. H. (198). Random-effects models for longitudinal data, Biometrics, 38, 963 974. Liang, K. Y. and Zeger, S. L. (1986). Longitudinal data analysis using generalized linear models, Biometrika, 73, 13. Littell, R. C., Pendergast, J. and Natarajan, R. (000). Modelling covariance structure in the analysis of repeated measures data, Statistics in Medicine, 19, 1793 1819. item[] National Institutes of Health (1997). The 6th Report of the joint national committee(jnc) on prevention, detection, evaluation, and treatment of high blood pressure, Archives of Internal Medicine, 157, 413 46. Park, T. and Lee, Y. J. (00). Covariance models for nested repeated measure data: Analysis of ovarian steroid data, Statistics in Medicine, 1, 143 164. West, B. T., Welch, K. B. and Galecki, A. T. (001). Linear Mixed Models: A Practical Guide Using Statistical Software, ChapmanHall, London.

복합구조반복측정자료에대한모형연구 175 Modelling for Repeated Measures Data with Composite Covariance Structures Jaehoon Lee 1 Taesung Park 1 Department of Statistics, Seoul National University Department of Statistics, Seoul National University (Received November 009; accepted November 009) Abstract In this paper, we investigated the composite covariance structure models for repeated measures data with multiple repeat factors. When the number of repeat factors is more than three, it is infeasible to fit the composite covariance models using the existing statistical packages. In order to fit the composite covariance structure models to real data, we proposed two approaches: the dimension reduction approach for repeat factors and the random effect model approximation approach. Our proposed approaches were illustrated by using the blood pressure data with three repeat factors obtained from 883 subjects. Keywords: Repeat measures data, composite covariance structure, random effect, repeat factor. This research was supported by the research fund of Korean Research Foundation(KRF-004-015-C00086). Corresponding author: Professor, Department of Statistics, Seoul National University, Shillim-Dong, Kwanak-Gu, Seoul 151-747, Korea. E-mail: taesungp@gmail.com