The Korean Journal of Applied Statistics (2017) 30(3), DOI: Projection analysis for split-plot data

Similar documents
Vector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표

???? 1

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

Microsoft PowerPoint - IPYYUIHNPGFU

Microsoft PowerPoint - MDA 2008Fall Ch2 Matrix.pptx


???? 1



THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 29, no. 10, Oct ,,. 0.5 %.., cm mm FR4 (ε r =4.4)

고객관계를 리드하는 서비스 리더십 전략

G Power

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut


R t-..

에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 -

메타분석: 통계적 방법의 기초

슬라이드 1

시스템경영과 구조방정식모형분석

878 Yu Kim, Dongjae Kim 지막 용량수준까지도 멈춤 규칙이 만족되지 않아 시행이 종료되지 않는 경우에는 MTD의 추정이 불가 능하다는 단점이 있다. 최근 이 SM방법의 단점을 보완하기 위해 O Quigley 등 (1990)이 제안한 CRM(Continu

제 1 절 two way ANOVA 제1절 1 two way ANOVA 두 요인(factor)의 각 요인의 평균비교와 교호작용(interaction)을 검정하는 것을 이 원배치 분산분석(two way ANalysis Of VAriance; two way ANOVA)이라

statistics

2156년올림픽 100미터육상경기에서여성의우승기록이남성의기록보다빠른첫해로남을수있음 2156년올림픽에서 100m 우승기록은남성의경우 8.098초, 여성은 8.079초로예측 통계적오차 ( 예측구간 ) 를고려하면빠르면 2064년, 늦어도 2788년에는그렇게될것이라고주장 유사

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

Microsoft Word - LectureNote.doc

LM_matrix.pages

MATLAB for C/C++ Programmers

44-4대지.07이영희532~

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

비선형으로의 확장

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 29, no. 6, Jun Rate). STAP(Space-Time Adaptive Processing)., -

제 3 장평활법 지수평활법 (exponential smoothing) 최근자료에더큰가중값, 과거로갈수록가중값을지수적으로줄여나가는방법 시스템에변화가있을경우변화에쉽게대처가능 계산이쉽고많은자료의저장이필요없다 예측이주목적단순지수평활법, 이중지수평활법, 삼중지수평활법, Wint

Microsoft PowerPoint - chap_11_rep.ppt [호환 모드]

부문별 에너지원 수요의 변동특성 및 공통변동에 미치는 거시적 요인들의 영향력 분석

09권오설_ok.hwp

Microsoft Word - 동태적 모형.doc

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

완벽한개념정립 _ 행렬의참, 거짓 수학전문가 NAMU 선생 1. 행렬의참, 거짓개념정리 1. 교환법칙과관련한내용, 는항상성립하지만 는항상성립하지는않는다. < 참인명제 > (1),, (2) ( ) 인경우에는 가성립한다.,,, (3) 다음과같은관계식을만족하는두행렬 A,B에

용역보고서


PowerPoint Presentation


저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

164

ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행

<B4DEBCADB1B8B0F8BAB82D363837C8A32E687770>

abstract.dvi


Microsoft Word - sbe_anova.docx

장연립방정식을풀기위한반복법 12.1 선형시스템 : Gauss-Seidel 12.2 비선형시스템 12.1 선형시스템 : Gauss-Seidel (1/10) 반복법은초기근을가정한후에더좋은근의값을추정하는체계적인절차를이용한다. G-S 방법은선형대수방정

2 / 27 목차 1. M-plus 소개 2. 중다회귀 3. 경로모형 4. 확인적요인분석 5. 구조방정식모형 6. 잠재성장모형 7. 교차지연자기회귀모형

슬라이드 1

<B4EBC7D0BCF6C7D02DBBEFB0A2C7D4BCF62E687770>

Analyses the Contents of Points per a Game and the Difference among Weight Categories after the Revision of Greco-Roman Style Wrestling Rules Han-bong

(JBE Vol. 21, No. 1, January 2016) (Regular Paper) 21 1, (JBE Vol. 21, No. 1, January 2016) ISSN 228


untitled

에너지경제연구 제12권 제2호

( )실험계획법-머리말 ok

Artificial Intelligence: Assignment 5 Seung-Hoon Na December 15, Numpy: Tutorial 다음 자료를 참조하여 numpy기본을 공부하시오.

벡터자기회귀 (Vector Autoregression : VAR) 모형은경제이론없이모형만으로변수들간의관계를설명할수있다는점에서자주이용되는모형임. y t =α 1 y t-1 + +α p y t-p +βx t +ε t 여기서 y t 는내생변수 (endogenous varia

(Microsoft PowerPoint - Ch21_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345])

exp

139~144 ¿À°ø¾àħ

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

수도권과비수도권근로자의임금격차에영향을미치는 집적경제의미시적메커니즘에관한실증연구 I. 서론

학습영역의 Taxonomy에 기초한 CD-ROM Title의 효과분석


저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

Microsoft PowerPoint - chap_11_rep.ppt [호환 모드]

슬라이드 1

자료의 이해 및 분석

DBPIA-NURIMEDIA

Microsoft Word - ch4_multiple.doc

Microsoft Word - skku_TS2.docx

PowerPoint 프레젠테이션

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Jul.; 27(7),

59

Journal of Educational Innovation Research 2018, Vol. 28, No. 3, pp DOI: The Effect of Caree

<352EC7E3C5C2BFB55FB1B3C5EBB5A5C0CCC5CD5FC0DABFACB0FAC7D0B4EBC7D02E687770>

= ``...(2011), , (.)''

example code are examined in this stage The low pressure pressurizer reactor trip module of the Plant Protection System was programmed as subject for

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Dec.; 27(12),

Kor. J. Aesthet. Cosmetol., 및 자아존중감과 스트레스와도 밀접한 관계가 있고, 만족 정도 에 따라 전반적인 생활에도 영향을 미치므로 신체는 갈수록 개 인적, 사회적 차원에서 중요해지고 있다(안희진, 2010). 따라서 외모만족도는 개인의 신체는 타

Resampling Methods

Lumbar spine

체의원소를계수로가지는다항식환 Theorem 0.1. ( 나눗셈알고리듬 (Division Algorithm)) F 가체일때 F [x] 의두다항식 f(x) = a 0 + a 1 x + + a n x n, a n 0 F 와 g(x) = b 0 + b 1 x + + b m x

nonpara6.PDF

,......

204

종합물가정보 2016년 4월호

005- 4¿ùc03ÖÁ¾š

2009 April

Microsoft PowerPoint Predicates and Quantifiers.ppt

슬라이드 1

04_이근원_21~27.hwp

<352E20BAAFBCF6BCB1C5C320B1E2B9FDC0BB20C0CCBFEBC7D120C7D1B1B920C7C1B7CEBEDFB1B8C0C720B5E6C1A1B0FA20BDC7C1A120BCB3B8ED D2DB1E8C7F5C1D62E687770>

Transcription:

The Korean Journal of Applied Statistics (2017) 30(3), 335 344 DOI: https://doi.org/10.5351/kjas.2017.30.3.335 Projection analysis for split-plot data Jaesung Choi a,1 a Department of statistics, Keimyung University (Received December 5, 2016; Revised April 1, 2017; Accepted April 1, 2017) Abstract This paper discusses a method of analyzing data from split-plot experiments by projections. The assumed model for data has two experimental errors due to two different experimental sizes and some random components in treatment effects. Residual random models are constructed to obtain sums of squares due to random effects. Expectations of sums of squares are obtained by Hartley s synthesis. Estimable functions of fixed effects are discussed. Keywords: split-plot designs, random components, projection, fitting constants method, estimable functions 1. 서론실험의성격에있어실험단위의반응에영향을미치는요인들의수준배치에서로다른크기의실험단위가요구되는실험을생각해보기로한다. 하나의실험구가서로다른크기의실험단위들로구성될때크기가큰실험단위를주구 (whole-plot) 작은크기의실험단위를세구 (sub-plot) 라부르며주구와세구의실험구를분할구 (split-plot) 라부른다. 분할구유형의실험계획은작은크기의실험단위가큰크기의실험단위에내포되어있는설계구조를갖는다. 따라서적어도둘이상의서로다른크기의실험단위를갖는실험상황을가정하게된다. 분할구유형의실험계획에서제기되는주된관심문제는처리구조의처리들에배정되는서로다른크기의실험단위들을확인하고결과의자료를분석하기위한타당한모형을구축하는문제로기술된다. 실험단위의개별크기와관련된변이를측정하는변동요인을확인하는것은중요하다. 이들변동요인은각각의서로다른오차항들을계산하기위하여이용되고각오차항은추정평균의표준오차의추정치를계산하기위해이용된다. 이는변동요인들이서로다른크기의실험단위들의이용으로부터발생함을의미하고있다. 둘이상의서로다른크기의실험단위를포함하고있기때문에모수나모수간의비교를위한표준오차추정값들은하나또는다수의변동요인들을포함하게된다. 분할구유형의실험자료에대한분석방법과모형에관한논의는 Milliken과 Johnson (2009), Montgomery (1976) 그리고 Searle (1971) 등의많은문헌에서다루어지고있다. 고정모형, 확률모형또는혼합모형의가정하에확률효과와관련된분산성분의추론방법은 Searle 등 (1992) 등에서보여진다. 이와는달리실험설계와관련된서로다른크기의실험단위들간의변이는서로다른특성의오차성분들로간주되고자료변동의요인으로간주된다. 처리구조의처리또는요인들의수준변화에따른확률효과 1 Department of Statistics, Keimyung University, 1095 Dalgubeoldaero, Dalseogu, Daegu 42601, Korea. E-mail: jschoi@kmu.ac.kr

336 Jaesung Choi 와실험단위의변이를나타내는오차는서로독립임을가정하고있다. 이러한가정은사영분석의기초를제공하게된다. 본논문은처리에해당하는효과들외에분할구유형의실험설계와관련된다수의오차항을갖는선형모형의가정하에실험자료의분석을위한분석방법을논의하고자한다. 처리구조에포함된확률효과가아닌실험설계의구조로부터발생하는오차항의추가로인해고정효과의분석에영향을주고있는경우이다. 다시말하면, 분석모형이처리구조내고정효과와확률효과그리고설계구조와관련된다수의오차항을포함할때사영의관점에서자료를분석하는방법을다루고자한다. 사영에관한논의는 Graybill (1983), Johnson과 Wichern (1988) 등에서보여진다. 관측반응에대한선형모형의가정에서모형내모수의추정방법으로최소제곱법의이용이가능할때사영의관점에서동일한분석이이루어질수있다. 본논문은분할구유형의실험자료를분석하기위한사영의이용에서변동요인에따른제곱합의계산과관련된모형의표현식, 잔차제곱합, 이차형식의기댓값그리고추론을위한분포의자유도계산등을논의한다. 사영의이용은벡터공간에서사영의개념을이해할수있을뿐만아니라행렬의다양한성질을활용할수있다는점에서유용하며또한아직실험계획과관련된사영분석의논의가그리활발하지않다는점에서그의미가있다고볼수있다. 2. 모형의가정실험단위의반응에영향을주는요인들로고정요인과확률요인그리고다수의오차항이포함되어있을때실험자료를분석하기위한모형으로혼합효과의선형모형을가정하게된다. 실험자료의분석을위한일반적인혼합모형의행렬표현식은다음과같다. k r y = Xβ + Q i δ i + W jν j + ϵ. (2.1) i=1 j=1 단, y는 n 1인관측벡터이고 X는원소가 0 또는 1로구성되며크기가 n p인고정효과벡터의계수행렬로계수 (rank) 가 q(< p) 이다. β는 p 1인모수벡터이다. Q i (i = 1, 2,..., k) 는확률효과벡터 δ i 의계수행렬로 0 또는 1로구성되며크기가 n c i 인완전열계수행렬 (full column rank matrix) 이다. δ i 는 N(0, σδ 2 i I ci ) 인분포를따르며 δ i (i = 1, 2,..., k) 는상호독립이라고가정한다. W j (j = 1, 2,..., r) 는확률효과벡터 ν j 의계수행렬로 0 또는 1로구성되며크기가 n d j 인완전열계수행렬이다. ν j 는 N(0, σν 2 j I dj ) 인분포를따르며 ν j (j = 1, 2,..., r) 는상호독립이라고가정한다. ϵ은 n 1인오차벡터이며 N(0, σϵ 2 I n ) 인분포를따른다고가정한다. 오차벡터와확률효과벡터들은서로독립으로가정한다. 식 (2.1) 은 Xβ로주어지는고정효과부분과 Σ k i=1q i δ i 인확률효과부분그리고서로다른크기의실험단위로부터의변이를나타내는오차성분 Σ r j=1w j ν j 와가장작은크기의실험단위의변이를나타내는오차항의네성분으로구성되어있다. 고정효과들로구성되는고정부분 (fixed part) 과확률효과들로구성되는확률부분 (random part) 으로나누면혼합모형의분석은고정부분의분석과확률부분의분석으로구분되어진다. 고정부분의분석은확률부분의분석후에행해지게된다. 즉, 분산성분들이추정된후고정효과들의추정가능함수에관한신뢰구간추정이나가설검정에관한추론이가능하기때문이다. 혼합모형에서분산성분을추정하기위한방법으로상수적합법이라불리우는 Henderson (1953) 방법 III(Henderson s Method III) 을적용하기로한다. 상수적합법은다양한모형의적합방식을이용하여변동요인에따른제곱합을구하고있기때문에사영에근거한분석이가능하게된다. 분산성분을얻기위한모형으로혼합모형에서고정효과를제외한잔차모형을구한다. 고정효과의모형은 y = Xβ + ϵ. (2.2)

Projection analysis for split-plot data 337 로표현된다. 단, ϵ = k i=1 Q iδ i + r j=1 W jν j + ϵ 이다. Var(ϵ ) = Σ 라두면 Σ 는 Σ = k σδ 2 i Q iq i + i=1 r σν 2 j W jw j + σϵ 2 I n (2.3) j=1 이다. 고정효과모형또는고정부분의식 (2.2) 에사영을이용하여고정효과벡터 β 를추정한후잔차벡 터를구한다. 잔차벡터를 r 이라두자. Moore-Penrose 의일반화된역행렬을이용한정규방정식의해벡 터 ˆβ 은 ˆβ = X y 로구해지므로 r = (I XX )y = k (I XX )Q i δ i + i=1 r (I XX )W jν j + (I XX )ϵ (2.4) j=1 이다. 식 (2.4) 의잔차모형은혼합모형의고정효과부분인 Xβ 에종속되지않는확률모형이다. 확률모 형의분산성분을추정하는방법으로상수적합법으로불리우는 Henderson 방법 III 을적용하기로한다. Henderson 방법 III 은혼합모형에서모형의적합을이용하여분산성분을구하는방법을제공하므로모 형의적합방식으로부터유도되는사영행렬을이용한사영분석이가능하게된다. 고정효과의사영분석 에관한논의는 Choi (2012) 에서보여진다. 3. 확률효과의분산성분모형 식 (2.4) 의잔차모형은처리구조내확률요인에따른분산성분을구하기위한확률모형으로이용된다. 확률효과모형의분산성분에대한논의는 Choi (2011) 에서보여진다. 처리구조내고정요인과확률요인 들의주효과와교호작용에따른 k 개분산성분에대한잔차확률모형식은 r = k (I XX )Q i δ i + ϵ δ (3.1) i=1 = (I XX )Q 1 δ 1 + (I XX )Q 2 δ 2 + + (I XX )Q k δ k + ϵ δ 로표현된다. 단, ϵ δ = r j=1 (I XX )W jν j + (I XX )ϵ 이다. k = 1 이고 r = 1 일때식 (3.1) 은처리구조내단일의확률성분을갖는분할구실험에서의확률모형으로주어진다. 잔차벡터를 r 1 이라두 면분할구의주구 (whole plot) 와세구 (subplot) 의오차항들을포함하는잔차모형식은 r 1 = (I XX )y = (I XX )Q 1 δ 1 + (I XX )W 1 ν 1 + (I XX )ϵ (3.2) 로표현된다. 식 (3.2) 에서 ν 는주구간의변이를나타내는오차벡터이고 ϵ 은세구간의변이를나타내 는오차벡터이다. 이들오차벡터들은처리구조에포함된확률요인의수준효과벡터와는독립인것으로 간주한다. 이때확률효과벡터 δ 1 의분산성분 σ 2 δ 1 을구하기위한모형식은 r 1 = (I XX )Q 1 δ 1 + ϵ δ1 = X Q δ 1 + ϵ δ1 (3.3) 이다. 단, X Q = (I XX )Q 1 이고 ϵ δ1 = (I XX )W 1 ν 1 + (I XX )ϵ 이다.

338 Jaesung Choi 4. 분할구의분산성분모형분할구의실험계획으로부터발생하는변동요인으로주구의변이와세구의변이를예상할수있다. 처리구조에포함되는처리요인들과는별도로서로다른크기의실험단위를나타내는주구와세구는변동을나타내는요인들로간주되고실험단위들간의변이는주구오차와세구오차로가정된다. 주구요인의분산성분을구하기위한모형은식 (3.3) 으로부터확률효과벡터 δ 1 을적합시킨잔차벡터를 r δ 라두면 r δ = (I X Q X Q)r 1 (4.1) 이다. r δ 를이용한주구요인의확률모형은 r δ = (I X Q X Q)r 1 = (I X Q X Q)(I XX )y = (I X Q X Q)(I XX )(Xβ + Q 1 δ 1 + W 1 ν 1 + ϵ) = (I X Q X Q)(I XX )W 1 ν 1 + ϵ ν1 = X W ν 1 + ϵ ν1 (4.2) 이다. 단, X W = (I X QX Q )(I XX )W 1 이고 ϵ ν1 = (I X QX Q )(I XX )ϵ이다. 주구의확률벡터에의존하지않는잔차벡터를 r ν1 이라둘때 r ν1 은세구의분산성분을구하기위한확률모형을제공한다. 주구의확률효과에종속되지않는잔차벡터 r ν1 을이용한세구의분산성분에대한확률모형은 r ν1 = (I X W X W )r δ = (I X W X W )(X W ν 1 + ϵ ν1 ) = (I X W X W )(I X QX Q)(I XX )ϵ = (I XX X QX Q X W X W )ϵ = X ϵϵ (4.3) 이다. 단, X ϵ = (I XX X QX Q XW X W ) 이다. 5. 확률요인의사영제곱합사영에근거한분산성분을추정하기위한방법으로적률법을이용할때확률요인의변동을나타내는제곱합은상수적합법에의해계산된다. 적률법을적용하기위해변동요인에따른제곱합과제곱합의기댓값이요구된다. 상수적합법은변동요인에따른제곱합의계산을위해비교되는모형들의적합에서구해지는축소제곱합 (reduction in sums of squares) 을이용한다. 반면에사영제곱합은분산성분을얻기위한잔차확률모형의모형행렬을이용하여변동요인의제곱합을구한다는점에서차이가있다. 확률요인의분산성분 σδ 2 1 을구하기위한모형식 (3.3) 으로부터사영제곱합은 δ 1 의계수행렬 X Q 로의사영에의해구해진다. 사영은 X Q X Q r 1이므로사영제곱합은 r 1X Q X Q r 1으로구해진다. 주구오차에따른분산성분의사영제곱합은식 (4.2) 의확률벡터 ν 1 의계수행렬 X W 로의사영을이용하여구한다. X W 로의사영은 X W X W r δ이고사영제곱합은 r δx W X W r δ로구해진다. 식 (4.3) 을이용하여오차벡터의분산성분 σϵ 2 의사영제곱합을구할수있다. ϵ에따른사영제곱합은 r ν 1 X ϵx ϵ r ν1 으로구해진다. 확률요인들의변동량을사영제곱합으로구한후이들제곱합의기댓값을구해적률법으로분산성분들을추

Projection analysis for split-plot data 339 정하게된다. 확률요인의제곱합의기댓값은분산성분들의선형함수로주어지고분산성분들의계수는 Hartley (1967) 의합성법을이용하여구한다. 적률법에의해분산성분을추정하기위한방정식들은 r 1X Q X Qr 1 = k 1δ σ 2 δ + k 2δ σ 2 ν + k 3δ σ 2 ϵ r δx W X W r δ = k 1ν σ 2 δ + k 2ν σ 2 ν + k 3ν σ 2 ϵ r ν 1 X ϵ X ϵ r ν1 = k 1ϵ σ 2 δ + k 2ϵ σ 2 ν + k 3ϵ σ 2 ϵ (5.1) 로주어진다. y = Xβ + Qδ + W ν + ϵ 으로표현될때 y 의 Var(y) 을 Σ 라두자. Σ = σ 2 δqq + σ 2 νw W + σ 2 ϵ (5.2) 이다. 식 (5.1) 의확률벡터 δ에따른제곱합 r 1X QX Qr1의기댓값을 EQ라두면 E Q = E(r 1X QX Qr 1) = tr [ (I XX )X Q X Q(I XX ) ( σ 2 δqq + σ 2 νw W + σ 2 ϵ I )] = σ 2 δtr(q Q P Q) + σ 2 νtr(w Q P W ) + σ 2 ϵ tr(q P ) = k 1δ σ 2 δ + k 2δ σ 2 ν + k 3δ σ 2 ϵ (5.3) 단, Q P = (I XX )X Q X Q (I XX ) 이다. k 1δ = tr(q Q P Q), k 2δ = tr(w Q P W ) 이고 k 3δ = tr(q P ) 를나타낸다. 식 (5.1) 의확률벡터 ν 에따른제곱합 r δx W X W r δ 의기댓값을 E W 라두면 E W = E(r δx W X W r δ ) = tr [ (I XX X Q X Q)X W X W (I XX X Q X Q)(σ 2 δqq + σ 2 νw W + σ 2 ϵ I) ] = σ 2 δtr(q W P Q) + σ 2 νtr(w W P W ) + σ 2 ϵ tr(w P ) = k 1ν σ 2 δ + k 2ν σ 2 ν + k 3ν σ 2 ϵ (5.4) 단, W P = (I XX X QX Q )XQX Q (I XX X QX Q ) 이다. k1ν = tr(q W P Q), k 2ν = tr(w W P W ) 이고 k 3ν = tr(w P ) 를나타낸다. 식 (5.1) 의확률벡터 ϵ 에따른제곱합 r ν 1 X ϵx ϵ r ν1 의 기댓값을 E R 라두면 E R = E(r ν 1 X ϵx ϵ r ν1 ) = tr [ (I XX X QX Q X W X W )X ϵx ϵ (I XX X QX Q X W X W ) ( σ 2 δqq + σ 2 νw W + σ 2 ϵ I )] = σ 2 δtr(q R P Q) + σ 2 νtr(w R P W ) + σ 2 ϵ tr(r P ) = k 1ϵ σ 2 δ + k 2ϵ σ 2 ν + k 3ϵ σ 2 ϵ (5.5) 단, R P = (I XX X Q X Q X W X W )X QX Q (I XX X Q X Q X W X W ) 이다. k 1ϵ = tr(q R P Q), k 2ϵ = tr(w R P W ) 이고 k 3ϵ = tr(r P ) 를나타낸다. 6. 고정효과의추정가능함수식 (2.2) 의모수벡터 β의한함수 a β가추정가능함수이면 β의추정량 ˆβ 을이용하여 a β에대한추론을행할수있다. 단, a는 p 1인상수벡터이다. a β의추정가능성은 a = X Xr (6.1)

340 Jaesung Choi Table 7.1. Data for tensile strength of paper Block Method Temperature 200 225 250 275 1 1 30 35 37 36 1 2 34 41 38 42 1 3 29 26 33 36 2 1 28 32 40 41 2 2 31 36 42 40 2 3 31 30 32 40 3 1 31 37 41 40 3 2 35 40 39 44 3 3 32 34 39 45 로부터벡터 r 의존재로확인하거나 a = X Xa (6.2) 를확인함으로서알수있다. X X 는모형행렬 X 의행벡터들로구성되는벡터공간으로의사영핼렬 을나타내므로행공간으로의사영행렬을이용하여추정가능성을확인할수있다는것을의미하고있다. β 의추정량 ˆβ 으로 ˆβ = 를이용하면 a ˆβ 의분포는평균과분산이 ( X ˆΣ 1 X ) X ˆΣ 1 y (6.3) E(a ˆβ) = a β 인정규분포를근사적으로따른다. 표본이충분히큰경우에 Var(a ˆβ) = a ( X ˆΣ 1 X ) a (6.4) a ˆβ a β Z = ( ) (6.5) a X ˆΣ 1 X a 는 N(0, 1) 인분포를근사적으로따르므로추정가능함수 a β 의추론에이용된다. 7. 자료분석의예 Table 7.1은 Montgomery (1976) 의분할구실험에대한자료예이다. 제지업자가제지의강도에영향을미치는두요인들의효과를조사하기위해세수준의펄프준비방법과네수준의공정온도에서실험한자료이다. 소규모시험설비 (pilot plant) 는두요인들의수준결합에서하루에 1회가능하므로삼일간에걸쳐 3회반복된실험자료이다. 반복은블록으로간주되고방법과온도는고정요인이나세수준의방법은큰실험단위인주구의펄프배취에임의로배정되고작은실험단위인세구에각방법에의해생산된펄프배취를 4개의표본으로나누어임의로실험온도에배정하여생산된제지의인장강도 (tensile strength) 자료를얻게된다. 블록 i와방법 j 그리고온도 k에서실험단위의반응을 y ijk 라두면 y ijk = µ + δ i + β j + ν ij + γ k + (δγ) ik + (βγ) jk + ϵ ijk (7.1)

Projection analysis for split-plot data 341 로표현된다. 단, µ 는평균이고 δ i 는블록 i의수준효과이며 β j 는방법 j의수준효과를나타낸다. 여기서 i, j = 1, 2, 3이다. γ k 는온도 k의수준효과이고 (δγ) ik 와 (βγ) jk 는교호작용을나타낸다. ν ij 는주구오차이고 ϵ ijk 는세구오차를나타낸다. 단, k = 200, 225, 250, 275이다. 블록효과 δ i 는 N(0, σb 2 ), ν ij 는 N(0, σw), 2 (δγ) ik 는 N(0, σbt) 2 이고 ϵ ijk 는 N(0, σϵ 2 ) 을가정하며또한이들확률효과는서로독립이라고가정하게된다. 4개의분산성분중두개는분할구실험에서실험단위의크기와관련된오차들로주구오차와세구오차이다. 분산성분들을사영에의해구하기위한첫단계로식 (2.1) 과같은행렬표현의모형식을생각한다. 행렬표현식은 y = jµ + Q b δ + X mβ + W ν + X tγ + Q bt (δγ) + X mt(βγ) + ϵ (7.2) 이다. 식 (7.2) 를고정부분과확률부분으로분리하여표현하면 y = jµ + X m β + X t γ + X mt (βγ) + Q b δ + W ν + Q bt (δγ) + ϵ (7.3) 이다. 식 (7.3) 의고정부분은 jµ+x m β+x t γ+x mt (βγ) 이고확률부분은 Q b δ+w ν+q bt (δγ)+ϵ이다. 분산성분을추정하기위한모형은식 (7.3) 의고정효과부분을적합시켜구해지는잔차에대한확률모형이다. 잔차모형식은 r = (I XX )y = (I XX )(Q b δ + W ν + Q bt (δγ) + ϵ) (7.4) 이다. 단, X = (j, X m, X t, X mt ) 이다. 식 (7.4) 로부터확률효과벡터 δ의분산성분을추정하기위한모형은 r = (I XX )Q b δ + ϵ δ = X b δ + ϵ δ (7.5) 이다. 단, X b = (I XX )Q b 이다. δ에따른변동량의계산은식 (7.5) 의모형행렬 X b 로의사영을이용하여구한다. 사영은 X b X b r이다. δ에따른변동량을 SS b라두면 r X b X b r로구해지고 SS b = 77.55556이다. 주구오차벡터 ν의분산성분을추정하기위한모형은식 (7.5) 의적합에서구해진잔차벡터를 r δ 라두면 r δ = (I XX X b X b )W ν + ϵ δ = X w ν + ϵ δ (7.6) 이다. 단, X w = (I XX X b X b )W 이다. δ에따른변동량은식 (7.6) 의모형행렬 Xw로의사영을이용하여구한다. X w 로의사영은 X w X wr δ 이다. δ에따른변동량을 SS w 라두면 r δx w X wr δ 로구해지고 SS w = 36.27778이다. 식 (7.6) 의잔차벡터를 r ν 라둘때교호작용의분산성분 σδγ 2 과관련된제곱합 SS bt 를구하기위한잔차모형은 r ν = (I XX X b X b X w X w)q bt (δγ) + ϵ ν = X bt (δγ) + ϵ ν (7.7)

342 Jaesung Choi 이다. 단, X bt = (I XX X b X b X wx w)q bt 이다. X bt 로의사영은 X bt X bt r ν이므로변동량 SS bt 는사영제곱합 r νx bt X btrν에의해 20.66667로구해진다. 세구오차에따른제곱합을 SSe로나타낼때 SS e = 50.83333로구해짐을알수있다. 네개의분산성분들과관련된제곱합이각벡터부분공 간으로의사영에의하여구해졌기때문에적률법에의한분산성분을추정하기위해 Hartley (1967) 의 합성법으로분산성분의계수를추정한다. 식 (7.2) 의분산성분을구하기위한방정식들은 로주어지고분산성분의추정값들은 SS b = 24σ 2 δ + 8σ 2 ν + 6σ 2 (δγ) + 2σ 2 ϵ, SS w = 16σ 2 ν + 4σ 2 ϵ, SS bt = 18σ 2 (δγ) + 6σ 2 ϵ, SS e = 12σ 2 ϵ (7.8) ˆσ 2 δ = 2.5416667, ˆσ 2 ν = 1.2083333, ˆσ 2 (δγ) = 0.2638889, ˆσ 2 ϵ = 4.2361111 (7.9) 로구해진다. ˆσ 2 (δγ) 이음수이므로분산성분은 0 으로추정된다. 식 (2.3) 으로부터 ˆΣ 은 이다. 식 (6.2) 의조건을만족시키는 a 로 ˆΣ = ˆσ 2 δq b Q b + ˆσ 2 νw W + ˆσ 2 (δγ)q bt Q bt + ˆσ 2 ϵ I (7.10) a = (0.4, 0.4, 0.4, 0.4, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1) (7.11) 라두면 a ˆβ = 14.7 로구해진다. Var(a ˆβ) = 0.1694444 로추정된다. 8. 결론본논문은분할구의실험자료분석에서실험단위의크기에따른추가적인오차항외에처리들의효과에확률효과가포함될때혼합모형의가정하에서사영분석하는방법을논의하였다. 사영분석의결과는기존의분산분석에따른결과와동일함을보였다. 다시말하면, 사영분석또한자료의분산분석에이용될수있는한방법임을입증하고있다. 사영을이용할때, 변동요인에따른변동량의계산을위한모형구축과모형적합을구체적으로논의하였다. 잔차벡터에대한확률모형의모형적합을통해분산성분의추정을위한변동요인의변동량을사영으로구할수있음을나타내었다. 즉변동량은변동요인과관련된벡터부분공간으로의사영으로구할수있음을다루었다. 또한변동요인의제곱합에대한기댓값계산에 Hartley의합성법을논의하였다. 그리고고정효과의추정가능함수에대한추정방법으로가중최소제곱법을이용하였고추정량의분산에대한추정치의계산과정도구체적으로다루었다. References Choi, J. S. (2011). Variance components in one-factor random model by projections, Journal of the Korean Data & Information Science Society, 22, 381 387. Choi, J. S. (2012). Type II analysis by projections, Journal of the Korean Data & Information Science Society, 23, 155 1163. Graybill, F. A. (1983). Matrices with Applications in Statistics, Wadsworth Publishing Company, Belmont.

Projection analysis for split-plot data 343 Hartley, H. O. (1967). Expectations, variances and covariances of ANOVA mean squares by synthesis, Biometrics, 23, 105 114. Henderson, C. R. (1953). Estimation of variance and covariance components, Biometrics, 9, 226 252. Johnson, R. A. and Wichern, D. W. (1988). Applied Multivariate Statistical Analysis (2nd ed), Prentice Hall, Inc., Englewood Cliffs. Milliken, G. A. and Johnson, D. E. (2009). Analysis of Messy Data, Van Nostrand Reinhold, New York. Montgomery, C. D. (1976). Design and Analysis of Experiments, John Wiley and Sons, New York. Searle, S. R. (1971). Linear Models, John Wiley and Sons, New York. Searle, S. R., Casella, G., and McCulloch, C. E. (1992). Variance Components, John Wiley and Sons, New York.

344 Jaesung Choi 분할구자료의사영분석 최재성 a,1 a 계명대학교통계학과 (2016 년 12 월 5 일접수, 2017 년 4 월 1 일수정, 2017 년 4 월 1 일채택 ) 요약본논문은분할구실험으로부터주어진자료분석을위해사영을이용하는방법을다루고있다. 분할구실험의특성으로서로다른크기의실험단위를나타내는오차항과처리에포함된확률효과가존재할때이들분산성분의추정에사영을이용하여구하는방법을제시하고있다. 분산성분추정을위해잔차벡터에대한확률모형의구축을다루고있다. 고정효과를제외한확률효과에따른제곱합의계산을위해상수적합법이적용되고있다. 적률법에의한분산성분추정을위해변동량의기댓값계산에합성법을이용한다. 고정효과들의선형함수로주어지는추정가능함수에관한추정을다루고있다. 주요용어 : 분할구실험, 분산성분, 사영, 상수적합법, 추정가능함수. 1 (42601) 대구광역시달서구달구벌대로 1095, 계명대학교통계학과. E-mail: jschoi@kmu.ac.kr