생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

Similar documents
Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt

슬라이드 1

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

Microsoft Word - SAS_Data Manipulate.docx

R t-..

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

Vector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표

G Power

statistics

의학연구자료의 생존분석

메타분석: 통계적 방법의 기초

Microsoft PowerPoint - chap_2_rep.ppt [호환 모드]

<BCF6BFE4B0ADB4DC322E687770>

177

(001~006)개념RPM3-2(부속)

1 1 x + # 0 x - 6 x 0 # x # 2r sin2x- sin x = 4cos x r 3 r 2r 5 r 3r

Microsoft PowerPoint - SBE univariate5.pptx

의학연구자료의 생존분석

수리통계학

<C5F0B0E82D313132C8A328C0DBBEF7BFEB292E687770>


제장 2 비모수 검정(NONPARAMETRIC ANALYSIS) ③ 연구자는 SPSS 출력결과에서 유의확률을 확인하여 귀무가설(H0 )의 기각, 채택 여부를 결정한다. 예를 들어 연구자가 연구자료의 정규성을 검정하기 위하여 유 의수준을 α = 0.05로 설정하고 SPS

모수검정과비모수검정 제 6 강 지리통계학


모수 θ의 추정량은 추출한 개의 표본값을 어떤 규칙에 의해 처리를 해서 모수의 값을 추정하는 방법입니다. 추정량에서 사용되는 규칙은 어떤 표본을 추출했냐에 따라 변하는 것이 아닌 고정된 규칙입니다. 예를 들어 우리의 관심 모수가 모집단의 평균이라고 하겠습니다. 즉 θ

FGB-P 학번수학과권혁준 2008 년 5 월 19 일 Lemma 1 p 를 C([0, 1]) 에속하는음수가되지않는함수라하자. 이때 y C 2 (0, 1) C([0, 1]) 가미분방정식 y (t) + p(t)y(t) = 0, t (0, 1), y(0)

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은


제 3 장평활법 지수평활법 (exponential smoothing) 최근자료에더큰가중값, 과거로갈수록가중값을지수적으로줄여나가는방법 시스템에변화가있을경우변화에쉽게대처가능 계산이쉽고많은자료의저장이필요없다 예측이주목적단순지수평활법, 이중지수평활법, 삼중지수평활법, Wint

PowerPoint 프레젠테이션

Communications of the Korean Statistical Society Vol. 15, No. 4, 2008, pp 국소적 강력 단위근 검정 최보승1), 우진욱2), 박유성3) 요약 시계열 자료를 분석할 때, 시계열 자료가 가지고 있는

Minimax lower bound 이광민 May Notation 모수공간 : Θ Action space : A Loss function : L : Θ A [0, ) Sample space : X Data : X P θ (Probability measure


-주의- 본 교재는 최 상위권을 위한 고난이도 모의고사로 임산부 및 노약자의 건강에 해로울 수 있습니다.

<근대이전> ⑴ 문명의 형성과 고조선의 성립 역사 학습의 목적, 선사 문화의 발전에서 국가 형성까지를 다룬다. 역사가 현재 우리의 삶과 긴밀하게 연결되었음을 인식하고, 역사적 상상력을 바탕으 로 선사 시대의 삶을 유추해 본다. 세계 여러 지역에서 국가가 형성되고 문 명


슬라이드 1

100, Jan. 21, 호, Jan. 21, , Jan. 21, 2005

<5BB0EDB3ADB5B55D B3E2B4EBBAF12DB0ED312D312DC1DFB0A32DC0B6C7D5B0FAC7D02D28312E BAF2B9F0B0FA20BFF8C0DAC0C720C7FCBCBA2D D3135B9AEC7D72E687770>

낙랑군

= Fisher, I. (1930), ``The Theory of Interest,'' Macmillan ,

untitled

= " (2014), `` ,'' .." " (2011), `` ,'' (.)"


Microsoft PowerPoint - IPYYUIHNPGFU

<B4EBC7D0BCF6C7D02DBBEFB0A2C7D4BCF62E687770>

밝은세상 10호 내지 0625

용역보고서


근대문화재분과 제4차 회의록(공개)

용역보고서

PowerPoint 프레젠테이션

문제지 제시문 2 보이지 않는 영역에 대한 정보를 얻기 위하여 관측된 다른 정보를 분석하여 역으로 미 관측 영역 에 대한 정보를 얻을 수 있다. 가령 주어진 영역에 장애물이 있는 경우 한 끝 점에서 출발하여 다른 끝 점에 도달하는 최단 경로의 개수를 분석하여 장애물의

untitled

장1 확률공간(Probability Space), 확률변수(Random Variable) 보기 명이 동시에 동전 1개를 던지는 실험을 생각하자. 떨어진 동전이 더이상 움직 이지 않으면, 앞면인지 뒷면인지를 확인하다. 이 시험결과를 어떻게 정리할까? 바닥

Microsoft PowerPoint - PDF3 SBE pptx

실사구시학파의 실증적 학풍이 일어나므로 서구적인 과학사상의 유입을 본 것 등이 인식 의 대상이 될 것이다. 그러나 이조 봉건사회 최종의 절대적 왕권주의자 대원군에 의하여 그 싹은 잘리고 말았다. 따라서 다단한 전기가 될 근대적 개방에 의하여 재건하려던 서구적 교육 즉


01

= ``...(2011), , (.)''

= Fisher, I. (1930), ``The Theory of Interest,'' Macmillan ,

확률 및 분포

¿¬±¸ÃѼ� 3±Çc03ÖÁ¾š

슬라이드 1

제 5 장복소수함수적분 5 이므로 z = r(cosθ + i sin θ) = re iθ (5.3) 와같이나타낼수도있는데이표현식을복소수의 극형식 (polar form) 이라부른다. 복소함수의미분은실함수미분의정의와같이 d f(z + z) f(z) f(z) = lim z z


REVIEW CHART 1

한국통계학회논문집 2009, 16권, 4호, 영상에서 윈도우 배치에 따른 통계적 에지검출 비교 임동훈 1,a a 경상대학교 정보통계학과 요약 본 논문에서는 영상의 에지검출을 하는데 사용되는 여러 가지 윈도우 배치(window configurations)하

Microsoft Word - EDA_Univariate.docx

<BAF9C7D8BFEEC7D7BCB1B9DA20C1F6C4A728B1B9B9AE292E687770>

16중등빨이수학3-2교부(01~23)

제 12강 함수수열의 평등수렴

04 Çмú_±â¼ú±â»ç


PowerPoint 프레젠테이션

고객관계를 리드하는 서비스 리더십 전략

Microsoft Word - SPSS_MDA_Ch6.doc

수리 영역 가 형 5. 다음 그림과 같이 크기가 같은 정육면체 개가 한 모서리씩을 공유하 면서 각 면이 평행 또는 수직 관계를 유지한 채로 한 평면 위에 놓여있 다. 그림의 세 꼭짓점 A, B, C에 대한 두 벡터 BA 와 BC 가 이루는 각 의 크기를 h라 할 때,

... —... ..—

<C3D6C0E7C3B528BAB8B5B5C0DAB7E1292D322E687770>

31. 을전개한식에서 의계수는? 를전개한식이 일 때, 의값은? 을전개했을때, 의계수와상수항의합을구하면? 을전개했을때, 의 계수는? 를전개했을때, 상수항을 구하여라. 37

수리영역 5. 서로다른두개의주사위를동시에던져서나온두눈의수의곱 이짝수일때, 나온두눈의수의합이 또는 일확률은? 5) 의전개식에서상수항이존재하도록하는모든자 연수 의값의합은? 7) 다음순서도에서인쇄되는 의값은? 6) 8. 어떤특산

미분기하학 II-16 복소평면의선형분수변환과쌍곡평면의등장사상 김영욱 (ÑñÁ) 강의양성덕 (zû ) 의강의록 Ø 'x! xxñ 2007 년 김영욱 (ÑñÁ) 강의양성덕 (zû ) 의강의록 (Ø 'x!) 미분기하 II 2007 년 1 / 26

PowerPoint 프레젠테이션

세계 비지니스 정보

ANOVA 란? ANalysis Of VAriance Ø 3개이상의모집단의평균의차이를검정하는방법 Ø 3개의모집단일경우 H0 : μ1 = μ2 = μ3 H0기각 : μ1 μ2 = μ3 or μ1 = μ2 μ3 or μ1 μ2 μ3 àpost hoc test 수행

<3235B0AD20BCF6BFADC0C720B1D8C7D120C2FC20B0C5C1FE20322E687770>

<4D F736F F D B1B9B9AE32C6C7B0E6B7AEC6C7BAA3C5B82E646F63>

MS_적분.pages

Microsoft PowerPoint - LN05 [호환 모드]


0 cm (++x)=0 x= R QR Q =R =Q = cm =Q =-=(cm) =R =x cm (x+) = +(x+) x= x= (cm) =+=0 (cm) =+=8 (cm) + =0+_8= (cm) cm + = + = _= (cm) 7+x= x= +y= y=8,, Q

자료의 이해 및 분석

R

(Microsoft PowerPoint - Ch21_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345])

Microsoft Word - Ch2_Function_math.docx

슬라이드 1


<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

Probabilistic graphical models: Assignment 3 Seung-Hoon Na June 7, Gibbs sampler for Beta-Binomial Binomial및 beta분포는 다음과 같이 정의된다. k Bin(n, θ):

Transcription:

생존분석의 추정과 비교 : 보충자료 이용희 December, 8 Cotets 생존함수와 위험함수. 생존함수와 위험함수....................................... 예제: 지수분포.......................................... 예제: 와이블분포......................................... 모수의 최대가능도 추정.................................... 생명표방법을 이용한 생존함수 추정 누적한계추정법에 의한 생존함수 추정 6 비모수적 방법을 이용한 생존함수의 비교. 분할표에서 두 비율의 비교................................ 코크란-맨텔-핸젤 검정..................................... 8. 비모수적 방법을 이용한 생존함수의 비교.......................... 9

생존함수와 위험함수. 생존함수와 위험함수 확률변수 T를 생존시간이라고 하고 f (t)를 확률밀도함수라고 하자. T의 누적분포함수(cumulative distributio fuctio; CDF)는 다음과 같이 정의된다. F (t) P( T t) Z t f (t)dt 또한 생존함수(Survival fuctio)은 다음과 같이 정의된다. S(t) P( T > t) F (t) 위험함수(hazrd fuctio)의 정의는 다음과 같으며 만약 생존시간이 t 보다 클때 바로 사망할 확률을 의미하며 순간위험율이다.. h(t) lim dt P(t < T t + dt T t) dt f (t) S(t) 생존함수와 위험함수는 다음과 같은 관계를 가지고 있다. f (t) S(t) f (t) F (t) log[ F (t)] t log S(t) t h(t) 따라서 다음의 관계가 성립힌다. S(t) exp[ H (t)] 여기서 H (t) Z t 이며 H (t)를 누적위험함수라고 한다. h(t)dt

. 예제: 지수분포 만약 생존시간 T가 지수분포(Expoetial distributio)을 따른다고 하자. f (t; λ) λe λt 위에서 λ 는 흔히 사망률, 실패율(failure rate)라고 부르며 E( T ) /λ이다. 생존함수(survaival fuctio)와 위험함수(hazard fuctio)은 다음과 같이 주어진다. 만약 생존시간이 지수분포를 따른다면 위험함수는 상수 λ 이므로 S(t) P( T > t) P( T t) Z t λe λt ( e λt ) e λt h(t) f (t) S(t) λe λt /e λt λ 누적위험함수는 아래와 같다. H (t) Z t h(t)dt λt. 예제: 와이블분포 만약 생존시간이 와이블 분포(Weibull distributio)를 따른다면 확률밀도함수는 다음과 같다. " # t λ λtλ exp, f (t) θ θλ θ, λ >, t. 평균은 E( T ) θγ( + /λ) 이다. 여기서 λ 이면 지수분포가 된다. 이때 생존 함수는 다음과 같다. λ # t S(t) exp dt λ θ θ " # t λ exp. θ Z t λ λt "

또한 위험함수는 다음과 같다. f (t) S(t) h(t) h λ i exp θt h λ i exp θt λ t λ. θλ λtλ θλ 위에서 볼 수 있듯이 λ 이면 지수분포가 되고 위험함수는 상수이다. 만약에 λ > 이면 위험함수 는 시간에 따라 증가하며 λ < 이면 위험함수는 감소한다. 누적위험함수는 아래와 같다. H (t) Z t h(t)dt (t/θ )λ. 모수의 최대가능도 추정 생존시간 T, T,..., T 을 독립적으로 분포 f θ (t)에서 추출하였다고 가정하고 중도절단시간 C, C,..., C 도 독립적으로 분포 g(c)에서 추출하였다고 가정하자. 생존시간 T와 중도절단시간 C가 서로 독립이라고 가정하며 이러한 가정을 임의중도절단(radom cesorig)이라고 한다. 이제 관측한 생존시간 Xi 는 다음과 같이 정의한다. Xi mi( Ti, Ci ) i,,..., 또한 절단 표시변수 δi 는 다음과 같이 정의한다. δi Ti < Ci Ti > Ci 이제 생존시간 T의 분포 Fθ (t) 가 주어졌을 때 표본 X, X,..., X 의 가능도 함수 L 는 다음과 같이 나타낼 수 있다. L(θ; x, δ) i UC Pθ ( Ti xi ) Pθ ( Ti > xi ) i C i UC f θ ( xi ) [ Fθ ( xi )] i C 여기서 집합 UC는 실제 생존시간이 관측된 자료들, 집합 C는 중도절단된 자료을 의미한다. 모수의 최대가능도 추정은 L(θ; x, δ)를 최대로 하는 θ를 찾는 방법이다. 이제 예제로서 생존시간의 분포가 지수분포를 따른다고 가정하고 가능도함수를 구해보자.

L(λ; x, δ) Pλ ( Ti xi ) Pλ ( Ti > xi ) f λ ( xi ) [ Fλ ( xi )] i UC i UC h i C i C λe λxi iδi h e λxi i δi i λδi e λxi i λ i δi e λ i xi 이제 위의 가능도함수를 최대화하는 모수를 찾기위하여 로그가능도함수를 고려하고 i i `(λ; x, δ) log L(λ; x, δ) log λ δi λ xi 로그가능도함수를 모수 λ에 대하여 미분하고 으로 놓고 풀면 최대가능도 추정량을 구할 수 있다. δ `(λ; x, δ) i i xi λ λ i 따라서 최대가능도 추정량은 다음과 같이 주어진다. i δi i xi λ ML 만약 중도절단자료가 없다면 최대가능도 추정량은 일반적인 경우와 같이 다음과 같다. λ ML i xi 생명표방법을 이용한 생존함수 추정 시간 (, )구간을 다음과 같은 경계선을 이용하여 k + 개의 구간으로 나누었다고 가정하자. (t ) ( t, t ] ( t, t ]... ( t k, t k ] ( t k, ) 생존함수는 다음과 같은 조건부 확률의 축차식으로 구할 수 있다.

S ( ti ) p ( T > ti ) P ( T > t i T > t i ) P ( T > t i ) P ( T > t i T > t i ) P ( T > t i T > t i ) P ( T > t i ) P ( T > t i T > t i ) P ( T > t i T > t i ) P ( T > t i )... P ( T > t T > t ) P ( T > t ) 생명표방법을 이용한 생존함수 추정은 표를 이용하면 편리하다. 다음은 표를 생명표방법을 이용하여 생존함수를 추정하는 예를 보여준다. 구간 Ii 위험그룹인원수 i 사망자 수 di 중도절단 수 ci 유효인원수 i 사망율 di i 생존율 di 생존함수 추정 S (ti ) - - - - - 6 6 8 9 9 6 6... 6........6.9.9.88..6.... i 위에서 유효인원수는 다음과 같이 계산한다. ci i i 또한 생존함수의 추정식은는 조건부 확률의 축차식을 이용하여 다음과 같이 계산한다. i S (ti ) i p k k k di i 누적한계추정법에 의한 생존함수 추정 표본으로 추출한 생존시간들을 순서대로 나열한 다음 누적한계추정법은 생존함수를 다음의 식으로 추 정한다. S (t) ti t d k k δi ti t k dk k δi 다음 주어진 자료로부터 생존함수를 추정하는 방법을 알아보자. +는 중도절단된 자료를 표시한다. 9,, +, 8,,, 8+,,,,,, +,, 8,, 6+ 6

누적한계추정법은 생존함수를 다음과 같이 축차적으로 구할 수 있다. S () 9 S (9) S () 8 6 S (8) S () S () S () S (9) S () S () S (8) S () S () S () S (8).9.8..6.9..8 비모수적 방법을 이용한 생존함수의 비교. 분할표에서 두 비율의 비교 다음과 같은 분할표에서 두 비율을 비교한다고 가정하자. 처리/반응여부 반응 a c m 반응 안함 b d m 처리 과 가 서로 독립인 집단에 적용되었다면 두 집단의 반응 비율이 같다는 가설 H : p p 를 다음과 같은 통계량으로 검정할 수 있다. z p p p p ( p )(/ + / ) 위에서 p a p c p m 이 충분히 크면 귀무가설 하에서 통계량 z는 정규분포를 따르므로 z > zα/ 이면 귀무가설을 기각한다. 카이제곱 분포의 정의에 의하여 통계량 z의 제곱 χ z 은 자유도가 인 카이제곱분포를 따른다.

이때 통계량 z의 제곱은 분할표에서 동일성 검정에 대한 카이제곱 통계량(교과서 6 페이지) 과 동일하다. χ z ( ad bc) m m 만약에 귀무가설이 참이고 주변합,, m, m 가 고정되어 있다고 가정하면 첫번째 행, 첫번째 열의 값 A a의 분포는 다음과 같은 초기하분포(Hypergeometric distributio)를 따른다. P( A a) (a )(m a) (m ) 위의 초기하분포에서 A a의 기대값과 분산은 다음과 같다. E ( A) m, Var ( A) m m ( ) 따라서 다음이 성립하며 ad bc [ a E ( A)], m m ( )Var ( A) 이제 분할표에서 동일성 검정에 대한 카이제곱 통계량은 초기하분포와 다음과 같은 관계를 가진다. ( ad bc) χ z m m " a E ( A) p var ( A) #. 코크란-맨텔-핸젤 검정 교과서 - 페이지 참조 전체 자료가 다음과 같이 K 개의 분할표로 나누어 진다면 처리/반응여부 반응 k k k + 반응 안함 k k k + k+ k+ k 전체 자료에 대하여 처리의 반응률에 대한 다음과 같은 가설검정을 H : pk pk, k,,..., K vs. H : ot H 다음과 같은 코크란-맨텔-핸젤 검정 통계량(CMH 검정 통계량)으로 검정할 수 있다. 8

QCMH [ kk k kk E(k H )] kk Var (k H ) 위의 통계량에서 각 분할표에 대한 기대값과 분산은 다음과 같이 계산할 수 있다. E(k H ) k+ k+ k Var (k H ) k+ k+ k+ k+ k (k ) CMH 검정 통계량 QCMH 은 귀무가설 H 가 옳은 경우에 자유도 을 가지는 카이제곱 분포를 따른다.. 비모수적 방법을 이용한 생존함수의 비교 두 개의 독립 집단에 대하여 다음과 같이 생존시간을 관측하였다고 하자. group ( X, δ ), ( X, δ ),..., ( X, δ ) group ( X, δ ), ( X, δ ),..., ( X, δ ) 두 개의 집단에 대한 생존함수가 동일하다는 다음 가설을 고려하자. H : S 6 S H : S S 위의 가설은 두 집단의 생존시간을 모두 합쳐서 순서대로 나열하고 중도절단이 없는 자료들에서 다음과 같은 분할표를 작성한 다음 CMH-검정 통계량을 이용하여 검정할 수 있다. 처리/반응여부 사망 a c m 생존 b d m 다음과 같은 예제 자료를 고려해보자 [group ],,, 9 +, 8 [group ], 9,, +, + 두 표본을 합쳐서 순서대로 놓으면 다음과 같다. 9

,,, 9 +, 8, 9,, +, + 이제 중도절단이 없는 자료들(,,,, 8, 9, )에 대하여 각각 분할표를 작성하고 CMH검정 통계량을 계산할 수 있다. 각 분할표와 관련 통계량을 다음과 같은 표로 정리할 수 있다. X 8 9 9 8 6 m a E ( A)...8.. a E ( A)..6.6 -..8 m m / ( ) /..69..89.6 이제 다음과 같이 CMH 통계량을 계산할 수 있다. CMH χ [ ( a E ( A))] [m m /( )][ / ] 여기서 (a E ( A)). +.6 +.6. +.8. [m m /( )][ / ] ()(.) + ()(.69) + ()(.) + ()(.89) + ()(.6) + ()() + ()(). 따라서 CMH χ (.).96. 유의수준 α.에서 χ (,.9).89 <.96이므로 H 를 기각한다. 즉 두 집단의 생존 함수는 같지 않다.