종설 J Korean Neurol Assoc / Volume 24 / October, 2006 뇌졸중임상시험에서치료결과의측정및효과판정 인제대학교의과대학신경과학교실, 임상연구센터 홍근식 Outcome Measure and Efficacy Analysis in Stroke Clinical Trials Keun-Sik Hong, M.D., Ph.D. Department of Neurology, Clinical Research Center, Inje University College of Medicine, Ilsan, Korea In clinical trials, treatment response should be assessed with appropriate outcome measure and analytic methods. Selection of outcome measure is dependent on the characteristics of subjects and given therapy. For stroke prevention trials, the usual outcome measure is the composite of clinical events such as non-fatal stroke, non-fatal myocardial infarction, or vascular death. On the other hand, for acute stroke trials, stroke severity and functional outcome are essential outcome measures. Neuroimaging is an emerging tool of outcome measure as well as a means of optimizing patient selection in stroke trials. For the analysis of therapeutic efficacy, measured outcomes were usually dichotomized to good or bad according to arbitrary criteria. Although this approach makes the result of clinical trials easy to interpret, it may have the great chance of missing the clinically important, but modest therapeutic efficacy. To overcome this disadvantage, new analytic strategies such as sliding dichotomy and shift analysis have been proposed. Understanding of outcome measures and analytic methods is important to interpret or design the stroke clinical trials. J Korean Neurol Assoc 24(5):411-420, 2006 Key Words: Stroke, Clinical trial, Outcome measure, Analysis 서 론 특정치료법의효과를검증하기위한임상시험은임상연구의가장중요한분야이다. 뇌졸중분야에서는 1960 년대혈전용해술, 1 1970 년대항응고제와스테로이드의치료효과에대한임상시험이있었다. 2,3 1990 년대이후뇌졸중병태생리에대한연구의발전으로인하여임상시험이급격히늘어나고있는데, NINDS (National Institute of Neurological Disorders and Stroke) 의 t-pa 연구결과는급성기허혈성뇌졸중치료의가장중요한전환점을마련하였다. 4 *Keun-Sik Hong, M.D., Ph.D. Department of Neurology, Clinical Research Center, Ilsan Paik Hospital, Inje University College of Medicine 2240 Daewha-dong, Ilsanseo-gu, Goyang-si, Gyeonggi-do, 411-706, Korea Tel: +82-31-910-7680 Fax: +82-31-910-7368 E-mail: nrhks@ilsanpaik.ac.kr * 본연구는보건복지부보건의료기술진흥사업의지원에의하여이루어진것임 (A06-0171-B51004-06N1-00010A). 임상시험에서치료법의효과를적절하게검증하기위해서는치료결과의측정방법 (outcome measure) 선정이중요하다. 뇌졸중분야의임상시험은크게 뇌졸중예방 (stroke prevention trial) 과 급성기뇌졸중치료 (acute stroke trial) 로구분된다. 뇌졸중예방분야의임상시험은뇌졸중재발, 다른심혈관계질환의발생 (cardiovascular events), 또는심혈관계사망 (cardiovascular death) 등을측정하여치료효과를분석하므로, 다른심혈관계질환분야의임상시험과큰차이가없다. 그러나급성기뇌졸중치료의주목적은신경학적장애와기능적장애의개선이므로, 이분야의임상시험은이러한장애를정확히측정하는것이필수적이다. 또한자기공명영상법과같은신경영상법을대리표지자 (surrogate marker) 로이용하여치료결과를평가하는것도뇌졸중임상시험분야의또다른특징이다. 최근에는초급성기뇌졸중환자들에게자기공명영상법을신속하게시행할수있는병원들이늘어나, 급성기뇌졸중임상시험에중요한방법으로활용되고있다. 치료결과를측정한후치료효과를판정하는기준선정은매우중요하다. 심혈관계질환의예방효과를검증하는임상시험 J Korean Neurol Assoc Volume 24 No. 5, 2006 411
홍근식 은질환의발생유무자체가측정변수이자효과판정의기준이되므로비교적간단하지만, 급성기뇌졸중임상시험의경우는간단하지않다. 예를들어혈전용해술의효과를검증하려면, 어느정도의신경학적또는기능적장애가감소되어야효과가있다고판정할것인지, 그리고판정하는시기를언제로정할것인지에대한결정이필요하다. 동일한측정방법을이용하더라도효과판정의기준은대상환자와치료법에따라결정된다. National Institute of Health Stroke Scale (NIHSS) 이나 modified Rankin Scale (mrs) 로환자의상태를평가하더라도, 극적인신경학적호전을기대하는혈전용해술과뇌손상의범위를줄이고자하는신경보호치료법은효과를판정하는기준이달라야한다. 또한같은혈전용해술치료라하더라고치료대상의중증도에따라효과를판정하는기준을다르게적용하는것이치료효과를바르게평가할수있을것이다. 본종설은최근뇌졸중임상시험에서사용되고있는치료결과의측정및효과판정방법에대하여소개함으로써, 뇌졸중임상시험의결과들을이해하는데도움이되고, 또한임상시험을계획하는연구자들에게도참고가되기를기대한다. 1 차및 2 차유효성평가항목 (PRIMARY AND SECONDARY END POINT OR OUTCOME) 최근에시행되고있는대부분임상시험들은 1차유효성평가항목과 2차유효성평가항목을구분하고있다. 1차유효성평가항목은임상시험을통해최우선적으로검증하고자하는항목으로, 연구를설계 (design) 할때가장먼저결정된다. 2차유효성평가항목에는해당임상시험에서검증이가능하고임상적으로중요한항목들이포함된다. 임상시험에는수많은비뚤림 (bias) 이개입된다. 좋은임상시험은설계단계에서비뚤림이개입될소지를미리차단하는것이중요하지만, 환자를대상으로하는임상시험에서비뚤림을완벽하게차단하는것은실제적으로불가능하다. 따라서 1차유효성평가항목을검증하는데비뚤림개입이최소화되도록연구가설계되며, 연구대상자수도 1차유효성평가항목을적절하게검증하기위해산출된다 (sample size calculation). 따라서 2차유효성평가항목은이러한조건들을충분히만족시킬수없으므로그결과를해석할때유의해야한다. 이러한이유로적절한연구대상자수를대상으로시행된임상시험에서검증된 1차 Table 1. Examples of outcome measure in preventive trials Study Primary outcome Secondary outcome HOPE 9 MATCH 8 WASID 7 Composite of myocardial infarction, stroke, or death from cardiovascular causes Composite of the first occurrence of either IS(ischemic stroke), MI, vascular death or rehospitalization for an acute ischaemic event (unstable angina pectoris, worsening of PAD necessitating therapeutic intervention or urgent revascularization, and TIA) Composite of ischemic stroke, brain hemorrhage, or death from vascular causes other than stroke (1) Death from any cause (2) Need for revascularization (3) Hospitalization for unstable angina or heart failure (4) Complications related to diabetes (whether or not hospitalization was required). Any one of the components of the following clusters or the following individual events: vascular death, MI or IS; vascular death; MI; vascular death or IS; any stroke; any death; non-fatal MI, or rehospitalization for an acute ischaemic event. mrs at the final Visit (1) All vascular deaths and disabling stroke (ischemic and hemorrhagic) (2) All stroke (ischemic and hemorrhagic) (3) Fatal and nonfatal ischemic stroke (4) All ischemic stroke, myocardial infarction and vascular death (5) All major systemic and any intracranial hemorrhage (6) All ischemic stroke in the territory of the stenotic intracranial artery (7) Stroke (ischemic and hemorrhagic) and vascular death (on treatment analysis). SPARCL 6 Stroke (fatal or non-fatal) (1) Cardiac death (2) Non-fatal MI (3) Unstable angina (4) Resuscitated cardiac arrest 412 J Korean Neurol Assoc Volume 24 No. 5, 2006
뇌졸중임상시험에서치료결과의측정및효과판정 유효성평가항목은 Level I (Highest level of evidence) 으로인정을받지만, 2차유효성평가항목으로검증된결과는 Level II (intermediate level of evidence) 로인정을받는다. 5 뇌졸중예방분야의임상시험판정방법 항혈소판제제, 항응고제, 항고혈압제, 또는스타틴 (statin) 등의약물이뇌졸중을비롯한심혈관계질환의발생을감소시키는지연구하는분야에해당된다. 대부분의연구들은심혈관질환발생의합 (composite of vascular event) 을 1차유효성평가항목으로사용하고있는데, 뇌졸중발생, 심근경색발생, 혈관질환으로인한사망을합쳐서 1차유효성평가항목으로정하는경우가보편적이다. 그리고뇌졸중발생, 심근경색발생, 혈관질환으로인한사망각항목들과그외의혈관질환발생이나안전성항목들을 2차유효성평가항목에포함시키는것이일반적이다. 한가지혈관질환의발생보다는심혈관질환발생의합 (composite of vascular event) 을 1차유효성평가항목으로선정하는것은합리적이다. 심혈관질환고위험환자의치료목적은뇌졸중또는개개의심혈관질환의발생만을예방하는것보다는사망을포함한여러심혈관질환의발생을동시에예방하는것이치료대상자인환자의입장에서는더중요한문제이다. 또다른이유로심혈관질환발생의합으로 1차유효성평가항목을정하면사건의발생횟수가많아지므로검증에필요한연구대상자수를줄일수있는장점이있다. 그러나뇌졸중발생을 1차유효성평가항목으로선정한 SPARCL (stroke prevention by aggressive reduction of cholesterol levels) 연구와같이, 한가지질환의발생만을 1차유효성평가항목으로선정하는경우도있다. 6 Table 1은대표적인연구들에서선정되었던유효성평가항목들이다. 6-9 뇌졸중발생등의임상적사건 (clinical event) 발생을 1차유효성평가항목으로가져가는연구는많은대상자와장기간의관찰기간이필요하여비용이매우많이든다. 신경영상등의대리표지자 (surrogate marker) 를이용하면, 비용과시간을줄일수있는장점이있다. 증상성두개내혈관협착 (Symptomatic intracranial stenosis) 이있는환자들을대상으로자기공명혈관촬영술을이용하여두약물치료군의혈관협착진행정도를비교하는연구가한예이다. 10 뇌졸중발생등의임상적사건을 1차유효성평가항목으로판정하는대규모연구에비해연구결과가제시하는영향력 (impact) 은낮은편이나적은비용으로임상적으로중요한소견을제시할수있는의의가있으며, 대규모임상시험을시행하기전단계의연구로서도가치가높다. 급성기뇌졸중임상시험의임상시험판정방법 1. 평가에이용되는척도들 급성기뇌졸중치료결과의측정방법 (outcome measure) 으로사용되기위해서는중요한조건들이있다. 첫째, 뇌졸중으로인한신경학적장애나기능적장애를잘반영해야한다. 둘째, 객관적이고표준화되어있어야한다. 따라서다른검사자가측정하거나한검사자가반복측정하였을때, 일치도와재현성이높아야한다. 이러한조건에부합되기위해서는많은연구를통한검증과정이필요하다. 셋째는측정하기쉬워야한다. 고도의의학적지식과기술, 그리고많은시간이필요한방법은임상시험에적용하기어렵다. 마지막으로보편적으로널리사용되는방법이어야한다. 아무리좋은방법이라도다른연구자들이사용하지않는경우, 인정을받을수없을뿐아니라, 비슷한다른연구들과결과를비교하기어려워진다. 최근뇌졸중임상시험에서많이사용되고있는 National Institute of Health Stroke Scale (NIHSS), modified Rankin Scale (mrs), Glasgow Outcome Scale (GOS), Barthel Index (BI) 등은이러한조건들에잘부합되는방법들이다급성기뇌졸중에대한임상시험은 1995 년 NINDS t-pa 연구의성공이후매우활발하게진행되고있다. 4 특정급성기치료의결과를측정할때, 임상적평가방법과신경영상기법등의대리표지자 (surrogate marker) 로평가하는방법이있다. 임상적평가방법에는신경학적척도 (neurological scale) 와기능적척도 (functional outcome scale) 가이용되고있다. 급성기뇌졸중치료법으로효과를인정받기위해서는, 최근에는초기효과와장기적인효과모두에대한입증이요구되고있다. 이는급성기치료가진정한효과가있다면, 초기에환자에게긍정적인반응이나타나야하며, 이러한초기효과는장기적인예후개선과연결될수있어야한다는것을의미한다. 초기효과를판정하는데에는신경학적척도가주로사용되며, 장기적인효과판정에는기능적척도 (functional outcome scale) 가주로사용된다. 초기치료효과를평가하는데가장많이사용되는방법은치료 24시간후 NIHSS 점수의변화를관찰하는것이다. 장기적인치료효과는주로 3개월후평가되는데이때많이사용되는기능적척도들로는 mrs, GOS, BI 등이있다. GOS 와 mrs 는환자의전반적인장애 (global outcome) 를반영하며, BI 는일상생활행위 (Activity of Daily Living) 를반영하는척도이다. 일부연구에서는 3개월평가에신경학적척도인 NIHSS 를같이평가하기도한다. 대부분연구에서 3개월에장기적인효과를 J Korean Neurol Assoc Volume 24 No. 5, 2006 413
홍근식 판정하는데, 뇌졸중후 3개월이지나면전체회복수준의 90% 이상에도달하기때문이다. 기능적척도를평가할때고령의환자는나이에따른기능적장애로인하여, 신경학적장애에비해기능적장애가과대평가되어급성기치료의효과가제대로반영되지못하는문제점이있을수있다. 급성기뇌졸중임상시험에서는신경영상이대리표지자로많이사용되는데, 혈전용해술후혈관조영술로재개통을판정하는방법이과거부터많이이용되었다. 최근에는자기공명영상기법이비침습적으로혈관의재개통을확인할수있을뿐아니라, 확산자기공명영상등은신경조직의손상정도와진행양상등에대한많은정보를제공할수있는장점이있다. 1) National Institute of Health Stroke Scale (NIHSS) NIHSS 은급성기뇌졸중의신경학적중증도를평가하는데가장널리이용되는방법이다. 기존에사용하던사망률이나장기적예후에대한평가만으로는급성기치료효과를평가하는데한계가있다. 급성기뇌졸중환자의신경학적중증도와그변화를객관적으로평가하기위하여개발이된것이 NIHSS 이다. NIHSS 은 1989년에 stroke 잡지에처음소개가되었고, 11 1994 년에개정판과함께영상물을이용한교육이시작되었다. 12 그동안여러연구를거쳐급성기뇌졸중중증도를잘반영할뿐아니라예후를예측하는척도로서의유효성이입증이되어, 급성기뇌졸중임상시험에서필수적인평가항목이되었다. 13-16 NIHSS 은 15개의질문으로 11개항목 (item) 을평가하는비선형서열척도 (non-linear ordinal scale) 이며, 정상은 0점, 가장높은점수를받는경우는 42점이다. NIHSS 로뇌졸중의중등도를나타내는경우, 일반적으로 4점미만은경도뇌졸중, 4~14 점은중등도뇌졸중, 그리고 14점을초과하는경우심한뇌졸중으로간주하는데, 이러한분류기준은일률적이지않으며, 연구의성격에따라기준이매우다양하다. 이척도의장점은많은연구를통하여검증되어있고, 평가자간의일치도 (inter-rater reliability) 가매우높다는것이다. 고도의신경학적기술이필요하지않아일정한교육과정을받으면의사뿐아니라간호사도사용할수있으며, 의무기록을통한후향적평가도비교적신뢰도가높은장점이있다. 17,18 그러나후순환뇌졸중 (posterior circulation stroke) 의평가에는약점이있고, 언어기능영역에가중치가너무높게배정되어있다는단점이있다. NIHSS 을평가할때주의할사항이있다. 점수를줄때환자가보인첫번째반응에따라점수를주어야하고, 검사자가여 Table 2. Modified Rankin Scale (mrs) 0 No symptom at all; 증상이없는경우 1 Minor symptom: no significant disability despite symptoms; able to carry out all usual duties and activities; 증상이 ( 뇌졸중으로인한신체적마비, 감각의저하, 보행의장애, 언어장애, 글쓰기및글읽기장애, 인지기능의장애, 시력장애, 음식삼키기에장애 ) 약간있지만뇌졸중이전에할수있던사회적활동들을모두시행가능하다. 사회적활동 (usual duties and activities): 직업, 사회활동및여가생활 ( 운전, 독서, 운동등의취미생활, 직업적인업무, 농사, 장거리여행 ) 2 Some restriction in lifestyle: slight disability; unable to carry out all previous activities but able to look after own affairs without help; 증상으로인해이전에행하던사회적활동및생활 (usual duties and activities) 들의전부또는일부에제약이생겼으나일상생활에필요한간단한일들 (own affairs) 은남의도움없이수행할수있다. 일상생활에필요한간단한일들 (own affairs): 옷입기, 식사하기, 화장실가기, 간단한음식차리기 ( 혼자서간단히한끼를해결할수있는것 ), 장보기, 집근처다니기일상생활에필요한간단한일들을수행한다는의미는수일정도는혼자서지낼수있는능력을가지고있는것임. 3 Moderate disability: Significant restriction in lifestyle; requiring some help, but able to walk without assistance; 일상생활에상당한장애가있으나, 보조기구나지팡이를써서라도혼자걸을수있는상태이다간단한옷입기, 식사하기및화장실가기는독립적으로가능그러나장보기, 요리하기, 청소등은도움이있어야가능 4 Partially dependent, unable; unable to walk without assistance, and unable to attend to own bodily needs without assistance; 증상이심해서돌보아줄사람이필요하긴하지만밤낮으로돌보아줄사람이필요한건아니다. 부축을받아야걸을수있다. 기본적인일상생활 (basic activities), 옷입기, 식사하기및화장실가기에도도움이필요하다. 5 Fully dependent, severe disability; bed-ridden, incontinence and requiring constant nursing care and attention: 증상이심해서밤낮으로돌보아줄사람이필요하다. 부축을해도걷지못할정도로계속누워서지내거나앉아서지내야되는상황. 대소변도계속다른사람이받아내야한다. 6 Dead; 사망한경우 414 J Korean Neurol Assoc Volume 24 No. 5, 2006
뇌졸중임상시험에서치료결과의측정및효과판정 러번진찰을한후적당한점수를주는것이금지된다. 환자가보이는반응에따라점수를주어야하며, 검사자의판단에따라적당한점수를주는것도금지된다. 또한검사자가적당하다고생각되는반응을유도하기위해환자에게힌트 (cue) 를주는것도금지된다. 그러나언어기능장애가있어환자가검사자의질문을이해하지못하는경우, 몸짓 (gesture) 등의다른방법을통하여환자를평가하는것은허용된다. 점수를기록할때는진찰을모두끝내고기록하지말고, 한항목에대한검사가끝나면해당항목에대한점수를바로기록하도록권장되고있다. NIHSS 평가는혈전용해술등과같은시간을다투는급성기치료때자주사용되므로, 평소에연습을통해 5~8 분정도에빨리평가를마칠수있도록몸에익혀야한다. 2) Modified Rankin Scale (mrs) mrs 는환자의전반적장애 (global outcome) 를반영하는척도로서, 처음에는 0~5 단계 ( 정상 0, 심한장애 5) 로구분되어있었으나, 최근에는사망한경우는 6점을주는방식으로변형되어사용되고있다. mrs 는일상적인생활에있어독립적인정도와타인의도움이필요한정도에따라평가하는방식으로 Table 2에각단계에해당되는경우에대해자세히기술하였다. mrs 의장점은평가방법이간단하여신경과의사뿐아니라, 간호사나연구원등이평가하는데에도큰어려움이없으며, 환자를직접진찰하지않고전화로도평가할수있는장점이있다. 그러나각단계의명확한구분이모호한경우가있으며, 독립보행에가중치가높아서여러일상생활을수행하는데매우심한장애가있어도보조기구를이용해서라도독립적보행만가능하면중등도장애 (moderate disability) 인 3점에해당된다는문제점도있다. 또한각나라마다문화의차이로인한평가항목의적용에어려움이있는경우도있다. 3) Glasgow Outcome Scale (GOS) GOS 은외상성뇌손상환자의장기적예후를평가하기위해개발된것으로, 초기중증도평가방법인 Glasgow Coma Scale 과함께사용되던것이었다. 19 GOS 는사망부터호전 (good recovery) 까지 5단계로분류되어있고 Glasgow Coma Scale 이점수가낮을수록환자상태가나쁜것과마찬가지로 GOS 도사망은 1점, 일상생활에장애가없을정도로호전된경우는 5점이었다 (Table 3). 그러나최근뇌졸중임상시험에서는다른기능적척도와혼동되지않도록일상생활에장애가없을정도로호전된경우를 1점, 사망을 5점으로반대로평가하는경우가많으니혼동하지말아야한다. mrs 와마찬가지로평가가간편하여, 의사가아닌의료인이사용할수있고, 전화로도판정할수있는장점이있다. 그러나 mrs 와마찬가지로각단계의구분이모호한경우와각나라의문화차이에의한평가항목적용의장애가있을수있다. 4) Barthel Index (BI) BI 는 1965 년에처음소개되었는데, 뇌졸중뿐아니라여러신경계질환환자의기능적장애의평가에많이사용되고있다. 20 식사, 목욕, 몸치장, 대소변보기, 이동등에관한 10개항목을평가하여장애가없는경우 100 점이부여된다. 평가에있어유의할것은피험자가할수있는것을측정하는것이아니라일상생활에서실제로행하고있는정도를측정하여야한다. 또한일상생활의수행정도를 독립적 (independent) 이라고평가하려면, 타인의도움이전혀없이수행가능하다는것을의미하며 타인의감독 (supervision) 이필요한경우는 독립적 이라고평가해서는안된다. 그러나보조도구를사용해서타인의도움이나감독없이수행할수있는경우에는독립적인것으로판단한다. 보통평가시점으로부터최근 24~ Table 3. Glasgow Outcome Scale (GOS) 1 Dead 2 Persistent vegetative state Patient exhibits no obvious cortical function 3 Severe disability (Conscious but disabled) Patient depends upon others for daily support due to mental or physical disability. Patient is able only to care for themselves in their own homes 4 Moderate disability (Disabled but independent) Patient is independent as far as daily life is concerned. The disabilities found include varying degrees of dysphasia, hemiparesis, or ataxia, as well as intellectual and memory deficits and personality changes. Patient could travel by public transport and could work in a sheltered environment, and could shop independently. 5 Good Recovery Resumption of normal activities even though there may be minor neurological or psychological deficits J Korean Neurol Assoc Volume 24 No. 5, 2006 415
홍근식 48시간에나타나는환자의일상생활을평가하는것이바람직하다. 독립적인경우 (independent) 와전적으로타인의도움이필요 (dependent) 한중간에해당되는경우는해당항목을수행하는데환자가 50% 정도독립적으로가능하다는의미이다. BI는일상생활에필요한많은항목들을비교적자세히평가할수있는데, 의사가아니어도쉽게평가가가능하며, 전화로도평가가가능하다. 그리고여러연구들을통해유효성이검증되어있고, 평가자간의일치도 (inter-rater reliability) 도높은장점이있다. 그러나인지기능에대한고려가개입되지않아, 심한인지기능장애가있어도 100 점이부여될수있는단점이있다. 또한천장효과 (ceiling effect) 가존재하여, 신경학적장애가분명히있으나 BI 가매우높은환자인경우지속적인신경학적호전을보여도 BI에는호전이반영되지않는단점이있다. 5) 신경영상을평가척도로사용하는경우 (Neuroimaging as an outcome measure) 혈전용해술임상시험에서치료후혈관조영술로재개통을평가하는것은과거부터많이사용되어온방법이다. 21-24 최근에는자기공명혈관조영술 (MRA), 확산자기공명영상 (DWI), 관류자기공명영상 (PWI) 및 GRE 기법이발달함에따라 MRI 를대리표지자로이용하는임상시험이주목을받고있다. 25 MRI를이용한뇌졸중임상시험은몇가지장점을가지고있다. 첫째, 투여하고자하는약물의기전에적합한대상환자를선택할수있다. 둘째, 약물기전의효과를다양한신경영상방법으로검증할수있다. 셋째, 신경영상을이용한척도는임상척도에비해대조군과치료군의차이를더민감하게평가할수있으며, 연구대상자수를줄일수있는장점이있다. MRI 와같은대리표지자를임상시험에사용하려면몇가지 조건이필요하다. 첫째, 뇌졸중의병태생리를잘반영하여야하며, 검사의정확도가높아야한다. 이런관점에서 DWI 와 PWI 는아주적합한방법이다. 둘째, 대리표지자는임상적중증도를잘반영해야한다. MRI 의경우임상적척도로평가한중증도와 MRI 병변의크기와의높은상관성은이전의많은연구에서증명이되었다. 26-28 셋째, 치료에따른변화, 즉임상적호전과대리표지자의변화가잘일치해야한다. Citicoline 의임상시험에서 MRI 병변의변화를추적한결과, 임상적변화와 MRI 병변의변화에상관성이높음이보고되었다. 29 이러한관점에서볼때 MRI 는급성기뇌졸중임상시험에매우적합한대리표지자이며, 최근에는 3시간이지난환자들의혈전용해술이나신경보호제 (neuroprotective agent) 에관한임상시험에서많이이용되고있다 (Table 4). MRI 를이용할때치료전과후병변크기의변화를평가하는방법이주로사용되고있는데, 치료전신경학적중증도 (NIHSS score), DWI 병변의크기, 관류상태등의주요변수들에대한보정이권장되고있다. 29 2. 급성기뇌졸중치료효과의판정임상시험의목적은치료효과유무를검증하기위한것이므로, 치료결과를측정한후특정한기준과분석방법으로치료효과를판정해야한다. 본단락에서는고전적으로사용되고있는이분법과새롭게시도되고있는분석방법에대해소개하고자한다. 1) 이분법 (Dichotomization) 임의의기준에따라측정된치료결과를 favorable, good, 또는 responsive 와 non-favorable, bad, 또는 nonresponsive 로이분 (dichotomization) 하는것이가장고전적 Table 4. MRI-based acute stroke trials Trial Agent MRI outcome measure Time window DIAS DIAS-2 EPITHET DEFUSE ROSIE ARTIST MRI MR RESCUE MR IMAGES Desmoteplase Desmoteplase t-pa t-pa Abciximab±Reteplase AMPA antagonist (YM 872) Mechanical embolectomy Magnesium Reperfusion on MRI after 4~8 h MRI measured infarct volume at 3 m DWI expansion Predictor of specific profile on DWI and PWI for a favorable outcome MRI reperfusion at 24 h Lesion volume on T2 & FLAIR at 3 m MRI lesion volume MRI lesion growth 3~9 h 3~9 h 3~6 h <6 h 3~24 h <6 h <8 h <12 h DIAS; desmoteplase in acute ischaemic stroke, EPITHET; echoplanar imaging thrombolysis evaluation trial, DEFUSE; diffusion-weighted imaging evaluation for understanding stroke evolution, ROSIE; reopro retavase reperfusion of stroke safety study imaging evaluation, ARTIST MRI; AMPA receptor antagonist treatment in ischemic stroke, MR RESCUE; MR and recanalization of stroke clots using embolectomy, MR IMAGES; magnetic resonance in intravenous magnesium efficacy in stroke trial 416 J Korean Neurol Assoc Volume 24 No. 5, 2006
뇌졸중임상시험에서치료결과의측정및효과판정 인방법이다. 이방법은연구결과를접하는임상가들이그결과를해석하기쉬운장점이있다. 이때효과판정에사용되는기준은임상경험과과거의자료를토대로연구자들이임의로결정해야한다. 혈전용해술은혈관의재개통으로인한극적인신경학적호전을기대한다. 따라서자연적인회복이아닌혈전용해술에의한효과라면 3개월 mrs 가 0-1, 또는 0-2 정도가되어야한다는엄격한판정기준이적용되는것이일반적이다. 그러나높은사망률이나심한장애를유발하는뇌출혈의경우, 특정한치료가극적인신경학적호전을기대하기힘들다. 따라서이경우에는사망이나심한장애를어느정도줄일수있는가가주요관심사이므로, mrs 0-3 와 mrs 4-6 로구분하는판정방법이더합리적이다. 급성기뇌출혈에대한 Factor VIIa 효과를검증하기위한임상시험에서도, 30 유효성판정은치료군과대조군의 3개월 mrs 4-6의분율을비교하였다. 혈전용해술임상시험에서는초기효과를판정하는데일반적으로치료 24시간후 NIHSS 점수의변화를평가한다. NINDS t-pa 연구에서는 24시간 NIHSS 점수가 4점이상호전이있는경우 t-pa 에반응이있는것으로판정하였다. 4 4점이상의호전을치료에반응이있는것으로판정하는방법은 1992 년 t-pa pilot trial 때부터시도가되었는데현재까지도대부분가장많이사용되는방법이다. 31 그러나혈전용해술에의해혈관이재개통이되지않아도 4점정도의호전은보일수있다는비판들도있다. 중대뇌동맥폐색등의중증의뇌졸중환자들을대상으로하는혈전용해술임상시험에서는치료 24시간후 NIHSS 호전의기준을더엄격하게적용하기도하는데, EMS (Emergency Management of Stroke) 연구는 NIHSS 7점이상호전된경우, 24 IMS(Interventional Management of Stroke) 연구는 24 시간 NIHSS 2점이하인경우를치료효과가있는경우로판정하였다. 21 CLOTBUST (Combined Lysis Of Thrombus in Brain ischemia Using transcranial Ultrasound and Systemic t-pa) 연구의경우에는 NIHSS 10점이상호전이거나 24시간 NIHSS 3점이하인경우를치료에반응이있는것으로판정하였다. 32 NIHSS 평가는치료효과뿐아니라급성기뇌졸중의초기신경학적악화 (early neurological deterioration; END) 를판정하는데에도이용된다. 그러나악화로판정하는기준은일률적으로정하기매우어렵다. 총점이 4점이상악화되는경우를기준으로삼는경우도있으나, 소공성뇌경색의경우총점이 1 또는 2점이악화되더라도운동기능항목에서 1 또는 2점이나빠진경우분명한악화로볼수있다. 따라서연구대상자에따라악화의기준을정하는데신중한고려가필요하다. 혈전용해술임상시험에서기능적척도 (functional outcome scale) 로장기적인예후를평가할때, favorable outcome 은일반적으로 mrs 0-1, GOS good recovery, 그리고 BI 95~ 100 점으로정한다. 신경학적중증도척도인 NIHSS 의경우, 급성기효과를판정할때는 24시간후 4점이상호전을기준으로하지만, 3개월예후평가에서는 NIHSS 0-1 을 favorable outcome 으로정하는것이일반적이다. mrs 의이분법은분석목적에따라다양한데, 독립적 (independent; mrs 0-3) 과 의존적 (dependent; mrs 4-6), 또는 good outcome (mrs 0-2) 과 bad outcome (mrs 3-6) 으로구분하기도한다. 현재진행되고있는 t-pa 연구중 IST-3 (International Stroke Trial-3) 는 t-pa 투여가능시간을뇌졸중발생 6시간이내로연장하였다. 33 따라서치료시작이늦은환자들이많이포함되므로, 3시간이내치료하는다른 t-pa 임상시험처럼 mrs 0-1 을기준으로판정하기에는무리가있다고판단하여, IST-3 에서는 6개월 mrs 0-2 를치료에반응이있는것으로정하고있다. 2) 글로벌테스트 (Global test) 최근혈전용해술임상시험에서는치료효과를판정하는일차유효성평가항목으로 글로벌테스트 (global test) 가자주이용되고있다. NINDS 의 t-pa 연구설계단계에서 t-pa 효과를판정하는방법에대한연구모임이있었는데, 이때글로벌테스트를일차유효성평가항목으로결정하였다. 글로벌테스트가도입된이유는 NIHSS, mrs, GOS, BI 등의척도들은뇌졸중으로인한장애를서로다른측면에서반영하고있으므로, 이러한척도들이전반적으로향상되어야 t-pa 의효과가있다고판단되었기때문이다. 글로벌테스트는 NIHSS, mrs, GOS, BI 측정결과를변수로집어넣어산출되므로, 뇌졸중의장애를종합적으로반영할수있는분석방법으로인정되고있다. 34 NINDS 의 t-pa 연구 4 에서처음사용된이후많은연구들에서이용되었다. 21,35,36 3) 슬라이딩이분법 (Sliding dichotomy) 이분석방법은치료시작전뇌졸중중증도를치료효과의판정에반영하는것이다. 과거의연구에서는치료전중증도가선정기준과보정변수로만활용되었을뿐치료효과의판정에반영되지않았다. 그러나치료전뇌졸중중증도는치료의반응과예후를결정하는가장중요한요인이다. 예를들어혈전용해술치료전 NIHSS 이 4인경우와 30인경우, 두경우모두 3개월 mrs 가 1 이하가되어야치료에반응이있다고하는일률적인기준을사용하는경우 NIHSS 30인환자에대한혈전용해술의 J Korean Neurol Assoc Volume 24 No. 5, 2006 417
홍근식 임상효과 (modest clinical effectiveness) 만있는경우에는효과가없는것으로판정되어실제효과가있는치료법이사장되어버릴수있는문제점이있다. Shift analysis 는이러한이분법적분석방법의문제점을개선하기위해고안된것으로, 치료군과대조군에서관찰되는치료결과의분포 (distribution of outcome measure) 를통계적인기법으로비교하여그차이를검증하는방법이다 (Fig. 1). 혈전용해술임상시험에서이분법적분석방법에따라 3개월 mrs 0-1 인경우를치료반응군으로결정하면, 치료군에서는 mrs 2, 혹은 3의분율이높고, 대조군에서는 mrs 5, 혹은 6의분율이높다하더라도 mrs 2-6 은치료효과가없는것으로동일취급되어버린다. 그러나 shift analysis 는임의의기준을넘는분율을비교하는것이아니라전체 mrs 의분포를비교하므로 Figure 1. According to dichotomized analysis, treatment effects were shown in area A. Shift analysis increases the power to detect the treatment effect, shown in area A and B. 실제치료효과는제대로반영되지못할위험성이있다. 이러한단점을극복하기위해도입된분석방법이슬라이딩이분법 (sliding dichotomy) 이다. 슬라이딩이분법은반응자분석 (responder analysis) 이라고도하는데, MERCI 연구에서는치료전 NIHSS 20점이하인경우는치료후 3개월 mrs 가 0-2, NIHSS 21점이상경우는 3개월 mrs 가 0-3 이되면치료에반응이있는것으로판정하였다. 23 AbESTT, 37 STICH 38 등의연구에서도치료전뇌졸중중증도를반영하였는데, AbESTT 에서는치료전중증도를세분하여 NIHSS 8점미만인경우에는 3개월 mrs 0, NIHSS 8-14 인경우에는 3개월 mrs 0-1, 그리고 NIHSS 14점을초과하는중증도가심한뇌졸중은 3개월 mrs 0-2 가되면 favorable outcome 으로판정하였다. 37 4) Shift analysis 급성기뇌졸중치료의결과는 사망 과 생존, 또는 favorable 과 non-favorable 등과같은 all or none 의이분법적인변수가아니라다양한정도의장애로나타나는일련의스펙트럼이므로, 동일한간격과연속적인성격을가지는척도로치료결과를측정하는것이이상적이다. 그러나이러한조건을충족시키는척도는존재하지않으므로, 임의의기준에의해효과유무를결정하는 이분법 이주로이용되어왔다. 이분법에의해연구결과를분석하면, 이를접하는임상가들은그연구결과를해석하기쉽다. 그러나어떤치료법이효과가있음에도불구하고임의로결정된역치를넘지못하는경우, 또는중등도의 mrs 0-1 이분율이양군에서비슷하여도, mrs 2, 혹은 3의분율이대조군에비해치료군에서유의하게높은경우, 치료법이효과가있다고판정될가능성이있다. 이러한분석방법은특히신경보호제 (neuroprotecitve agent) 와같이중등도의임상효과가있는치료법의효과를판정하는데적합할수있다. 최근에발표된 SAINT-I 연구에 shift analysis 가이용되었으며, 39 향후많은연구에서이용될것으로예상된다. 결 론 뇌졸중분야의임상시험은점차활발해지고있다. 성공적인연구수행을위해서는연구대상및치료기대효과에따라적절한치료결과측정및분석방법을선택하는것이매우중요하다. 본종설에서소개한평가척도및분석방법들이임상시험에관심이있거나준비를하고있는독자들에게도움이될수있기를기대한다. REFERENCES 1. Meyer JS, Gilroy J, Barnhart MI, Johnson JF. Therapeutic thrombolysis in cerebral thromboembolism. double-blind evaluation of intravenous plasmin therapy in carotid and middle cerebral arterial occlusion. Neurology 1963;13:927-937. 2. Bradshaw P, Brennan S. Trial of long-term anticoagulant therapy in the treatment of small stroke associated with a normal carotid arteriogram. J Neurol Neurosurg Psychiatry 1975;38:642-647. 3. Norris JW. Steroid therapy in acute cerebral infarction. Arch Neurol 1976;33:69-71. 4. Tissue plasminogen activator for acute ischemic stroke. The National Institute of Neurological Disorders and Stroke rt-pa Stroke Study Group. N Engl J Med 1995;333:1581-1587. 5. Guyatt GH, Sackett DL, Sinclair JC, Hayward R, Cook DJ, Cook 418 J Korean Neurol Assoc Volume 24 No. 5, 2006
뇌졸중임상시험에서치료결과의측정및효과판정 RJ. Users' guides to the medical literature. IX. A method for grading health care recommendations. Evidence-Based Medicine Working Group. JAMA 1995;274:1800-1804. 6. Amarenco P, Bogousslavsky J, Callahan A, 3rd, Goldstein LB, Hennerici M, Rudolph AE, et al. High-dose atorvastatin after stroke or transient ischemic attack. N Engl J Med 2006;355:549-559. 7. Chimowitz MI, Lynn MJ, Howlett-Smith H, Stern BJ, Hertzberg VS, Frankel MR, et al. Comparison of warfarin and aspirin for symptomatic intracranial arterial stenosis. N Engl J Med 2005;352: 1305-1316. 8. Diener HC, Bogousslavsky J, Brass LM, Cimminiello C, Csiba L, Kaste M, et al. Aspirin and clopidogrel compared with clopidogrel alone after recent ischaemic stroke or transient ischaemic attack in high-risk patients (MATCH): randomised, double-blind, placebocontrolled trial. Lancet 2004;364:331-337. 9. Yusuf S, Sleight P, Pogue J, Bosch J, Davies R, Dagenais G. Effects of an angiotensin-converting-enzyme inhibitor, ramipril, on cardiovascular events in high-risk patients. The Heart Outcomes Prevention Evaluation Study Investigators. N Engl J Med 2000; 342:145-153. 10. Kwon SU, Cho YJ, Koo JS, Bae HJ, Lee YS, Hong KS, et al. Cilostazol prevents the progression of the symptomatic intracranial arterial stenosis: the multicenter double-blind placebo-controlled trial of cilostazol in symptomatic intracranial arterial stenosis. Stroke 2005;36:782-786. 11. Brott T, Adams HP, Jr., Olinger CP, Marler JR, Barsan WG, Biller J, et al. Measurements of acute cerebral infarction: a clinical examination scale. Stroke 1989;20:864-870. 12. Lyden P, Brott T, Tilley B, Welch KM, Mascha EJ, Levine S, et al. Improved reliability of the NIH Stroke Scale using video training. NINDS TPA Stroke Study Group. Stroke 1994;25:2220-2226. 13. Adams HP, Jr., Davis PH, Leira EC, Chang KC, Bendixen BH, Clarke WR, et al. Baseline NIH Stroke Scale score strongly predicts outcome after stroke: A report of the Trial of Org 10172 in Acute Stroke Treatment (TOAST). Neurology 1999;53:126-131. 14. Appelros P, Terent A. Characteristics of the National Institute of Health Stroke Scale: results from a population-based stroke cohort at baseline and after one year. Cerebrovasc Dis 2004;17:21-27. 15. Goldstein LB, Bertels C, Davis JN. Interrater reliability of the NIH stroke scale. Arch Neurol 1989;46:660-662. 16. Muir KW, Weir CJ, Murray GD, Povey C, Lees KR. Comparison of neurological scales and scoring systems for acute stroke prognosis. Stroke 1996;27:1817-1820. 17. Dewey HM, Donnan GA, Freeman EJ, Sharples CM, Macdonell RA, McNeil JJ, et al. Interrater reliability of the National Institutes of Health Stroke Scale: rating by neurologists and nurses in a community-based stroke incidence study. Cerebrovasc Dis 1999; 9:323-327. 18. Williams LS, Yilmaz EY, Lopez-Yunez AM. Retrospective assessment of initial stroke severity with the NIH Stroke Scale. Stroke 2000;31:858-862. 19. Jennett B, Bond M. Assessment of outcome after severe brain damage. Lancet 1975;1:480-484. 20. Mahoney FI, Barthel DW. Functional Evaluation: the Barthel Index. Md State Med J 1965;14:61-65. 21. Combined intravenous and intra-arterial recanalization for acute ischemic stroke: the Interventional Management of Stroke Study. Stroke 2004;35:904-911. 22. Furlan A, Higashida R, Wechsler L, Gent M, Rowley H, Kase C, et al. Intra-arterial prourokinase for acute ischemic stroke. The PROACT II study: a randomized controlled trial. Prolyse in Acute Cerebral Thromboembolism. JAMA 1999;282:2003-2011. 23. Gobin YP, Starkman S, Duckwiler GR, Grobelny T, Kidwell CS, Jahan R, et al. MERCI 1: a phase 1 study of Mechanical Embolus Removal in Cerebral Ischemia. Stroke 2004;35:2848-2854. 24. Lewandowski CA, Frankel M, Tomsick TA, Broderick J, Frey J, Clark W, et al. Combined intravenous and intra-arterial r-tpa versus intra-arterial therapy of acute ischemic stroke: Emergency Management of Stroke (EMS) Bridging Trial. Stroke 1999;30:2598-2605. 25. Warach S. Use of diffusion and perfusion magnetic resonance imaging as a tool in acute stroke clinical trials. Curr Control Trials Cardiovasc Med 2001;2:38-44. 26. Baird AE, Lovblad KO, Dashe JF, Connor A, Burzynski C, Schlaug G, et al. Clinical correlations of diffusion and perfusion lesion volumes in acute ischemic stroke. Cerebrovasc Dis 2000; 10:441-448. 27. Beaulieu C, de Crespigny A, Tong DC, Moseley ME, Albers GW, Marks MP. Longitudinal magnetic resonance imaging study of perfusion and diffusion in stroke: evolution of lesion volume and correlation with clinical outcome. Ann Neurol 1999;46:568-578. 28. Lovblad KO, Baird AE, Schlaug G, Benfield A, Siewert B, Voetsch B, et al. Ischemic lesion volumes in acute stroke by diffusion-weighted magnetic resonance imaging correlate with clinical outcome. Ann Neurol 1997;42:164-170. 29. Warach S, Pettigrew LC, Dashe JF, Pullicino P, Lefkowitz DM, Sabounjian L, et al. Effect of citicoline on ischemic lesions as measured by diffusion-weighted magnetic resonance imaging. Citicoline 010 Investigators. Ann Neurol 2000;48:713-722. 30. Mayer SA, Brun NC, Begtrup K, Broderick J, Davis S, Diringer MN, et al. Recombinant activated factor VII for acute intracerebral hemorrhage. N Engl J Med 2005;352:777-785. 31. Haley EC, Jr., Levy DE, Brott TG, Sheppard GL, Wong MC, Kongable GL, et al. Urgent therapy for stroke. Part II. Pilot study of tissue plasminogen activator administered 91-180 minutes from onset. Stroke 1992;23:641-645. 32. Alexandrov AV, Molina CA, Grotta JC, Garami Z, Ford SR, Alvarez-Sabin J, et al. Ultrasound-enhanced systemic thrombolysis for acute ischemic stroke. N Engl J Med 2004;351:2170-2178. 33. IST-3. Third International Stroke Trial. Abstract in International Stroke Conference 2004. Stroke 2004. 34. Tilley BC, Marler J, Geller NL, Lu M, Legler J, Brott T, et al. Use of a global test for multiple outcomes in stroke trials with application to the National Institute of Neurological Disorders and Stroke t-pa Stroke Trial. Stroke 1996;27:2136-2142. 35. Hacke W, Donnan G, Fieschi C, Kaste M, von Kummer R, Broderick JP, et al. Association of outcome with early stroke treatment: pooled analysis of ATLANTIS, ECASS, and NINDS rt-pa stroke trials. Lancet 2004;363:768-774. 36. Muir KW, Lees KR, Ford I, Davis S. Magnesium for acute stroke (Intravenous Magnesium Efficacy in Stroke trial): randomised controlled trial. Lancet 2004;363:439-445. J Korean Neurol Assoc Volume 24 No. 5, 2006 419
홍근식 37. Emergency administration of abciximab for treatment of patients with acute ischemic stroke: results of a randomized phase 2 trial. Stroke 2005;36:880-890. 38. Mendelow AD, Gregson BA, Fernandes HM, Murray GD, Teasdale GM, Hope DT, et al. Early surgery versus initial conservative treatment in patients with spontaneous supratentorial intracerebral haematomas in the International Surgical Trial in Intracerebral Haemorrhage (STICH): a randomised trial. Lancet 2005;365:387-397. 39. Lees KR, Zivin JA, Ashwood T, Davalos A, Davis SM, Diener HC, et al. NXY-059 for acute ischemic stroke. N Engl J Med 2006;354:588-600. 420 J Korean Neurol Assoc Volume 24 No. 5, 2006