W I S C - I V A d v a n c e d C l i n i c a l I n t e r p r e t a t i o n 제 3 장 WISC-IV 전체지능점수와일반능력지표해석 DONALD H. SAKLOFSKE, LAWRENCE G. WEISS, SUSAN E. RAIFORD, AND AURELIO PRIFITERA 개관 L 의 WISC-IV 전체지능점수 (FSIQ) 71 은그가복잡한비행및범죄행위를계획하고수행할인 지능력이없음을강력하게시사한다. 오히려 L 은갱단과연관된비행행위에서 졸병 역할을 했을가능성이더많아보인다. B의지능과학업성취도의불일치는작업기억의어려움과관련되어있는것으로보인다. B의전체지능점수 105 는보통수준이다. 그러나숫자바로따라하기에서측정된 B의청각적단기기억력점수는보통수준인데반해, 숫자를거꾸로따라하는것과같이정보를정신적으로조작해야할때훨씬큰어려움을경험했다. 이는순차연결소검사에서짧은배열의순서를기억하고내용을재배열하는것에심각한어려움을보였던점에서도확인되었다. A의 WISC-IV 전체지능점수인 128 은현재지적능력의신뢰롭고타당한지표인것으로보인다. 비언어적공간추론및작업기억능력은단어추리능력이최우수수준으로발휘되는데도움을준다. 정신처리속도점수는다른점수들보다상대적으로낮기는하지만보통수준에속
106 WISC-IV 임상해석 하며, 따라서여타의능력이나학업성취수준에어떠한제한도주지않을것으로보인다. 부분적으로낮은점수들은낮은동기수준을반영하는것으로보인다. 왜냐하면 두드리기처리속도 (tapping processing speed) 과제는상대적으로단순하기때문이다. 처리속도및주의력에대한소검사수행에서기복이큰것으로나타났는데 A는이과제들이재미있지는않다고말했다. WISC-IV 전체지능점수는높은학업성취와일치한다. WISC-IV(Wechsler, 2003c) 해석의초점은네가지요인분석에기반을둔지표점수 에맞추어져있다 (Weiss, Saklofske, & Prifitera, 2003, 2005 와이책의 2, 4 장참조 ). 몇몇심리학자들은 WISC-IV 에서언어성지능및동작성지능점수가삭제된것을안타까워하지만, 지능과척도점수의이원체계는웩슬러아동용지능검사제 3 판 (WISC-III: Wechsler, 1991) 에서임상적유용성을더해주지못했으며, 심지어심리학적보고서를읽 는교사나부모에게혼란을일으키기도했다. 이전장에서기술했듯이언어이해지표와지 각추론지표를구성하는모든문항들과소검사에서변화가있었다. 새롭게추가된두개의 지각적추론소검사 ( 예 : 공통그림찾기와행렬추리 ) 는요인구조의통합을증진시키며측정 되는인지능력을명확하게하였고, 지각조직화능력에서 지각추론 으로지표명칭의변 화를가져왔다. 작업기억과처리속도지표또한중요성이증가했다. 이전버전에서는크게 중요하지않았던이요인들은 WISC-IV 전체지능점수의 40% 를구성한다. 임상장면및 심리교육적평가영역에서이지표들이가진잠재적유용성은더욱중요하며, 인지평가와 치료를더가깝게연결할수있게되었다. 이요소들은명칭또한달라졌는데, 이전에 주 의집중지표 (freedom from distractibility) 로명명되었던요소가이제는 작업기억 으로 바뀌었다. 순차연결이청각적작업기억을측정하는숫자따라하기를보완하게되었고, 산 수소검사가특정임상적질문을설명하는보충소검사가되었다. R 의 WISC-IV 전체지능점수 108 점은 R 이전반적으로보통수준의능력을가지고있음을시 사한다. 그러나이요약점수는여러지표점수에의해측정된 R 의능력들의편차를반영해주 지는못한다. R 은보통하수준의언어지식및추론능력을가지고있는것과는달리, 비언어적 공간추론능력은보통상수준으로잘발달된것으로나타났다. 이러한차이는아동에게서자
제 3 장 WISC-IV 전체지능점수와일반능력지표해석 107 주관찰되는것은아니다 (5% 이하의아동이이러한점수편차를보인다 ). 이것은아마도 R 의 학업수행의불일치를설명할수있을것이다. 임상신경심리학과같은특정전문분야에서논쟁이되는것은전체지능점수의적절성과유지에대한것이다. 스탠포드 -비네제5판 (Stanford Binet-Fifth Edition:Roid, 2003), 우드콕존슨인지능력검사 (Woodcock Johnson-III:Woodcock, McGrew, & Mather, 2001), 인지평가시스템 (Cognitive Assessment System:Naglieri & Das, 1997) 과같은여러인지검사들을실시했을때, 일반적인정신능력요인을발견할수있다는점은의심의여지가없다. 순수심리측정학적관점에서볼때가장설득력있는연구는 400 명이상의지능데이터를요인분석한 Carroll(1993) 의결과이다. 그러나문제는전체지능점수에반영된요약적인지능평가치가실제로임상유용성이있는가하는점이다. 이장의초점은 WISC-IV 전체지능점수와이를보완하는일반능력지표 (GAI) 이다. 다음장에서는 WISC-IV 의요인구조와평가과정과관련되어있는네가지지표점수의적합성에대하여논의할것이다. 앞으로두개의장에서는 WISC-IV 해석에접근하는절차에초점을맞추어설명할것이다. 좀더자세히얘기하자면, 이장에서는 평가에서지능의역할을요약하고 임상평가장면에서 WISC-IV 전체지능점수의적합성에대해재논의하며 WISC-III 에처음제시되었던일반능력지표의계산방법과계산에필요한표를제시하고 일반능력지표와웩슬러개인성취검사제 2 판 (Wechsler Individual Achievement Test- Second Edition, WIAT-II:Harcourt Assessment, Inc., 2002) 을연결하는표를제시할 것이다. 지능과평가 나는내아이가지능점수로평가받고낙인찍히는것을원치않아요. 내아이는특별하고, 독 특한개인으로존중받아야할필요가있어요.
108 WISC-IV 임상해석 지능평가에대한몇가지일반적인의견들로이단락을시작하겠다. 심리학분야에서는 인간행동과개인차이를기술하는지능의중요성이널리인식되어왔다 (Deary, 2001; Neisser, Boodoo, Bouchard, Boykin, Brody, Ceci, Halpern, Loehlin, Perloff, Sternberg, & Urbina, 1996). 그러나이론상으로나현장에서 ( 예 : 지능을측정하고보고 할때 ), 다른어떤구성개념도현재까지그만한논쟁을불러일으킨적은없었다. 비록 WISC-IV 와다른최근의지능검사들이최고의심리측정적규준을만족시키고, 확장된 이론, 연구, 임상적기반을일구어냈지만 (Georgas, Weiss, van de Vivjer, & Saklofske, 2003; Prifitera, Saklofske, & Weiss, 2005), 지능검사의일반적인사용, 특히학교장면 에서의사용에대해비판하는사람들이많다. 최근의관심은언어나문화배경이다른소 수집단아동간에특수교육이필요하다는판단이불균형적으로나타나는문제이다. 학습 장애평가영역에서단순히 능력 - 성취차이 만을유일한진단기준으로사용하는것은 의문을불러왔다 (Fletcher & Reschly, 2005; Siegel, 2003). 비평가들또한평가, 진단, 치료사이의직접적인연결의부재를지적한다. 검사와검사사용에대한몇몇비판은오늘날에도적용되고있으나, 많은부분은과거에 행해졌던것들이반영된것이다. 최근평가장면에서의지능검사와검사실시 양상 은초 기의지능검사실시와는매우다르다 (Tulsky, Saklofske, & Richer, 2003; Harris, Tulsky, & Schultheis, 2003). 지능검사를둘러싼계속되는논쟁의기반은 믿음의충돌 이다. 헤겔철학의변증법적인인류평등주의대엘리트주의관점은지능의구성개념과평 가모두에영향을주었다. 그러나지능검사가중요한정보를제공할수있는철학적이고 사회적인맥락은단순히지능을측정하거나학교를배정하는것으로부터, 장애인교육조 례 (Individuals with Disabilities Education ACT, IDEA) 나 No Child Left Behind 1) 와 같은공식적인교육및사회정책을결정하는것으로변화해왔다. 의사결정을하고, 아동 에게낙인을찍고, 아이들의학습환경을제한하는것이지능검사가아니라는이야기를우 리는또한얼마나자주들어왔는가? 지능검사는의사결정을하지않는다. 의사결정은우 1) 역자주 : 어떤아이도뒤처져있게하지않겠다. 는의지를표방한미국의교육정책을말한다.
제 3 장 WISC-IV 전체지능점수와일반능력지표해석 109 리가한다. 지능검사의결과를어떻게사용할것인가에대한결정을하는 우리 는심리 학자, 교사, 평가자, 정치인, 로비스트집단, 일반적인국민전체를포함한다. 현행평가시행 심리학은과학이론과임상시행의두측면모두에서발전해왔으며, 심리학자들은과학자-임상가모델을표방해왔다. 게다가심리학자들의임상활동은개인의권리와존엄성에대한사회적시각, 그리고심리학적서비스제공자가가지는치료의질에대한기대를반영한다. 최고의치료적관점에서 Meyer 와동료들 (2001, p. 155) 은 공식적인평가는심리학의전문가적인유산과오늘날전문적인임상업무의핵심요소이다. 라고결론내리고있다. 지능검사를포함한심리평가에대한학교및임상심리학자들의종합적인훈련과, 조심스럽게개발되고명확하게구성된시행규준및윤리규정은인간지능과평가도구에대한연구의중요한발전과더불어지능검사에대한논쟁을종식시켜왔다 (Saklofske, Prifitera, Weiss, Rolfhus, & Zhu, 2005, p. 36). 현행평가는과거단일검사위주의시행으로부터개인을종합적으로이해하기위해여러학문분야에걸쳐이루어지는다각적평가로발전해왔다. 특히지능검사는독립적으로실시되는검사로알려지기보다는통합모델내에자리를잡았다. Berninger 와 Dunn, Alper(2005) 는최근의평가방법론과평가의실제에대한훌륭한예시를정리하였다. 이는통합적인다수준모델로서, 여기에는프로파일분석이포함되어있다. 종합적심리평가는 1 부모, 교사, 아동등다양한정보원으로부터정보를수집하고 2 검사, 관찰, 면담의여러방식을사용하여 3 아동의지능, 성격, 동기등의특징과 4 가정이나학교등의환경적영향을반영한다. 공식적 비공식적인평가와면담, 관찰이라는평가의네개기둥은 (Sattler, 2001) 심리학자로하여금진단적의사결정과예방및개입전략과관련된가치
110 WISC-IV 임상해석 있는정보들을제공할수있는다양한방법들을사용하도록격려한다. 이책의 7장에서는다른검사도구들로부터얻은정보맥락에서 WISC-IV 결과를사용하는것에대해논의할것이며, 1장에서는이미환경적인맥락에서 WISC-IV 결과를해석하는것에대해논의한바있다. 풍부하면서도빠르게진행되는프로그램은분명 J에게적절해보인다. J의 WISC-IV 지표점수는모두상위 1~5% 에속하며아동기억척도 (CMS) 에서는매우잘발달된기억력을보여주고있다. 광범위한영역의읽기와산수능력에대한 WIAT-II 점수는 J의현재와과거학업성취수준과일치한다. 지난 2년동안 J의담임교사는 J가이프로그램에참여할수있도록도와주었다. 현재담임교사에의해보고된영재성평정척도 (Gifted Rating Scale) 결과는이권고사항을부가적으로지지해주었다. 심리측정적으로성취나자기개념측정도구와 연결되어있지않았던 과거의지능검사 와는달리, WISC-IV 는지능검사 (WPPSI-III:Wechsler, 2002; WAIS-III:Wechsler, 1997; WAIS:Wechsler, 1999), 인지처리검사 (WISC-IV 통합본 :Wechsler et al., 2004), 성취검사 (WIAT-II), 기억검사 (Children s Memory Scale, CMS:Cohen, 1997), 영재성평정척도 (Gifted Rating Scale, GRS:Pfeiffer & Jarosewich, 2003), 적응행동평가 (Adaptive Behavior Assessment System-Second Edition, ABAS-II:Harrison & Oakland, 2003), 그리고정서지능검사 (BarOn Emotional Quotient-Inventory, Bar-On EQ:Bar-On, 1997) 와연결되어있다. 이들과연관된연구는단일검사로는얻을수없는중요한데이터를제공하고, 수렴타당도를지지하거나이에공헌하는부가적인정보를제공할뿐만아니라두개이상의도구의타당도를제공한다 (Hunsley, 2003). WISC-IV 와 WISC-IV 통합본을동시에사용함으로써어휘와같은소검사에서어떻게, 그리고왜아동이특정한점수를얻었는지를더잘이해할수있다는것이그적절한예이다 (McCloskey & Maerlender, 2005 와이책의 5, 6장을참조 ). 학습장애를평가하는유일한도구라는점에대해서는비록도전을받고있지만, 능력- 성취차이 (AAD) 분석은사전, 사후가설검증모두와관련이있다. 이장의후반부에서논할것이지만, WISC-IV 는
제 3 장 WISC-IV 전체지능점수와일반능력지표해석 111 학습장애를평가하는데매우중요하다 (Berninger & O Donnell, 2005). 지능에대해서는여전히좀더배워야할필요가많지만, 아동을기술하고이해하는것과관련하여우리가알고사용할수있는부분또한많다 (Deary, 2001; Neisser et al., 1996; Saklofske, 1996). 복잡한조건들을진단하고치료법을지시해야하는내과의사나 정신과의사와같이임상장면에있는심리학자들은 WISC-IV 를 지능적으로 사용하기 위해서최근의연구들에대한지식에서뒤처지지않아야한다 (Prifitera, Saklofske, & Weiss, 2005). 일반지능 (FSIQ) 과 WISC-IV 현재 B의전체지능점수 66은지난 5년동안학교에서보인보통수준의수행과보통- 보통상수준으로나타난집단능력검사결과와는반대되는것이다. 작년에발생한자동차사고와당시시행한두개골수술로인한광범위한두부손상은일반적이고특정한인지능력의손실을초래하였다. 지능점수가어떻게유용하게사용될수있을까? 이것은여러서로다른능력들의단순한평균치인가? 내가맡은학급의아이들은모두보통수준의능력을갖고있지만, 성취에서부터기술, 재능, 흥미에이르기까지광범위한차이가있다. 전체지능점수가동일한세명의소년들이있지만, 학업성적에서차이는매우크다. Wechsler 는지능을 개인이목적을가지고행동하며, 이성적으로사고하고, 주변환경을효과적으로다룰수있는총체적이고일반적인능력 이라고정의하였다 (Wechsler, 1944, p. 3). 언어성지능 (VIQ) 과동작성지능 (PIQ) 의개념이초기웩슬러검사의성공에핵심이었지만, 유아, 아동, 그리고성인버전의검사들은항상일반지능 (g) 의전통적인개념에굳게기반을두어왔다. 그러나오랜역사나전통이항상과학적으로정확한것은아니며, 오래지속되어온것은과학적기초데이터를모으는데기여하거나, 이와반대로비경험적으로타당화해온사상이나신념을강화시킬수도있다. 임상적평가와진단에있어서전체지능점수의적절성에대한두가지중요한관점이존재한다. 학교심리학자들은전체지능점수가분류의목적으로오랫동안사용돼왔으며, 능
112 WISC-IV 임상해석 력-성취차이 (AAD) 분석과관련이있기때문에유용하다고말한다. 그러나신경심리학자들은여러가지요소를포함하는지능점수는감별진단, 치료계획, 예후에대한민감도및특이도가부족하기때문에유의미하지않다고주장한다. 전체지능점수는 WISC-IV 에남게되었는데, 그이유는일반적인정신능력요인의존재에대한증거들과연구와평가에있어서광범위하게사용되기때문이다. 순수심리측정적관점에서볼때지능연구에서일반요인이나타나는경향을보인다 (Carroll, 1993). WISC-IV 기술및해석지침 (Wechsler, 2003b) 은전체지능점수라는이름으로남아있는일반요인에대한통계적인정보를제공한다 ( 예 : 소검사와지표점수의상관, 요인분석 ). 이처럼심리측정적으로전체지능점수가지지되고는있으나, 임상적유용성은여전히설명되어야만한다. 연구논문들은중요한개인차변인과인간행동의다양한예측변인으로서일반적인정신능력의중요성을분명하게증명해왔다. 그러나또다시심리학자들이직면한문제점들은실제평가장면에서전체지능점수의적절성과의미에관한것이다. 다른곳에서기술했듯이 (Prifitera, Saklofske, & Weiss, 2005), 일반지능을측정하는것에대한상당한양의생태학적이고규준적인타당성이존재한다 (Gottfredson, 1997, 1998; Kuncel & Hezlett, 2004). 전체지능점수는정신지체, 영재성, 낮은성취, 학습장애아동들을조작적으로정의하고확인하는데매우중요하다. 또한이는소검사나지표점수들사이의변산이적을경우유용한요약점수이며, 이질적인초등학생집단의학업성취도에대한가장좋은예측변인중하나이다. WISC-IV 와연관된다른검사들과의관계에서도전체지능점수는성취와기억력에관한소검사들과가장높은상관을보인다. 또한전체지능점수는다른어떤지표점수들보다영재성평정척도 (Gifted Rating Scale-School-Age Form, GRS-S:Pfeiffer & Jarosewich, 2003) 와상관이높다. 분석의마지막에심리학자들은전체지능점수가평가된아동의지능을기술하는데적절한지여부를결정해야하며, 그후에야전체지능점수가아동에대한이해를높이는데사용할수있다. 우리가심리측정적 임상적맥락에서전체지능점수를활용해왔던방법은이점수를사용하지말아야한다는일부의주장을불러일으켰다. 지능및지능검사의역사 (Boake,
제 3 장 WISC-IV 전체지능점수와일반능력지표해석 113 2002; Tulsky, Saklofske, & Ricker, 2003) 와일반적인심리평가와관련된문헌들은개인차변인에대한지식을넓혀주고측정을정교화하였으며, 지난 100 년동안, 특히 과거 10 년동안발전해온 최고의시행 체계를기반으로한정보활용의점진적인성 장을증명해주었다. 그러나전체지능점수의적절성에대한논란이또다시부각되고있는데, 이는아동의학습장애평가를둘러싼이견들때문이다. 이러한쟁점을 WISC-IV 전체지능점수의맥락에서간단히논의하였으며, 이장의후반부와 4장에서다시살펴볼것이다. 최근의논쟁점 : 학습장애평가장면에서능력 (FSIQ) 과 성취의차이분석 만약아이가자신이가진능력보다낮은성취수준을보인다면그것은학습장애가있다는것 을의미하나요? 우리학교에서는 IQ 와학업성취시험으로학생이학습장애가있는지를확인 하고있습니다. 학교심리학자가낮은학업성취를보이는아동을돕기위해사용하는가장일반적인방법은 WISC-III 나 IV와같은지능검사에서얻은전체지능점수 (FSIQ) 와 WIAT-II 과같은읽기와수학등핵심분야의학업성취에대한표준화된검사점수사이의유의미한차이를 확인하는것이다. 능력 - 성취차이 활용은미국연방정부장애인관련조례 (Individuals with Disabilities Act, IDEA) 에의해제정되었고실제로대부분의학교에서시행되었다. 그러나이두검사점수의차이를학습장애를확인하기위해사용하는데대한비판이늘어나고있다 (Francis, Fletcher, Stuebing, Lyon, Shaywitz, & Shaywitz, 2005; Siegel, 2003). 우선 IQ- 성취차이에는여러가지이유가있을수있으므로, 그차이가학습장애가아닌다른것을반영할수있다는주장은꽤논리적이라고볼수있다. 더구나학습장애는지능검사나학업성취검사같은심리측정적척도로완전하게평가할수없는복잡한상태이다. 셋째로, 심각한차이를확인하는데에단순비교혹은회귀분석같은동의된방
114 WISC-IV 임상해석 법이없다. 더문제가되는것은서로다른능력척도 [WISC-IV, 우드콕존슨인지능력검사제3판 (Woodcock, McGrew, & Mather, 2001), 스탠포드 -비네제5판 (Roid, 2003), 인지평가시스템 (Naglieri & Das, 1997), 차이능력척도 (Elliot, 1990)] 와성취척도 [WIAT-II, 우드콕존슨인지능력검사제3판, 다영역성취검사-III(Wilkinson, 1993), 코프만교육성취검사제2판 (Kaufman & Kaufman, 1998)] 가혼합되어사용됨으로써하나의차이규준을충족하는것이거의불가능하지만, 학습장애의진단은차이점수의절단점으로결정된다는것이다. 또한단순히학급의하위 25% 를학습장애라고보는것역시납득하기어렵다. 낮은학업성취에는수많은원인이있을수있다. Francis 와동료들 (2005) 은두진단법모두정당 한근거가없다고보았다. 그러나흔하게발생하지않는유의미한 능력 - 성취차이 는우 선적으로검증해야할가설이될수는있다. 검증결과, 만약그러하다면학습장애진단을지지하는추가적결과를찾아야할것이다. 또한그러한결과가평가과정초기에나타난다면그것은전문가로하여금학습장애진단을위한증거를찾도록하게될것이다. WISC-IV 또한그자체로만은아니지만, 아동의인지능력에대한상당부분의정보를제공하는하나의검사로서학습장애평가에기여할수있음을지지하는강력한결과가있다. 학습장애는언어적 비언어적정보의습득, 보존, 이해, 조직, 사용에영향을미친다. 장애는시각 - 공간적, 지각 - 운동적처리, 기억과주의, 실행기능, 음운론, 언어처리등 하나이상의심리적과정에서나타난다. 학습장애는전반적인장애라기보다는특수한영역의장애, 그리고평균지능과연관된다. WISC-IV 의전체지능점수, 지표점수, 소검사점수에대한조사결과는이검사와학습장애평가와의관련성을명확히보여준다. 능력-성취차이분석은한편으로는인지와지능사이의관계를자세히알려주고, 또한편으로는특정한교육기술과과제사이의관계에대해보여준다. 확실히학습장애를가진 아동을확인하는데 검사규준 에전적으로의존하는것은너무단순할뿐만아니라, 진 단혹은개입에충분하지못한방법이다. 이러한비판을고려할때, 능력- 성취차이분석은특수교육서비스의적격성을판정하기위한여러방법가운데하나로보는것이적절할것이다.
제 3 장 WISC-IV 전체지능점수와일반능력지표해석 115 전체지능점수의사용 L은매우명석한아동이다. L의 WISC-IV 전체지능점수는 138~147 정도로, 같은또래아이들가운데상위 1% 에드는수준이다. 교사의보고에따르면초등학교 4학년인 K는 1학년때부터학습에어려움을겪어왔는데, 이는낮은인지능력과관련된것으로보인다. K의전체지능점수는경계선수준이다. 이를볼때, K는학업성취에서계속적으로어려움을겪을것으로예상되며, 따라서조정된교육프로그램이필요해보인다. 전체지능점수는여러가지요소로이루어진합산점수이며, 이때문에가장신뢰롭고타 당한점수임에도불구하고, 검사의 부분들 이전달해주는세부적인정보를제공하지는 못한다. 모든소검사와지표점수가일관되게높거나낮다면, 전체지능점수는아동에게지적재능이있다거나정신지체가있음을확인하는데도움을줄수있을것이다. 하위검사들의점수편차가크지않을때합산점수를확인하는것은, 대부분의과목에서비슷한점수를받았을때그점수들을바탕으로학점을계산하는것과비슷하다. 아동의지적기능에대한보고서는흔히가장일반적인점수에서시작하여보다세부적인점수에대한설명으로이어진다 (Kaufman, 1994). WISC-IV 기술및해석지침 (Wechsler, 2003b) 의기본적프로파일분석지침은전체지능점수에대한설명에서시작하도록권유하고있으며, 이는 WISC-III 에서도마찬가지였다 (Kaufman, 1994; Sattler & Saklofske, 2001). WISC-IV 의구조는점수해석을전체지능에서부터시작하는하향식접근 (top-down approach) 을제안하지만, 이것이언제나엄격하게지켜지는것은아니다. 사실어떤심리학자들은지표점수를먼저살펴보고다양한프로파일분석을거쳐전체지능점수로해석을마무리하곤한다. 전체지능점수는지표점수간혹은지표점수내의분산이작을때전반적능력에대해알려주는매우유용한점수이다. 하지만그것을구성하는부분들의점수간에차이가예상되는관계에서크게벗어났을때그요인은 분열 (fracture) 되었다고볼수있다. 지표점수간에차이가클때에는요약점수로서전체지능점수의가치가제한