원저 문진석 1, 박경모 2, 최선미 1 한국한의학연구원 1 2, 경희대학교동서의료공학과 Web Interface Generator of Ontology Based CRF for Clinical Trial in Western and Oriental Medicine Jinseok Moon 1, Kyungmo Park 2, Sunmi Choi 1 Korea Institute of Oriental Medicine 1, Dept. of Biomedical Engineering, Kyunghee Univ. 2 Abstract Objective: This study aims to develop the web-interface creator, which automatically changes the Case Report Form(CRF) web page when the protocol developer in any clinical study revises the ontology of CRF. Methods: This study established the conceptual model of CRF on oriental and western medicine, and developed ontologies. A program was developed to produce online-based a input form through the parser that generates automatically HTML script from OWL. Results: The CRF applied in this study is a draft through consensus of experts for stroke research at the Korea Institute of Oriental Medicine. The ontology of CRF consisted of Label, ControlType and Value classes and hascontrol, hasvalue and hassymptoms properties. The Label is the class of question items groups, so it could have CRF questionnaire instances. The ControlType is the class that expresses controls such as checkbox, text, etc in the HTML script. The Value class represents selections for each items. Finally, the HTML script was created by XSL transformation from the OWL script. Conclusion: Online-based automatic interface creation, which enables immediate coping with the continuous change in the medical knowledge system, assures reduced time requirement. (Journal of Korean Society of Medical Informatics 15-1, 59-69, 2009) Key words: Ontology, OWL, XSLT, Electronic Case Report Form, Clinical Research 논문투고일 : 2008년 11월 18 일, 심사완료일 : 2009년 3월 9일교신저자 : 문진석, 대전광역시유성구전민동 461-24 한국한의학연구원의료연구부 (305-811) Tel: 042-868-94881, Fax: 042-863-9464, E-mail: moonstone2@kiom.re.kr * 이연구는한국한의학연구원(K08010) 의지원을받아수행하였습니다. 59
Ⅰ. 서론 임상연구를진행하면서개개피험자별로계획서에 서규정한정보를기록하여의뢰자에게전달될수있 도록고안한인쇄되거나전자문서화된서식인증례 기록서(CRF, Case Report Form) 를필수적으로작성하 게된다. 최근종이기반 CRF에서 ecrf(electronic Case Report Form), CTMSs(Clinical Trial Management Systems) 등의컴퓨터기반의임상시험관리시스템들의도입 으로임상자료의입력오류의감소, 자료의실시간전 송등의편의, 임상시험자료의질적가치향상등의 장점으로선호되고있다. 온톨로지(Ontology) 는단순히개념클래스의의미 를정의하는것이아니라, 개념클래스와관련된관계, 개념클래스간의연산함수, 지식추론을위한공리규 칙과개념인스턴스를총체적으로정의하여, 영역의 지식체계를형식화하는데목적이있다. 즉온톨로지 는영역지식표현을위한형식체계인것이다. 온톨 로지는획일적인데이터모델이아니라, 더욱대규모 로복합적인데이터모델개발시함축적인의미를 지닐수있다 1). 의학분야에서의온톨로지는표준용어시스템의필 요성으로처음시작하게되어, 시맨틱웹구현을위한 웹응용기술, 인공지능의지식표현연구등으로응용 되고있다 2). 나 의학용어시스템에서의온톨로지는 GALEN, UMLS SNOMED CT 가그대표적인예로들수있다. 중 국에서는 UMLS의모델을기반으로 UTCMLS(Unified TraditionalChineseMedicalLanguageSystem) 3) 을개발 하였다. UTCMLS 의 sub-ontology 는 The Basic Theory of Traditional Chinese Medicine 을비롯하여, The Doctrines of Traditional Chinese Medicine and Relevant Science, Chinese Materia 등총 14 개로구성되어있다. 국내에서한의학과관련된온톨로지연구들을살펴 보면, 대부분 domain ontology 위주로개발되어있다. 한의학용어의시소러스구축 4), 한의학온톨로지를 이용한논문검색시스템 5), 한의진단온톨로지개발 처방지식관리시스템개발 7) 등과같은온톨로지연구 들이지속적으로이루어지고있다. 처방지식관리시 스템은처방지식과관련된四診, 辨證, 論治, 方劑 4 개의영역으로구성하고 RDFS 기반의온톨로지구축 방법을제시하여한의학지식의체계화방법을제공 6), 하였다. 그밖에도온톨로지를기반으로 3차원 EMR (Electronic Medical Record) 있었다 8). 입력도구에대한연구도 ISO의 TC215 Working Group에서는 clinical findings ( 임상소견) 에대한용어의 conceptual framework 을 표준화하고있다 (ISO/TC 215 WG3 N231 - Draft ISO/DTS 22789(ballot version.7) Health informatics - Conceptual framework for patient findings and problems in terminologies) 9). 이규격의목적은보건의료과학에 서형식적개념표현시스템을서술하는데필요한 기본개념을정의하고컴퓨터기반개념표현시스템 에서사용되는개념과특성을기술하는것을목적으 로국제표준에서서술된내용모델을정확하게서술 하는것을가능하게한다. 온톨로지를활용하여임상정보들의개념(concept) 과 관계(relation) 등에대한지식을체계적으로표현할수 있을것이다. 병원과임상연구센터간의 CRF자료전송 시, 온라인을통하여 ecrf 를전송하게되는데, 이 ecrf의 User Interface 는임상연구프로토콜에따라변 하게된다. 이때 CRF의knowledge 가변하였을때, 웹 페이지가자동적으로변경될수있는인터페이스가 개발된다면, 시간적단축을확보할수있을것이다. 본논문에서는한양방증례기록서의구조를 interface ontology 관점에서온톨로지로설계하고, 이를자동으 로웹페이지로생성하는프로그램개발을목적으로 한다. 1. 시나리오 Ⅱ. 방법 병원과임상연구센터간의 CRF 자료전송시, 온라 인을통하여 ecrf 를전송하게되는데, 이 ecrf의 UserInterface 는임상연구프로토콜에따라변하게된 다. 따라서 CRF의knowledge 가변하였을때, CRF 개 발자는온톨로지를수정하게되면, 웹페이지가자동 적으로변경된다. CRF 개발자가 CRF내용을 ontology 로생성하거나수정 하면 WebUIMaker 에서는 ecrf Web Interface 인 HTML 파일로자동적으로변환한다. 그결과물인 ecrf에는 임상연구자가웹페이지에접속하여 된다 (Fig. 1). CRF를입력하게 60
Figure 1. Sequence diagram of e-crf 2. 개발방법 Ⅲ. 결과 개발프로세스는중풍임상연구 CRF에대한 conceptual model 을정립하고, ontology 를구축하여 OWL Script 를생성한후, XSLT를이용하여웹기반의 HTML 코딩으로변경하게된다(Fig. 2). 모델링시 Conceptual Model은 ISO/TC 215 WG3 N231 - Draft ISO/DTS 22789 (ballot version.7) Health informatics - Conceptual framework for patient findings and problems in terminologies 를참고로하여구성하였 다(Fig. 3). Characterising category간의 IS-A 관계를명 시하고, Semantic link로연결하여 concept diagram을 구성하였다. 이의개발목적은환자에게직간접적으 로영향을미치는증상, 검사를통한결과등의소견 들의 concept 과그들간의관계정립을통해임상 ter- minology 시스템에사용하는것이다. 또한이 clinical findings 는 ISO17115 Health informatics-vocabulary for terminological systems 10) 를기반으로만들어졌다. 온톨로지및 XSLT 개발을위한환경은다음과같다. Ontology 저작도구: Protégé 3.1(University of Stanford, USA.) XSLT Validation& Transformation 도구: XMLSpy 2006 Home Edition(Altova) Browser: Internet Explorer 6.0 1. 한양방중풍임상연구용 CRF의온톨로지 모델링 한국한의학연구원에서수행중인중풍임상연구에 사용되는증례기록서를바탕으로 Conceptual Model을 구성하였고, 온톨로지를개발하였다. 온톨로지를구 축하기위한모델은다음과같이표현된다 (Fig. 4). OntoCRF 를최상위노드로하여, Label 과ControlType, Value의subClass 가위치하고, Label은항목에해당하 는그룹군으로피험자정보, 진단명과같은 Label들의 상위클래스이다. 또한Label 의하위클래스는실제적 인항목을 instance 로가진다. ControlType 은항목이 가지고입력형식에대한 class로그 instance 들은 text, checkbox, data, time 등으로이루어져있다. Value class 는인터페이스상에서 Label subclass의 instance중에서 선택값이있는경우, hasvalue 관계를가지고있다. 예를들어 Label class의하위 class 인 진단명 class 를살펴보면,instance 로양방진단명을가지고있고, 양 방진단명은 Value class 의 subclass 인 질병명 의 ICH, SAH, Cerebral Infarction instance 와 hasvalue 관계 를이루고있는것을알수있다. Figure 2. Process of programming 61
Figure 3. Conceptual framework for patient findings-iso/tc 215 DTS 22789 Figure 4. Conceptual model of OntoCRF in cerebrovascular disease 62
또한피험자정보에서 Age 는 Control Type 으로 Text 를가지는것을확인할수있다. 2. OntoCRF(Ontology of CRF) (1) Class Class 간의관계는다음과같이구성되어있다. OntoCRF 를최상위 Class로하여ControlType, Domain, Label, Value, Unit 의하위클래스가있고, Label의하위 클래스로는 Person, Diagnosis, SyndromeDifferentiation ( 辨證, 변증; 한의학적진단명), VitalSign, History 등의 클래스로이루어져있다. Value는Label 에서해당하는 선택값들에대한데이터를 instance 로가질수있다. 이때 class name 에 crf:label_history 에서 Label 이 나, crf:value_gender 에서 Value 와같이상위 class 를표현해주어, OWL파일에서 instance 를 parsing 할 때, Label의하위 class, Value의하위 class를구분할 수있도록하였다. (2) Property Properties 는모두ObjectProperty 로Label 과Control 과 의관계를표현하는hasControl, Label과Value와의관계 를표현하는 hasvalue, 그리고四診 (FourDiagnosis; 4_ Jin) 과 辨證 (SyndromeDifferentiation) 과의 inverse property 로 hassymptoms( 辨證 hassymptom 四診 ), BelongTo( 四 診 BelongTo 辨證 ) 가구성되어있다. 그밖에도 hasunit 은 interface 의단위를표현하는데에사용될것이다 (Fig. 5). (3) Instance 각Label의Symptoms, Persons 등에해당하는 쉽게 피곤하고힘이없습니까?, 나이 등 CRF 문항을 instance 로추가한다. 추후에문항명칭이바뀌면, instance 에서수정하게된다. ControlType 의 Instance 는현재 CRF에서필요한 checkbox, data, radiobutton, text, time, unit 으로구성 되어있다. 이는다른컨트롤이필요할경우추가하면 된다 (Fig. 6). Figure 5. Classes(left) and properties(right) Figure 6. ControlType instance 63
각 instance 항목들의 Control을지정해주기위하여 hascontrol property 를이용하여위에서추가하였던 ControlType 의instance 를지정해준다. 예를들어crf:Label crf:label_4jin crf:label_palpation ( 四診 切診 ) 에해당하는 class 에서삭맥( 數脈 ) instance 는 checkbox Control 을가지고있고(hasControl), 음허 ( 陰虛 ) 와화열( 火熱 ) 의변증의증상으로선택할수있 다 (Fig. 7). 만약, CRF상에서數脈에대해서Yes/No 의checkbox 선택형태가아니라, High-Medium-Low 와같은 Value 타입의데이터형태라면, hasvalue 속성으로관계를 가질수있을것이다. 중풍에관한양방진단명으로 Value 값을 Value_ DiseaseName의 instance인 SAH(Sub-Arachnoid Hemorrhage; ( 뇌) 지주막하출혈), ICH(Intra-Cerebral Hemorrhage; 뇌 내출혈), Cerebral_Inf(Cerebral Infarction; 뇌경색증) 세 가지로입력할수있도록하였다(Fig.8). 이때의질병 명은한국표준질병사인분류 (KCD) 에있는질병명을 metadata 로사용할수있을것이다. Figure 7. Instance Tab Figure 8. hasvalue property 64
또한단위를웹페이지에표시하기위하여단위 (Unit) 도Value instance 로추가하였다. 그리하여둔부 둘레는 hascontrol 로 text 를가지고있고, hasunit으 로 cm 을가지고있다(Fig. 9). (4) Structure Class 간의관계및구조를살펴보면다음과같다. 대부분의 relationship 은 triple 구조를가지고있다. OntoCRF는 Label 을가지고있고, Label은 ControlType과 hascontrol 로관계되어있다. Label 의하위구조인四診 (4_Jin) 의望聞問切 (Inspection, Inquiring, AuscultationAndOlfaction, Palpation) 4개의Class 와SyndromeDifferentiation 은서 로belong과hasSymptoms 의inverse 관계를가지고있 다 (Fig. 10). TGVizTab 은OntoCRF 의subclass 와각class에해당하 는instance, property 를보여준다. OntoCRF 의subclass 인 SubjectInformation 의 instance 인 성별 은 Value값으 로 남, 여 를가지고있는것을볼수있다(Fig. 11). Figure 9. hasunit property Figure 10. Structured view of OntoCRF by OntoViz 65
(5) Query Protégé 의QueriesTab 을이용하여조건에해당하는 결과를쉽게검색할수있는쿼리를개발하였다 (Fig. 12). ControlType 으로 checkbox 를가지고있는 Label instance 를찾는 Query 를검색하면 설사, 태가황색 이다 등의결과를볼수있다. 또한 Label의하위클래스에있는 Symptoms 와辨證 간의관계를이용하여 Query 를만들수있다. 濕痰에 해당하는망진증상을찾고자할때, Inspection belongsto 濕痰 Query 를지정하면, 얼굴이누렇거나 때가낀것같다., 반대설, 백태, 치흔 등의증 상결과를얻을수있다. Figure 11. Relationship View using TGVizTab Figure 12. Queries tab to search instances 66
3. WebUIMaker WebUIMaker 는 OWL Script 를이용하여질의항목들의 category(class), 질의항목(instance), 항목의ControlType, 단위등을자동적으로 HTML 로변환해줌으로써, CRF 변화에따라온톨로지를수정하면, 웹페이지를자동 적으로변경이가능하게한다. 구축된 OWL Script를 XSLT를이용하여 HTML로변 환하는알고리즘은 Figure 13 과같다. XSLT를이용하여crf:Label 의element 로지정되어 있는 Class를추출해내어질의항목에대한상위 Class 를표현해준다. 그리고 crf:label의attribute 인instance 를추출하여질의항목을생성한다. 다음으로이 crf:controltype 에서 instance 의데이터표현타입에따라 textbox, checkbox, date, time등으 로입력할수있는란을표시한다. 입력값이여러개 중선택해야하는경우는crf:hasValue 의element 를추 출해내어입력값을나열해준다. 그리고입력값의단위를표현해야하는경우는 crf:hasunit 의element 를탐색하여입력란뒤에표시해 주도록하였다. 4. 자동생성된 ecrf webpage XSLT 를통하여도출된결과는아래와같이웹페이 지로표현된다 (Fig. 14). 어떤도메인에대한 CRF인지를 Domain Class의인 스턴스인 Stroke 을도출하였고, 각 Class별로 Instance 를표현해주고있다. 또한각 Instance 의InputType 이 Text, Checkbox, Value, Date 등에따라서입력 Control 이위치해있는것을확인할수있다. 또한단위가 필요한경우입력란뒤에표현되어있는것을볼수 있다. 구취 는 Yes/No 의binary 타입의checkbox 로표 현되어있고, 사상체질진단전문의 는 불분명, 태 양인, 소음인, 태음인, 소양인 의선택할수있고, 흡연량 은textbox 와단위인 pack-year 로입력폼이 구성되어있다. Figure 13. XSL algorithms for transformation from OWL to HTML 67
Figure 14. Output to HTML Ⅴ. 고찰 근거기반의한의학으로발전하기위하여한의학임 상시험연구가늘어나고있고, WHO등에서는한의 학을비롯하여전통의학의용어및진료의국제표준 화를위하여노력하고있다. 이에발맞추어한양방융 합연구를위한 다수의한방병원에서 e-crf 의개발이필요할것이다. 이미 EMR이개발되어사용되고있 으며, 이를기반으로한의학적개념과양의학적개념 을연결할수있는온톨로지를활용하여임상연구및 진료에활용한다면, 보다체계적으로접근할수있으 리라생각된다. 본연구는임상연구시필요한 CRF를온라인기반 입력폼으로개발하기위하여, CRF knowledge 를 OWL 로표현하고, 이를 XSLT를이용하여 HTML로 자동변환함으로써 CRF 변화에따라신속하게웹페 이지를생성, 수정할수있도록하여개발기간을단축 시키는이점을가지고있다. Ontology 를생성하기전에 ISO의 clinical findings 를 참고로하여한양방임상연구시에필요한항목들을 보완하여 conceptual model 을구성하였다. CRF는중 풍임상연구에있어한의및양의융합연구시증례 기록서에필요한항목들을 domain expert들이동의한 표준안을바탕으로온톨로지를개발하였다. 온톨로지 기반으로개념을표현하게되면, hierarchy 뿐만아니 라, 각개념들간의관계도표현가능하다.OntoCRF 의 기본골격은 들은 자체로도 class 로개념틀을형성하고, 개개의항목 instance 로추가할수있도록구성하여, OntoCRF CRF 에대한개념도구로사용할수있다. CRF의ontology 표현으로OntoCRF 의subClass 를Label 과 ControlType, Value 로구성하였다. Label은질문에 대한 Instance 를추가하고, ControlType 은각항목에 따른 HTML 기반의입력방식을표현하였다. 그리고 Value 는각항목의선택값에대한 Instance 를나타낸다. 온톨로지저작도구인 Protégé를이용하여온톨로 지를구축하였고, 이를통해생성된 OWL Script를 XSLT를이용하여 HTML 파일로생성하였다. HTML 파일은 CRF 를입력하기위한웹페이지로사용된다. 임상정보들의개념(concept) 과관계(relation) 등에대 한구조화된지식인온톨로지를활용한다면더욱체 계적인자료에대한지식을표현할수있을것이다. 그리고의학지식체계의계속적변화에따라웹페이지 의자동생성으로시간적단축을확보할수있을것 이다. 68
본논문에서개발된중풍도메인에서의한양방융합 임상연구를위한증례기록서 ontology 는다른질환에 적용되어재사용가능하다.OWL 파일을 HTML기반의 입력폼으로변환해주는 아닌다른도메인의 OWL파일도 WebUIMaker 는증례기록서가 Class, Instance, ControlType, Value등으로 representation 하면웹페이지 로생성이가능하다. 본연구를응용한활용방안으로는질병명을 Value 로가지는 Label들은 UMLS 나 SNOMED CT, LOINC 등과연계하여더욱체계적인의학용어를사용할수 있다. 온톨로지의모델로사용한 Conceptual framework for patient findings and problems in terminologies 은일 반진료기반에서발생되는도메인으로임상연구에서 사용되는환경과는차이가있다. 이에따라보다임상 연구에적합한모델개발이필요하다. 또한임상연구 와관련되는 data management 프로그램으로 ICH Guideline 이나HIPAA 와같은규정뿐만아니라, CDISC (Clinical Data Interchange Standards Consortium) 과 같은임상연구를위한국제표준등도고려해야할 것이다. 참고문헌 1. Lee HS. 합성온톨로지기반의한의학처방지식관리시스템. Paju:Korean Studies Information Co.,Ltd; 2006.pp.13-16. 2. Kim HG, Kim MK. Ontology Technology in Medical Informatics. Journal of Korean Society of Medical Informatics 2003;9(3):213-219. 3. ZhouX,WuZ,YinA,WuL,FanW,ZhangR..Ontology Development for Unified Traditional Chinese Medical Language System. Artif Intell Med 2004;32(1):15-27. 4. Knowledge of oriental medicine web service. Available at: http://jisik.kiom.re.kr. Accessed November 25, 2006. 5. KoYM,EomDM.Thestudyonthedesignofkorean medical article retrieval system supporting semantic navigation based on ontology. Korean Journal of Oriental Medicine 2005;11(2):35-52. 6. Park JH, Shin SW, Jung GS, Park KM, Kim SH. Development and evaluation of ontology for diagnosis in oriental medicine. Korean J. Oriental Physiology &Pathology 2006;20(1):202-208. 7. LeeHS,LeeTY.Astudyofthedesignofontoology-based prescription knowledge management system of oriental medicine. Journal of the Korean Society for Information Management 2003;20(1): 341-371. 8. Lim HS, Park KM. Interface design for structured data entry in computerized patient records system and its development. The Journal of the Korea Institute of Oriental Medical Diagnostics 2003;7(1):76-82. 9. ISO/TC 215 WG3 N231- Draft ISO/DTS 22789(ballot version.7) Health informatics- Conceptual framework for patient findings and problems in terminologies. 10. ISO 17115 Health informatics - Vocabulary for terminological systems.2005. 69