Journal of the Korea Institute of Information and Communication Engineering ์ํ์ฉ์ด์ํจ์จ์ ์ธ๊ฒ์์์ํ๊ฒ์๋ธ๋ผ์ฐ์ ์์๊ฑด๋ถ์ ๋ฅ์ฐ์ * Requirement Analysis of Search Browser for Efficient Searching of Clinical Terminology Wooseok Ryu * Department of Health Care Management, Catholic University of Pusan, Busan 609-757, Korea ์์ฝ SNOMED CT ๋์ ์์๋ฌด๊ธฐ๋ก (EMR) ๋ฐ์ ์๊ฑด๊ฐ๊ธฐ๋ก (EHR) ์์คํ ์์ํ์คํ๋์ฉ์ด๋ฅผ์ฌ์ฉํ์ฌ์ง๋ก๊ธฐ๋ก์์์ฑํ๊ณ ๊ด๋ฆฌํ๊ธฐ์ํํ์ค์ํ์ฉ์ด์ฒด๊ณ์ด๋ค. ์ด์ฉ์ด์ฒด๊ณ๋์ฉ์ด์๋ฐฉ๋ํจ๋ฐ์ค๊ณ๊ตฌ์กฐ๋ก์ธํด์ฉ์ด์ฒด๊ณ๊ฐ๋งค์ฐ๋ณต์กํํน์ง์ด์๋ค. SNOMED CT ์์์ ๊ณตํ๋์ํ์ฉ์ด๋ฅผ๊ฒ์ํ๊ธฐ์ํด์ง๋ฃ๊ณผ์ ์์์ฌ์ฉํ๋๊ธฐ์กด์๋ธ๋ผ์ฐ์ ๋ค์์ฉ์ด์ฒด๊ณ์๋ณต์ก์ฑ์๋ฐ์ํ์ง๋ชปํ์ฌ์ง๋ฃ๊ธฐ๋ก์์์ฑ๋จ๊ณ์์๊ทธํจ์ฉ์ฑ์ด๋จ์ด์ง๋๋ฌธ์ ๊ฐ์๋ค. ๋ณธ์ฐ๊ตฌ์์๋ SNOMED CT ๋ธ๋ผ์ฐ์ ์๋ด์ฌ๋๋ฌธ์ ์ ์์ ์ํ๊ณ ์ฉ์ด์ฒด๊ณ์๋ถ์์ํตํด์ํ์ฉ์ด๋ฅผ๋น ๋ฅด๊ณ ํจ์จ์ ์ผ๋ก๊ฒ์ํ๊ธฐ์ํ๊ฒ์๋ธ๋ผ์ฐ์ ์์๊ฑด์๋ถ์ํ๊ณ ๊ฐ์ ์์์ ์ํ๋ค. ABSTRACT SNOMED CT is a standard clinical terminology to provide a standardized way to record and manage clinical records for EMR or EHR. The structure of SNOMED CT is very complex because of huge expressive power and its internal design mechanism. Although there are some SNOMED CT browsers for browsing and searching SNOMED CT concepts, they are less effective because they do not consider such complexity of SNOMED CT. This paper depicts problems of current SNOMED CT browsers and analyze SNOMED CT dataset. Then, this paper analyze requirements of SNOMED CT browser which improves searching and selecting of appropriate clinical terms. ํค์๋ : SNOMED CT, ์ํ์ฉ์ด, ๊ฒ์๋ธ๋ผ์ฐ์ , ์๊ตฌ๋ถ์ Key word : SNOMED CT, Clinical Terms, Search Browser, Requirement Analysis ์ ์์ผ์ : 2014. 10. 01 ์ฌ์ฌ์๋ฃ์ผ์ : 2014. 10. 31 ๊ฒ์ฌํ์ ์ผ์ : 2014. 11. 05 * Corresponding Author Wooseok Ryu (E-mail:wsryu@cup.ac.kr, Tel:+82-51-510-0611) Department of Health Care Management, Catholic University of Pusan, Busan, 609-757, Korea Open Access http://dx.doi.org/10.6109/jkiice.2014.18.11.2691 print ISSN: 2234-4772 online ISSN: 2288-4165 This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License(http://creativecommons.org/li-censes/ by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited. Copyright C The Korea Institute of Information and Communication Engineering.
โ . ์๋ก SNOMED CT(Systematized Nomenclature of Medicine-Clinical Terms) ๋์ง๋ฃ๊ธฐ๋ก์ํ์คํ๋์ฉ์ด๋ฅผ์ด์ฉํ์ฌ๊ธฐ๋ก๋ฐ๊ด๋ฆฌํ๊ธฐ์ํด์ฌ์ฉํ๋ํ์ค์ํ์ฉ์ด์ฒด๊ณ์ด๋ค. ์ด์ฉ์ด์ฒด๊ณ๋์ง๋ฃ๊ธฐ๋ก์๊ด๋ฆฌ, ์์๊ณผ์ ์๋ถ์๋ฐํ์ฉ์๋ชฉ์ ์ผ๋ก์ ์ธ๊ณ์ ์ผ๋ก๋์ ์ํ๋ํ๊ณ ์๋๋ฐ, ๋ฏธ๊ตญ์์๋์ ์๊ฑด๊ฐ๊ธฐ๋ก (Electronic Health Record) ์์ํํ์ค์ฉ์ด์ฒด๊ณ๋กํ์ฉํ๊ณ ์์ผ๋ฉฐ๊ตญ๋ด์์๋์ ์์๋ฌด๊ธฐ๋ก (Electronic Medical Record) ์์คํ ์ผ๋ก๊ทธํ์ฉ๋ฒ์๋ฅผ๋ํ๊ฐ๊ณ ์๋ค. SNOMED CT๋ 40๋ง์ฌ๊ฐ์๋ฐฉ๋ํ์ํ์ ์๋ฏธ ( ์ปจ์ ) ๋ค์ํฌํจํ๊ณ ์์ผ๋ฉฐ, ๊ทธ๋ฐฉ๋ํจ๊ณผ์ค๊ณ๊ตฌ์กฐ๋๋ฌธ์์ปจ์ ๊ฐ์์ฉ์ด๊ฐ์๋ก๋์ผํ๊ฑฐ๋ํ๋์์ปจ์ ์ด์ฌ๋ฌ์ฉ์ด๋ฅผํฌํจํ๋ํน์ง์ด์๋ค [1,2]. ์์ฌ, ์๋ฌด๊ธฐ๋ก์ฌ๋ฑ์ด์ฉ์ด์ฒด๊ณ๋ฅผํ์ฉํ๋์ฌ๋๋ค์ด์ปจ์ ๋ค์๋ชจ๋๊ธฐ์ตํ๊ณ ์์ง๋๋ชปํ๋ฏ๋ก๋ณต์กํ์ฉ์ด์ฒด๊ณ๋ฅผ๊ฒ์ํ๊ธฐ์ํ์ฉ์ด๊ฒ์ํ๋ก๊ทธ๋จ์ธ SNOMED CT ๋ธ๋ผ์ฐ์ [3] ๋ฅผํ์ฉํ์ฌํ์์์ง๋จ, ์์ ๋ฑ์์๊ณผ์ ์์๋ฐ์ํ๋์ํฉ์ํํํ๋์ปจ์ ์๊ธฐ๋กํ๊ณ ์๋ค. ํ์ง๋ง๊ธฐ์กด์์ฌ์ฉ๋๋๋ธ๋ผ์ฐ์ ๋ค์๋ฌธ์์ด๊ฒ์์์ค์์ปจ์ ๊ฒ์์๊ฒฐ๊ณผ๋ก์ปจ์ ์๋ํ์ฉ์ด (description), ๊ณ์ธต๊ตฌ์กฐ (Concept Hierarchy), ๊ด๊ณ (Relationship) ๋ค์์ ์ํ๋๊ฒ์๋จธ๋ฌด๋ฅด๊ณ ์์์๋ฐ๋ผ์ฉ์ด๊ฐ๋์ผํ์ปจ์ ๋ค์๋น ๋ฅธ์๊ฐ๋ด์๊ฒ์ / ์ ํํ์ฌ๊ธฐ๋กํ๊ธฐ๊ฐ์ด๋ ค์ดํ๊ณ๊ฐ์๋ค. ๊ธฐ์กด์๋ธ๋ผ์ฐ์ ๋ง์ผ๋ก๋์ด๋ฐํ์ง๋ฃ๊ธฐ๋ก์์์ฑ๋จ๊ณ์์์์์ ์๋ฏธ๋ฅผ์ ํํ๊ฒํํํ๋์ฉ์ด๋ฅผ๋น ๋ฅด๊ฒ์ ํํ๊ธฐ๊ฐ์ด๋ ค์ด๋ฌธ์ ๊ฐ๋ฐ์ํ๋ค. ๋ณธ๋ ผ๋ฌธ์์๋ํจ๊ณผ์ ์ธ์ํ์ฉ์ด๊ฒ์์์ํด์ SNOMED CT ๊ฒ์๋ธ๋ผ์ฐ์ ๊ฐ๊ฐ์ ธ์ผํ ๊ธฐ๋ณธ์ ์ธ์๊ฑด [4] ์ํ์ฅํ์ฌํจ๊ณผ์ ์ธ์ฉ์ด๊ฒ์์์ํ๊ฒ์๋ธ๋ผ์ฐ์ ์๊ฐ์ ๋ฐฉ์๋ฐ์ด๋ฅผ์ํ์๊ตฌ์ฌํญ์์ ์ํ๊ณ ์ํ๋ค. ์ด๋ฅผ์ํด๋ณธ๋ ผ๋ฌธ์์๋๋จผ์ SNOMED CT๊ฐ๊ฐ์ง๋๋์ผํ์ฉ์ด๋ค์ํน์ฑ์๋ถ์ํ๊ณ , ์ด๋ถ์๊ฒฐ๊ณผ๋ฅผ๋ฐํ์ผ๋ก๊ฒ์๋ธ๋ผ์ฐ์ ๊ฐ๊ฐ์ ธ์ผํ ๊ธฐ๋ฅ์ ์๊ฑด์์ ์ํ๋ค. ๋ณธ๋ ผ๋ฌธ์๊ตฌ์ฑ์๋ค์๊ณผ๊ฐ๋ค. 2์ฅ์๋ฌธ์ ๋ถ์์ผ๋ก์๋จผ์ SNOMED CT ์ฉ์ด์ฒด๊ณ๋ฅผ๊ฐ๋จํ๊ธฐ์ ํ๊ณ ๊ธฐ์กด์๊ฒ์๋ธ๋ผ์ฐ์ ๊ฐ๊ฐ์ง๊ณ ์๋๋ฌธ์ ์ ์์ ์ํ๋ค. 3์ฅ์์๋ SNOMED CT์๊ณ์ธต๊ตฌ์กฐ๊ฐ๊ฑฐ๋ฆฌ๋ถ์ (Distance Analysis) ์ํตํด์ฉ์ด์ฒด๊ณ์๋ด์ฌ๋์ปจ์ ์๋ณต์ก์ฑ์๋ถ์ํ๊ณ 4์ฅ์์๋๋ถ์๊ฒฐ๊ณผ๋ฅผ๋ฐํ์ผ๋กํจ๊ณผ์ ์ธ์ํ์ฉ์ด๊ฒ์์์ํด๊ฒ์๋ธ๋ผ์ฐ์ ๊ฐ์ถ๊ฐ์ ์ผ๋ก์ ๊ณตํด์ผํ ์๊ฑด์์ ์ํ๋ค. ๋ง์ง๋ง์ผ๋ก 5์ฅ์์๊ฒฐ๋ก ๋ฐํฅํ์ฐ๊ตฌ๋ฅผ๊ธฐ์ ํ๋ค. โ ก. ๋ฌธ์ ์ ์ 2.1. SNOMED CT ์ฉ์ด์ฒด๊ณ๊ฐ์ SNOMED CT์์ปจ์ ์ SNOMED Clinical Terms ๋ผ๋๋ฃจํธ์ปจ์ ๋ถํฐ is-a ๋ผ๋๊ด๊ณ (Relationship) ๋ฅผํตํดํ์์ปจ์ ์ผ๋ก๊ณ์ธต๊ตฌ์กฐ๋ฅผํ์ฑํ๊ณ ์๋ค. ๋ฃจํธ์ปจ์ ๊ณผ is-a ๊ด๊ณ๋ก์ง์ ์ ์ผ๋ก์ฐ๊ฒฐ๋์ต์์์ปจ์ (Top-Level Concept) ์ Body Structure, Clinical Finding, Procedure ๋ฑ 19๊ฐ๋ก์์๋ฏธ์ ์ผ๋ก๋ช ํํ๊ฒ๊ตฌ๋ถ์ด๋์ด์๋ค. ๋๋จธ์ง์ปจ์ ๋ค์ํ๋์ด์์์ต์์์ปจ์ ์์์ (descendant) ์ผ๋ก์ is-a ๊ด๊ณ๋ฅผํตํด๊ณ์ธต์ ์ผ๋ก์ฐ๊ฒฐ๋์ด์๋ค. SNOMED CT ์ปจ์ ๊ณ์ธต๊ตฌ์กฐ์์์๋๊ทธ๋ฆผ 1๊ณผ๊ฐ๋ค. ๊ทธ๋ฆผ 1์์๋ disorder ๋ผ๋์ปจ์ ์ํ์์ปจ์ ๋ค์์ผ๋ถ๋ฅผ๋์ํ๊ณ ์๋๋ฐ๊ทธ๋ฆผ์์๋ณผ์์๋ฏ์ด SNOMED CT ์ปจ์ ์๊ณ์ธต๊ตฌ์กฐ๋๋ค์ค๋ถ๋ชจ์ปจ์ ์ํ์ฉํ๊ณ ์๋ค. ์๋ฅผ๋ค์ด J๋กํ๊ธฐ๋ Fracture ์ปจ์ ์๋ถ๋ชจ์ปจ์ ์ E์ F์ด๋ฉฐ bone or arm injury ์ bone or joint injury ๋์ปจ์ ์ํน์ฑ์๋ชจ๋ํฌํจํ๋ค. ๊ทธ๋ฆผ 1. SNOMED CT ์์ปจ์ ๊ณ์ธต๊ตฌ์กฐ์์ [5] Fig. 1 An example of SNOMED CT concepts hierarchy 2692
์ํ์ฉ์ด์ํจ์จ์ ์ธ๊ฒ์์์ํ๊ฒ์๋ธ๋ผ์ฐ์ ์์๊ฑด๋ถ์ ๊ฐ๋ณ์ปจ์ ์์ซ์๋ก๊ตฌ์ฑ๋ ID๋ผ๋์๋ณ์๋ฅผํตํด์์๋ก๊ตฌ๋ถ๋๋ฉฐ์ปจ์ ์์๋ฏธ๋์ฌ๋ฌ๊ฐ์์ํ์ฉ์ด (Description) ๋ค์ํตํด๋ถ์ฌ๋๋ค. ์ด๋ํ๋์์ปจ์ ์์ฌ๋ฌ๊ฐ์์ฉ์ด๋ฅผ๊ฐ์ง๋๋ฐ, ์ด๋ํ๋์์ปจ์ ์ดํ๊ฐ์ง์๋จ์ด๋๋์ด๊ตฌ๋ก๋งํํํ๊ธฐ์ด๋ ต๊ธฐ๋๋ฌธ์ด๋ค. ์ด์ฉ์ด๋ FSN(Fully Specified Name) ๊ณผ๋์์ด (Synonym) ์ผ๋ก๊ตฌ๋ถํ๋ฉฐํ์ปจ์ ๋นํ๋์ FSN๊ณผ์ฌ๋ฌ๊ฐ์๋์์ด๋ฅผํฌํจํ๋ค. 2.2. SNOMED CT ๋ธ๋ผ์ฐ์ SNOMED CT ๋ธ๋ผ์ฐ์ ๋ ID ๋๋์ํ์ฉ์ด๋ฅผ์ด์ฉํ์ฌ SNOMED CT์ํฌํจ๋์ปจ์ ๋ค์๊ฒ์ํ๊ธฐ์ํ๊ฒ์ํ๋ก๊ทธ๋จ์ด๋ค. ์ด๋ธ๋ผ์ฐ์ ๋๋๋ถ๋ถ์๊ฒฝ์ฐ์ธํฐ๋ท์์์๊ฒ์์ฌ์ดํธํํ๋ก๊ตฌํ๋์ด์๋ค [6,7]. ๊ฒ์๋ธ๋ผ์ฐ์ ๋ค์๊ธฐ๋ฅ์๋น๊ต์ ์ ์ฌํ๋ฐ์ฉ์ด์์ด๋ฆ๋๋ ID๋ฅผ์ด์ฉํ๊ฒ์์์ง์ํ๋ฉฐ์ฉ์ด๋ค์ํตํํด๋น์ปจ์ ์๋ํ์ค๋ช , ๊ณ์ธต๊ตฌ์กฐ, is-a, site ๋ฑ์๊ด๊ณ์ ๋ณด๋ค์๋ธ๋ผ์ฐ์ ๋ฅผํตํด์กฐํํ ์์๋ค. ๊ทธ๋ฆผ 2๋ US National Library of Medicine (NLM) ์์์ ๊ณตํ๋ SNOMED CT ๋ธ๋ผ์ฐ์ [6] ์์๊ณจ๋ฐ๊ด์ ์์๋ฏธํ๋ joint of pelvis ๋ก๊ฒ์์์ํํ์์๋์๊ฒ์๊ฒฐ๊ณผ์์์ด๋ค. NLM ๋ธ๋ผ์ฐ์ ๋ฅผํฌํจํ๋ชจ๋ SNOMED CT ๋ธ๋ผ์ฐ์ ๋๋ฌธ์์ด๋งค์นญ์ํตํด๊ฒ์๊ฒฐ๊ณผ๋ฅผ์ ์ํ๋๋ฐ, ๊ทธ๋ฆผ์์๋ํ๋๋ฐ์๊ฐ์ด๊ทธ๊ฒฐ๊ณผ๋ก์์ด 9๊ฑด์ด๋ชฉ๋ก์ผ๋กํ์๋๋ค. ์ด 9๊ฑด์๊ฒ์๊ฒฐ๊ณผ๋ joint of pelvis ๋ผ๋์ด๊ตฌ๋ฅผํฌํจํ๋์ปจ์ ๋ค์๋ชฉ๋ก์ธ๋ฐ์ด์ปจ์ ๋ค๋ชจ๋๊ฐํด๋น์ด๊ตฌ๋ฅผ์ํ์ฉ์ด (description) ์ผ๋กํฌํจํ๋๊ฒฝ์ฐ์ด๋ค. ๋๋ถ๋ถ์๊ฒ์๊ณผ์ ์์๊ฒ์๊ฒฐ๊ณผ๋๋๊ฐ์ด์์์ปจ์ ์ผ๋ก๋ํ๋๋๋ฐ๋ฌธ์ ๋์ด๋ชฉ๋ก๋ง์ผ๋ก๋์๋ํ๋์ปจ์ ์๋ฐ๋ก์ ํํ๊ธฐ๊ฐ๋งค์ฐ์ด๋ ต๋ค๋์ ์ด๋ค. ๊ทธ๋ฆผ 2๊ณผ๊ฐ์๊ฒฝ์ฐ์์๊ณผ์ ์์์ ํํ์ปจ์ ์์ ํํ๊ธฐ์ํด์๋ 9๊ฐ์์ปจ์ ์๋ชจ๋ํด๋ฆญํด์์์ธ์ ๋ณด๋ฅผ์กฐํํด์ผํ๋๋ฐ์ด๊ณผ์ ์์ํํ๊ธฐ์๋๊ธฐ๋ก์๊ฐ์ด์ฌ์ค์๋งค์ฐ์งง์ผ๋ฉฐ๊ทธ์๋ฏธ๋ฅผ๊ตฌ๋ถํ๊ธฐ๋์ด๋ ต๋ค. SNOMED CT ์ฉ์ด์ฒด๊ณ์์๋๋์ผํ์ํ์ฉ์ด๊ฐ์ฌ๋ฌ์ปจ์ ์์์ฌ์ฉ๋๊ณ , ์ด๋์ฉ์ด๊ฐ์๋ก๋์ผํ์ปจ์ ๋ค์์ฉ์ด๊ฒ์์์ํญ์๊ฐ์ด๊ฒ์๋๋ฏ๋ก์ฌ์ฉ์์๊ฒํผ๋์์ผ๊ธฐํ๋ค. ๊ทธ๋ฌ๋ฏ๋ก๊ฒ์๊ฒฐ๊ณผ๋ฅผ๋จ์ํ๋ชฉ๋ก์ผ๋ก์ ์ํ๋๊ฒ๋์ ํจ๊ณผ์ ์ผ๋ก๊ฒ์๊ฒฐ๊ณผ๋ฅผ์ ์ํ๋๋ค๋ฅธ๊ธฐ๋ฒ์ดํ์ํ๋ค. ๊ทธ๋ฆผ 2. NLM ๋ธ๋ผ์ฐ์ ์๊ฒ์๊ฒฐ๊ณผ์์ Fig. 2 An example of search results โ ข. SNOMED CT ์ฉ์ด์ฒด๊ณ์๋ถ์ ์ด์ฅ์์๋๊ฒ์๊ฒฐ๊ณผ๋ชฉ๋ก์๊ฐ์ ํ๊ธฐ์ํ์ฌ SNOMED CT ๋ฐ์ดํฐ์ ์์์ปจ์ ๊ฐ์ฉ์ด์๋์ผ์ฑ์๋ถ์ํ๋ค. ๋ถ์๋์๋ฐ์ดํฐ์ ์ 2014๋ 1์๋ฐฐํฌ๋ SNOMED CT International Release Format 2 (Snapshot)[8] ์ด๋ค. ์ด๋ฐ์ดํฐ์ ์์์ํ์ฑ์ปจ์ (Active Concept) ์์๋์ฝ 30๋ง๊ฐ, ํ์ฑ์ฉ์ด (Active Description) ์์๋์ฝ 100๋ง๊ฐ๊ฐ๋์ด๋ค. ๊ทธ์ค FSN, ๋์์ด๋ฑ์์ฉ์ด๊ฐ์๋ก์์ ํ๋์ผํ์ปจ์ ์์์๋ถ์๊ฒฐ๊ณผ์ฝ 12,714์์ด์กด์ฌํ๋๊ฒ์ผ๋กํ์ธ๋์๋ค. ๋ณธ๋ ผ๋ฌธ์์๋๋์ผํ์ฉ์ด๋ฅผ๊ฐ์ง๋๋์ปจ์ ์๋ถ์ํ๊ธฐ์ํ์ฌ์ปจ์ ๊ฐ์๊ฑฐ๋ฆฌ (distance) ๋ฅผ์ด์ฉํ๋ค. SNOMED CT ์ฉ์ด์ฒด๊ณ์์์ปจ์ ์๋ชจ๋ is-a ๊ด๊ณ๋ฅผํตํด์๊ณ์ธต๊ตฌ์กฐ์์์์๋ก์ฐ๊ฒฐ๋์ด์์ผ๋ฏ๋ก, is-a ๊ด๊ณ๋ฅผ์ด์ฉํ์ฌ๋์ปจ์ ๊ฐ๊ฑฐ๋ฆฌ์์ฐ์ถ์ด๊ฐ๋ฅํ๋ค. ์ด๋๊ฑฐ๋ฆฌ๋๋์ปจ์ ์ด์๋ก๋ถ๋ชจ-์์ (Parent- Child) ์ผ๋ก์ฐ๊ฒฐ๋์ด์๋๊ฒฝ์ฐ 1๋ก๊ณ์ฐํ์์ผ๋ฉฐ, ๋์ปจ์ ์ดํ์ (sibling) ์ธ๊ฒฝ์ฐ์๋๊ฑฐ๋ฆฌ๋ฅผ 2๋ก๊ณ์ฐํ์๋ค. ๊ทธ๋ฆฌ๊ณ ๋์ปจ์ ๊ฐ๋๋ฌํ๋๊ณ์ธต๊ตฌ์กฐ์์์์๊ฒฝ๋ก (path) ๊ฐ์ฌ๋ฌ๊ฐ์ธ๊ฒฝ์ฐ์๋๊ฑฐ๋ฆฌ๊ฐ๊ฐ์ฅ์งง์๊ฒฝ๋ก์์์๊ฑฐ๋ฆฌ๋ก์ฐ์ ํ์๋ค. 2693
ํ 1์์ฉ์ด๊ฐ๋์ผํ์ปจ์ ์์์๋ํด์๊ณ์ธต๊ตฌ์กฐ์์์์๋์ปจ์ ๊ฐ๊ฑฐ๋ฆฌ๋ฅผ๋ถ์ํ์ฌ์ ์ํํ์ด๋ค. ๋ถ์๊ฒฐ๊ณผ๊ฑฐ๋ฆฌ๊ฐ 5 ์ดํ์ธ์์๋น์จ์ด 58.1% ๋ก์ ๋ฐ์๋๋๊ฒ์ํ์ธํ ์์์ผ๋ฉฐํ์๋๋ชจ๋๊ธฐ์ ๋์ง์์์ผ๋๊ฑฐ๋ฆฌ๊ฐ 1, ์ฆ๋ถ๋ชจ- ์์๊ด๊ณ์ธ์ปจ์ ์๋น์จ์ด์ ์ฒด์ 50% ์ธ๊ฒ์ผ๋กํ์ธ๋์๋ค. ํ 1. ๋์ผ์ฉ์ด๋ฅผ๊ฐ์ง๋์ปจ์ ์๊ฑฐ๋ฆฌ๋ถ์ Table. 1 Distance analysis of concepts with an identical description ๊ฑฐ๋ฆฌ ์ปจ์ ์์์ ๋น์จ 1-5 7,387 58.1% 6-10 2,104 16.5% 11-15 2,762 21.7% 16-20 430 3.4% 21-25 31 0.2% ํฉ๊ณ 12,714 100.0% ํ 2๋ํ 1์์ ์๋์ปจ์ ๋ค์๋๊ฐ์ง๊ฒฝ์ฐ๋ก๊ตฌ๋ถํ์ฌ๋ถ์ํํ์ด๋ค. ์ด๋์ฉ์ด๊ฐ๋์ผํ๋์ปจ์ ์์ต์์์ปจ์ (Top-level concepts) ์ํ์ธํ์ฌ์ต์์์ปจ์ ์ด์๋ก๋์ผํ์ง์๋์ง์๋ฐ๋ผ๊ตฌ๋ถํ๊ฒ์ด๋ค. ์ต์์์ปจ์ ๋ด๋์ผ์ฉ์ด์ปจ์ ์๊ฒฝ์ฐ๋์ฉ์ด๊ฐ๋์ผํ๋์ปจ์ ์์ต์์์ปจ์ ์ด์๋ก๋์ผํ๊ฒฝ์ฐ์ด๊ณ ์ต์์์ปจ์ ๊ฐ๋์ผ์ฉ์ด๋๋์ปจ์ ์์ต์์์ปจ์ ์ด์๋ก๋ค๋ฅธ๊ฒฝ์ฐ๋ฅผ์๋ฏธํ๋ค. ํ 2๋ฅผ๋ณด๋ฉด๋์ผ์ฉ์ด๋ฅผ๊ฐ์ง๋์ปจ์ ์ด๊ฐ์์ต์์์ปจ์ ๋ด์์๋๊ฒฝ์ฐ์ฌ์ค์๊ฑฐ์๋ชจ๋๊ฐ 1-5 ์ด๋ด์๊ฑฐ๋ฆฌ๋ฅผ๋ณด์ด๊ณ ์์์ํ์ธํ ์์๋ค. ํ 2์๋ชจ๋๊ธฐ์ ๋์ง์์์ง๋ง๊ฑฐ๋ฆฌ 1-3์ฌ์ด์์์นํ์ปจ์ ๋ค์ด 90% ์ด์์์ฐจ์งํ๊ณ ์์์ด๋ถ์๋์๋ค. ํนํ, ๊ฑฐ๋ฆฌ๊ฐ 1์ธ๊ฒฝ์ฐ์ฆ, ๋ถ๋ชจ-์์๊ด๊ณ๋ก์ฐ๊ฒฐ๋์ด์๋๊ฒฝ์ฐ๊ฐ์ ์ฒด์ 83% ๊ฐ๋์ผ๋ก๋ถ์๋จ์๋ฐ๋ผ๋๋ถ๋ถ์๋์ผํ์ฉ์ด๊ฐ๋ถ๋ชจ, ์์๊ฐ์๋ฐ์ํ๋ค๋๊ฒ์ํ์ธํ ์์๋ค. ๋์ผ์ฉ์ด๋ฅผ๊ฐ์ง๋์ปจ์ ์ด์๋ก๋ค๋ฅธ์ต์์์ปจ์ ์ธ๊ฒฝ์ฐ๋๊ฑฐ๋ฆฌ๊ฐ์ต์ 5์ด๋ฉฐ์ต๋ 23์ธ๊ฒ์ผ๋ก๋ํ๋ฌ์ผ๋ฉฐ๊ทธ๋๋ถ๋ถ์ํ 2์๊ฐ์ด๊ฑฐ๋ฆฌ๊ฐ 6-15 ์ฌ์ด์ธ๊ฒ์ผ๋ก๋ถ์๋์๋ค. ๊ทธ๋ฌ๋์ด๊ฒฝ์ฐ๋๋์ปจ์ ์์ต์์์ปจ์ ๋ค์ด์๋ก๋ค๋ฅด๋ฏ๋ก์ฉ์ด๋๋์ผํ๋๋ผ๋์๋ฏธ์ ์ผ๋กํผ๋ํ ์ฐ๋ ค๋์ ์ํน์ง์ด์๋ค. ํ 2. ์ต์์์ปจ์ ๋ด๋ฐ์ต์์์ปจ์ ๊ฐ๋์ผ์ฉ์ด๋ฅผ๊ฐ์ง๋์ปจ์ ์๊ฑฐ๋ฆฌ๋ถ์ Table. 2 Distance analysis of concepts with an identical description grouped by intra/inter top-level concepts ๊ฑฐ๋ฆฌ ์ต์์์ปจ์ ๋ด๋์ผ์ฉ์ด์ปจ์ ์ ์ต์์์ปจ์ ๊ฐ๋์ผ์ฉ์ด์ปจ์ ์ 1-5 7,372 (96.6%) 15 (0.3%) 6-10 229 (3.0%) 1,875 (36.9%) 11-15 25 (0.3%) 2,737 (53.8%) 16-20 4 (0.1%) 426 (8.4%) 21-25 0 (0.0%) 31 (0.6%) ํฉ๊ณ 7,630 (100%) 5,084 (100%) โ ฃ. ๊ฒ์๋ธ๋ผ์ฐ์ ์์๊ตฌ์ฌํญ๋ถ์๋ฐ๊ฐ์ ๋ฐฉ์ ์ด์ฅ์์๋ 3์ฅ์์๋์ถ๋๋ถ์๊ฒฐ๊ณผ๋ฅผ๋ฐํ์ผ๋กํจ์จ์ ์ธ์ฉ์ด๊ฒ์์์ํด๋ธ๋ผ์ฐ์ ๊ฐ์ ๊ณตํด์ผํ ๊ธฐ๋ฅ์ ์๊ฑด์๊ฐ์ ๋ฐฉ์ํํ๋ก์ ์ํ๋ค. 4.1. ๊ฒ์์ธํฐํ์ด์ค๊ฒ์๋ธ๋ผ์ฐ์ ๋๊ธฐ๋ณธ์ ์ผ๋ก ID ๋๋ํ ์คํธ๋ฅผํตํ์ปจ์ ์๊ฒ์์์ง์ํ์ฌ์ผํ๋ค. ์ด๋, ID๋ฅผ์ด์ฉํ๊ฒ์์ํ๋์์ปจ์ ์ด๊ฒ์๊ฒฐ๊ณผ๋ก๋ํ๋๊ฒ๋๋์ฉ์ดํ ์คํธ๋ฅผํตํ๊ฒ์์๋ถ๋ถ๋ฌธ์์ด๋งค์นญ๊ฒ์ (substring matching query) ์ผ๋ก์๊ทธ๋ฆผ 2์๊ฐ์ด์ฉ์ด๊ฐ๋์ผํ๊ฑฐ๋ํด๋น๊ฒ์์ด๋ฅผํฌํจํ๋์ปจ์ ๋ค์ด๋จ์๋ชฉ๋ก์ํํ๋ก๋ํ๋๊ฒ๋๋ค. ๋ณธ๋ ผ๋ฌธ์์๋ 3์ฅ์์๋ถ์ํ๋ด์ฉ์๋ฐ๋ผ๊ฒ์๊ฒฐ๊ณผ๋ชฉ๋ก์๋ค์๊ณผ๊ฐ์๋ด์ฉ์์ถ๊ฐํ๋๋ก์ ์ํ๋ค. 1) ์ปจ์ ๊ฐ๊ด๊ณ์ํํ๊ฒ์๊ฒฐ๊ณผ๋ก๋ํ๋๋์ปจ์ ๋ค์๋จ์๋ชฉ๋ก์ด์๋๊ด๊ณ์๊ธฐ๋ฐํ์ฌ๊ทธ๊ด๊ณ์ ๋ณด๋ฅผํจ๊ปํํํ์ฌ์ผํ๋ค. 3์ฅ๋ถ์๊ฒฐ๊ณผ์์๋์ถ๋๋ฐ์๊ฐ์ด์ฉ์ด๊ฐ๋์ผํ๋๋ถ๋ถ์์ปจ์ ์์๊ทธ๊ฑฐ๋ฆฌ๊ฐ์ด์๊ณ ํนํ๊ฑฐ๋ฆฌ๊ฐ 1์์ 3์ธ์ปจ์ ์ด๋๋ถ๋ถ์ด๋ค. ์ด๋๋์ปจ์ ๋ค๊ฐ์๊ณ์ธต๊ตฌ์กฐ์์ (topology) ์๋ถ๋ชจ-์์ (Parent-Child), ํ์ (Sibling), ์กฐ์-์์ (Ancestor-Descendant) ๋ฑ์ด์๋๋ฐ์ด๋ฅผ๊ฐ๋ตํํ์ฌํํํ๋ฉด์ปจ์ ๋ค์๋ณด๋ค์ง๊ด์ ์ผ๋ก๋น๊ตํ ์์๋ค. ๊ตฌํ๊ด์ ์์๋์ด๋ฅผ์๋ธ๊ทธ๋ํ (sub-graph) ํ์์ผ๋ก๊ฐ๋ตํํ์ฌ๋์ํ ์์๋ค. 2694
์ํ์ฉ์ด์ํจ์จ์ ์ธ๊ฒ์์์ํ๊ฒ์๋ธ๋ผ์ฐ์ ์์๊ฑด๋ถ์ 2) ์ต์์์ปจ์ ์ผ๋ก๊ทธ๋ฃนํ๊ฒ์๊ฒฐ๊ณผ์์ต์์์ปจ์ ์ํจ๊ปํ์ํ๊ณ ์ต์์์ปจ์ ์ผ๋ก๊ฒ์๊ฒฐ๊ณผ๋ฅผ๊ทธ๋ฃนํํ์ฌํํํ๋๊ฒ์ดํ์ํ๋ค. ์ด๋ 3์ฅ์์๋ถ์๋๋ฐ์๊ฐ์ด์ฉ์ด์ค๋ณต์ด๋ฐ์ํ๋๋์ปจ์ ์์ต์์์ปจ์ ์ด๋ค๋ฅธ๊ฒฝ์ฐ์์๊ฐ์ฉ์ด์ค๋ณต์ด๋ฐ์ํ๋์ ์ฒด์ปจ์ ๋ค์๋๋น 40% ์์ด๋ฅด๊ธฐ๋๋ฌธ์ด๋ค. ๊ทธ๋ฌ๋ฏ๋ก์ต์์์ปจ์ ์ํจ๊ปํํํ๋๊ฒ๋ง์ผ๋ก๋๊ฒ์๊ฒฐ๊ณผ๋ฅผํจ์จ์ ์ผ๋ก์ดํดํ ์์๋์ฅ์ ์ด๋ฐ์ํ๋ค. 3) ๋งค์นญ์์ค์๋ถ๋ฆฌ๋ถ๋ถ๋ฌธ์์ด๋งค์นญ๊ฒ์์๊ธฐ๋ณธ์ ์ผ๋ก๊ฒ์์ด์์ผ์น๋๋์ปจ์ ๋ค๊ณผ๋ถ๋ถ๋งค์นญ๋์ปจ์ ๋ค์ดํจ๊ปํ์๋๋ค. ์๋ํ์ปจ์ ์๋น ๋ฅด๊ฒ์ฐพ๊ธฐ์ํด๊ฒ์์ด์์ ํํ์ผ์นํ๋์ปจ์ ๋ค๊ณผ๋ถ๋ถ๋งค์นญ๋์ปจ์ ๋ค์๋ถ๋ฆฌํ์ฌํํํ๋๊ฒ์ดํ์ํ๋ค. 4.2. ์ปจ์ ์์ธ์ ๋ณด์กฐํ๊ธฐ์กด์ SNOMED CT ๊ฒ์๋ธ๋ผ์ฐ์ ๋ค์๊ฒ์๊ฒฐ๊ณผ์์ํ๋์์ปจ์ ์์ ํํ๋ฉด๊ทธ๋ฆผ 3๊ณผ๊ฐ์ด์ปจ์ ์์ํ์ ๋ณด, ์ฉ์ด (Description) ๋ชฉ๋ก, ๋ถ๋ชจ์ปจ์ , ์์์ปจ์ , ๊ด๊ณ (Relationship), ๊ณ์ธต๊ตฌ์กฐ์์์น (Tree Position) ๋ฑ์ํ์ํ๋ค. ์ด๋, SNOMED CT์์ปจ์ ์๊ทธ์ ์๊ฐ๋ช ํํ๊ฒ๊ธฐ์ ๋์ด์์ง์์ผ๋ฏ๋ก์ฉ์ด๋ชฉ๋ก๋ฐ๊ณ์ธต๊ตฌ์กฐ์์์์์๋์ ์์น๋ฅผํตํด๊ทธ์๋ฏธ๋ฅผํ์ ํด์ผํ๋ค. ๊ทธ๋ฌ๋์ปจ์ ์๋ถ๋ชจ๋ ธ๋๊ฐ์ฌ๋ฌ๊ฐ์ผ์์์ผ๋ฏ๋ก๊ณ์ธต๊ตฌ์กฐ์ํํ์๊ทธ๋ฆผ 3๊ณผ๊ฐ์ด Context 1, Context 2๋ฑ์ผ๋ก๋จ์๋์ดํ๋๊ฒฝ์ฐ๊ทธ์๋ฏธ์ํ์ ์ด๋งค์ฐ์ด๋ ต๊ณ ๋ถํธํ๋ค. ๋ณธ๋ ผ๋ฌธ์์์ ์ํ๋๊ฐ์ ๋ฐฉ์์๊ทธ๋ฆผ 3๊ณผ๊ฐ์๋จ์๋์ด์์์๋ฒ์ด๋๊ณ์ธต๊ตฌ์กฐ๋ค์๋ชจ๋ํฌํจํ๋ํ๋์๊ณ์ธต๊ตฌ์กฐ๋ง์๋์ํ๋๊ฒ์ด๋ค. ์ด๋, ๋จ์ผํ๋๊ณ์ธต๊ตฌ์กฐ์ํํ์ 4.1์์์ ์๋๊ฐ์ ๋ฐฉ์์์์ฉํ์ฌ์๋ธ๊ทธ๋ํํํ๋กํ์ํ๋๋ณต์๊ฐ์๋ถ๋ชจ๋ ธ๋๋ฅผํ๋ฒ์ํํํจ์ผ๋ก์จ์ฌ์ฉ์์๋น ๋ฅธ์ดํด๋ฅผ์ ๋ํ๋ค. ๊ตฌํ๊ด์ ์์๋์๋ธ๊ทธ๋ํ๊ฐ๋ณต์กํด์ง๋ฉดํ ์คํธํํ๋กํํํ๊ธฐ์๋๋ถ์ ํฉํด์ง๋ฏ๋ก๊ทธ๋ํฝํํ๋ก์ฒ๋ฆฌํ์ฌ๋์ํ๋๊ฒ์ด์ถ๊ฐ์ ์ผ๋กํ์ํ๋ค. ๊ทธ๋ฆผ 3. NLM ๋ธ๋ผ์ฐ์ ์์ปจ์ ์กฐํํ๋ฉด Fig. 3 A screenshot of concept view of NLM browser ๊ทธ๋ฆฌ๊ณ ๊ณ์ธต๊ตฌ์กฐ์์์น๋ฅผํ์ํ ๋๋์ผํ์ฉ์ด๋ฐ์ ์ฌํ์ฉ์ด๋ฅผ๊ฐ์ง๋๋ค๋ฅธ์ปจ์ ์ํจ๊ปํ์ํ๋๊ฒ๋ํ์ํ๋ค. ์ฆ, ๊ณ์ธต๊ตฌ์กฐ์๋ธ๊ทธ๋ํ์์์ฉ์ด๊ฐ๋์ผํ์ปจ์ ์๋ ธ์ถ์ํค๊ณ ํด๋น์ปจ์ ์๋ํ๋งํฌ๋ฅผ์ ์ํจ์ผ๋ก์จ์ฌ๋ฌ์ปจ์ ๋ค์๋์์๋น๊ตํ๊ฒํ๊ณ ์ด๋ฅผํตํด์์๋ํ๋์ปจ์ ์๋ณด๋ค๋น ๋ฅด๊ฒ์ ํ๊ฐ๋ฅํ๋๋กํ๋ค. โ ค. ๊ฒฐ๋ก ๋ณธ๋ ผ๋ฌธ์์๋ SNOMED CT ํ์ค์ฉ์ด์ฒด๊ณ๋ฅผํ์ฉํ ๋์ฌ์ฉํ๋ SNOMED CT ๊ฒ์๋ธ๋ผ์ฐ์ ์๋ฌธ์ ์ ์๋ถ์ํ๊ณ , ์ฉ์ด๊ฐ๋์ผํ์ปจ์ ๋ค์ค์ํ๋์ปจ์ ์๋น ๋ฅด๊ณ ํจ๊ณผ์ ์ผ๋ก์ ํํ๊ธฐ์ํ๊ฒ์๋ธ๋ผ์ฐ์ ์์๊ฑด์๋ถ์ํ๊ณ ๊ฐ์ ๋ฐฉ์์์ ์ํ์๋ค. ์ ์๋๊ฐ์ ๋ฐฉ์์์ ์ฉํ๋ฉด๋ธ๋ผ์ฐ์ ์ฌ์ฉ๊ณผ์ ์์๋ง์์๊ฐ์์๋ชจํ๋์ ์ฌ์ฉ์ด๋น๊ต์๊ฐ์ํ๊ธฐ์ ์ผ๋ก์ค์์ผ๋ก์จ์ง๋ฃ๊ธฐ๋ก๊ณผ์ ์์ํ์์์ํ๋ฅผ๊ฐ์ฅ์ ํํ๊ฒํํ 2695
ํ๋์ปจ์ ์๋น ๋ฅด๊ฒ์ ํํ ์์์ผ๋ฉฐ๊ฒฐ๊ณผ์ ์ผ๋ก์ง๋ฃ๊ธฐ๋ก์ํจ์จ์ฑ์์ ๊ณ ํ ์์๋ค. ํฅํ์ฐ๊ตฌ๋ก๋๋ณธ๋ ผ๋ฌธ์์์๋กญ๊ฒ์ ์๋๋์ผ์ฉ์ด๋ฌธ์ ๋ฅผ๋ค๊ฐ๋๋ก๋ถ์ํ๊ณ , ์ ์ํ์๊ตฌ์กฐ๊ฑด๋ฐ๊ฐ์ ๋ฐฉ์์๋ฐํ์ผ๋ก์๋ก์ด SNOMED CT ๊ฒ์๋ธ๋ผ์ฐ์ ๋ฅผ์ค๊ณ๊ตฌํํ๋๊ฒ์ด๋ค. REFERENCES [1] Alecu I., Bousquet C., Jaulent M.C., "A case report: using SNOMED CT for grouping Adverse Drug Reactions Terms", BMC Medical Informatics and Decision Making, 2008. [2] S. Lusignan, T. Chan, S. Jones, Large complex terminologies: more coding choice, but harder to find data - reflections on introduction of SNOMED CT (Systematized Nomenclature of Medicine - Clinical Terms) as an NHS standard, Informatics in primary care, vol. 19, no. 3, pp. 3-5, Mar. 2011. [3] D. Lee, R. Cornet, F. Lau, N. Keizer, "A survey of SNOMED CT implementations", Journal of Biomedical Informatics, Vol. 46, pp. 87-96, 2013. [4] W. Ryu, A Requirement of a Search Browser for Effective Searching of Clinical Terminology, in Proceedings of the Korean Institute of Information and Communication Sciences, Vol. 18, pp. 416-417, 2014 [5] IHTSDO, "SNOMED CT Technical Implementation Guide", www.snomed.org, 2014. [6] U.S. National Library of Medicine, "UMLS SNOMED CT Browser", http://uts.nlm.nih.gov/snomedctbrowser.html [7] International Health Terminology Standards Development Organisation, The IHTSDO SNOMED CT Browser, http://browser.ihtsdotools.org [8] U.S. National Library of Medicine, SNOMED CT Release Files, http://www.nlm.nih.gov/research/umls ๋ฅ์ฐ์ (Wooseok Ryu) 2013 ๋ 3 ์ - ํ์ฌ๋ถ์ฐ๊ฐํจ๋ฆญ๋ํ๊ต๋ณ์๊ฒฝ์ํ๊ณผ์กฐ๊ต์ 2012 ๋ 3 ์ -2013 ๋ 2 ์๋ถ์ฐ๋ํ๊ต U-port ์ ๋ณด๊ธฐ์ ์ฐํ๊ณต๋์ฌ์ ๋จ๋ฐ์ฌํ์ฐ๊ตฌ์ 2012 ๋ 2 ์๋ถ์ฐ๋ํ๊ต์ปดํจํฐ๊ณตํ๊ณผ๊ณตํ๋ฐ์ฌ ๊ด์ฌ๋ถ์ผ : ์ํ์ฉ์ด, U-Health, ์๋ฃ์ ๋ณด, ๋น ๋ฐ์ดํฐ 2696