ISO/IEC 의온톨로지와메타데이터 표준화동향 2013. 06. 26. 한국과학기술정보연구원 김장원
목차 메타데이터와온톨로지 표준제정및표준화기구 사례분석
소개 메타데이터 (Metadata) 정의 데이터의데이터 (Wikipedia) 객체혹은사물에관한기술 (ISO/IEC) if P is data and if P Q represents the descriptive relationship such that P describes Q, then P is metadata about Q. P is merely data, because metadata is always relative to the object of description. P only becomes metadata once its descriptive relationship to Q is established.
소개 메타데이터이슈 데이터의메타데이터를추출시문맥과관계정보들을고려하지않고서는정확한메타데이터를결정할수없다 메타데이터는일종의데이터이다 데이터들처럼상호교환이가능하지만, 여전히메타데이터이다 메타데이터의상호교환시연관된상황정보와관계정보들을포함해야한다 Music Name Title Book Public Broadcasting Metadata Dictionary Project 4
소개 온톨로지 개념을식별하고표현하기위한철학적접근방법 (Wikipedia) Ontology is the philosophical study of the nature of being, becoming, existence, or reality, as well as the basic categories of being and their relations. 지식과정보를표현하기위한체계 명시적개념화 어휘의공유를통한의미표현 자원 (Resource) 을서술하기위한프레임워크 (RDF) 자원들간의의미와관계를표현 5
표준기구 6
ISO/IEC JTC 1 소개 빠르게변화하는기술추이에맞춘표준을개발하고 ISO, IEC 두기관에서의중복을피하고공통의세계표준을만들고자 1987 년창설 MPEG, IC cards, 데이터베이스질의언어, 메타데이터등 2 만여개의표준개발 2,500 의국제표준을만들었으며, 37 개의나라에서참여하며, 총 19 개의분과위원회로구성됨 비전 정보와통신기술에대한표준을만드는것으로, 다양하고복잡한기술을전세계적으로통합하기위한표준화된환경을조성하고자함 최근, 급속도로변화하는기술을따라가기위하여 De-facto 표준을만드는곳들의표준안들을적용및승인함 Publicly available specification (PAS submitters) W3C, OMG 7
ISO/IEC JTC 1/SC 32 소개 데이터와데이터교환을위한위원회 총 4 개의작업반 (Working Group) 으로구성 작업반 1: 전자상거래 (e-business) 전자상거래와관련한표준을개정하는곳으로 ebxml, 전자상거래절차등의표준을개발 작업반 2: 메타데이터 (metadata) 메타데이터의정의, 메타데이터를등록하고관리하기위한방법, 메타데이터레지스트리, 메타모델의상호운용을위한메타모델프레임워크, 온톨로지생성프레임워크개발 작업반 3: 데이터질의언어 (Structured Query Language) 데이터질의언어와질의언어를기반으로온톨로지에질의하기위한표준등을개발 작업반 4: 데이터질의언어멀티미디어와응용 (SQL/MM) 데이터질의언어에서정의하고있는사용자정의타입 (User Defined Type) 을기반으로마이닝, 지리정보, 메타데이터질의인터페이스등을개발 8
표준화동향 다양한기술의등장으로새로운표준아이템도출을위한 SWG-P (Special Working Group Planning) 회의개최 빅데이터, 클라우드컴퓨팅, 소셜네트워크분석, 차세대분석기법, 인터넷사물통신등의분야에서표준아이템을도출하려하고있음 소셜네트워크, 빅데이터환경에이르러데이터생성에대한페러다임의변화발생 빅데이터큐레이션이중요하게되며이를위한기계적인방법에대한표준이중요이슈로등장 9
표준화동향 10
표준화이슈 빅데이터와관련한개념및용어정의 데이터큐레이션 정의 Active management of data over its lifecycle Ensuring that data is trustworthy, discoverable, accessible, reusable, and fit for use E.g. data preparation for analytics 큐레이션의형태 수동큐레이션 (Manual Curation) 반자동큐레이션 (Semi Curation) 데이터정제, 레코드중복방지, 군집화 가벼운큐레이션 (Sheer Curation) 좋은데이터와디지털자산들을통해창의적이며우선적으로사용될수있는좋은예를보여주기위한것으로데이터의공유, 공개행위를통해목적을달성함 E. Curry, A. Freitas, and S. O Riain, Data Curation at the New York Times, 2011. 11
표준화이슈 빅데이터참조모델정의 12
표준화이슈 빅데이터환경에서의데이터생명주기 13
표준화이슈 메타데이터이슈 ISO/IEC JTC 1/SC 32 Plenary Meeting (2013. 5, 경주 ) 빅데이터, 클라우드컴퓨팅환경에서상황정보와관계를반영할수있는메타데이터를정의하고이를추출하기위한기술에대한표준안제안 ( 한국, 캐나다, 폴란드 ) 온톨로지이슈 빅데이터큐레이션을통해새로운지식을추출함에있어체계적이며다양한관점의데이터를추출하기위하여데이터지식화가필요 텍스트로부터의미있는개체를추출및식별을하고식별된개체들간의의미적연관성을도출하여체계적인형태로관리하기위하여온톨로지를사용하기위한방법및절차의표준도출 14
표준화사례 ISO/IEC 20943-5: Metadata Mapping Procedure 표준제안기관 ( 한국 KISTI, KODB) 내용 메타데이터의의미적일치를위한절차의표준 동일한의미를가짐에도불구하고다른이름을가지는데이터요소들에대한맵핑을하기위한표준 15
표준화사례 ISO/IEC 20943-6: Framework for Generating Ontology 표준제안기관 ( 한국 Korea Univ.) 내용 온톨로지를생성하기위한프레임워크 16
표준화사례 W3C - R2RML (RDB to RDF Mapping Language) 내용 관계형데이터베이스로부터 RDF 데이터집합으로맵핑방법을표현하기위한언어 관계형데이터베이스로부터 RDF 로의매핑은개념적수준에서의매핑으로관계형데이터베이스의스키마에표현되는어휘들을 RDF 의어휘로매핑 http://www.w3.org/tr/r2rml/ 17
감사합니다. 18