공무국외출장결과보고 더블린코어메타데이터국제컨퍼런스 (DC-2011) 참석결과보고서 국립중앙도서관 국립중앙도서관도서관연구소 (K R IL I)
차례 Ⅰ. 출장개요 1 Ⅱ. 출장일정 2 Ⅲ. DC-2011 개요 3 Ⅳ. 컨퍼런스주요내용 5 1. 튜토리얼 5 2. 기조연설 10 3. 논문 14 4. 포스터 26 5. 워크샵 29 6. 스페셜세션 30 Ⅴ. 종합의견 32 국립중앙도서관도서관연구소 (K R IL I)
Ⅰ 출장개요 1. 목적 DCMI(Dublin Core Metadata Initiative) 상임이사국으로서의역할수행및활동 메타데이터새로운모델개념 Harmonization' 의이해도모 시맨틱웹서비스를위한당관메타데이터활용방안연구 2. 출장지 : 네덜란드 ( 헤이그 ) 3. 출장기간 2011. 9. 20 ~ 9. 25(4 박 6 일 ) 4. 출장자 이은정, 신은정 ( 디지털기획과사서 ) 5. 주요내용 DCMI 회의참석으로상임이사국으로서의역할수행및활동 메타데이터의새로운모델모형인 Harmonization' 에대한개념및의미파악 도서관계등각분야별 Linked Data 추진현황에관한정보습득 메타데이터상호운용성관련국제적인동향파악 국립중앙도서관도서관연구소 (K R IL I) 1
Ⅱ 출장일정 일자지역시간일정비고 9.20 ( 화 ) 인천 14:30 ㅇ인천공항출발암스테르담ㅇ암스테르담스키폴공항도착 18:40 헤이그ㅇ암스테르담 헤이그이동 KLM Royal Dutch Airlines (KL 866) 08:00-08:30 ㅇ등록 9.21 ( 수 ) 헤이그 09:00-17:00 ㅇ Pre-Conference - Tutorial 1-4 - 네덜란드국립도서관견학 네덜란드 국립기록관, 국립도서관 ㅇ Conference Day 1 - 기조연설 : Metadata Harmonization 9.22 ( 목 ) 헤이그 09:00-18:00 for Fun and Profit - Papers 1 : Profiles & Usage - Ⅰ - Papers 2 : Mapping, Alignments - Projects 1 : Metadata Transparency - Projects 2 : Collection-level Services ㅇ Conference Day 2 - 기조연설 : Towards Linked Data for 9.23 ( 금 ) 헤이그 08:45-18:00 Libraries, Archives, and Museums - Papers 3 : Towards a Linked Data World - Papers 4 : Profiles & Usage - Ⅱ - Projects 3 : New Views of Legacy Data 9.24 ( 토 ) 9.25 ( 일 ) 헤이그암스테르담 17:45 ㅇ헤이그 암스테르담이동ㅇ암스테르담스키폴공항출발 인천 10:50 ㅇ인천공항도착 KLM Royal Dutch Airlines (KL 865) 국립중앙도서관도서관연구소 (K R IL I) 2
Ⅲ DC-2011 개요 1. DCMI(Dublin Core Metadata Initiative) 개요 사무국 : 싱가포르국립도서관 이사가입국 : 7개국 ( 핀란드, 영국, 싱가포르, 뉴질랜드, 한국, 말레이시아, 일본 ) 2006. 4. 국립중앙도서관이사국가입 역할 - 더블린코어를국제표준으로제정 - 웹자원기술 (description) 을위한표준개발, 공인문건출판및배포 - 메타데이터의상호운용성연구및표준안개발 - 메타데이터용어관리및표준제정 - 메타데이터활용교육, 홍보및지원, 국제회의개최등 홈페이지운영 : http://www.dublincore.org 국립중앙도서관역할 - DCMI 국제이사국으로서한국대표기관 - 더블린코어에대한국내표준 ( 안 ) 마련 - 국내메타데이터발전및상호운영에대한방안마련 - 국제회의참석및국내의견개진 - 한국홈페이지운영 : http://dublincore.go.kr 2. DC-2011 개요 주제 : Metadata Harmonization: Bridging Languages of Description 주최 : 네덜란드국립도서관 기간 / 장소 : 2011. 9. 21 ~ 9. 23 (3일간) / 네덜란드국립도서관및기록관 참석자 : 도서관, 기록관, 문헌정보학, IT 기관메타데이터전문가 (36개국 175명 ) 프로그램 : 상임이사회의, 워크숍, 스페셜세션, 튜토리얼, 페이퍼세션, 포스터세션등 차기회의 (DC-2012) 개최지 : 말레이시아 국립중앙도서관도서관연구소 (K R IL I) 3
3. DC 2011 에서다룬주요주제 메타데이터원칙, 지침, 모범사례 메타데이터의특성 ( 체계, 도구, 실무 ) 개념적모델및체계 (ex. RDF, DCAM, OAIS 등 ) 애플리케이션프로파일 (Application Profile) 1) 메타데이터생성 ( 방법, 도구, 실무 ) 메타데이터상호운용성 ( 영역, 언어, 시대, 구조, 규모간 ) 범용메타데이터의사용 (ex. 기록관리, 보존, 큐레이션, 기관저장소, publishing) 분야별메타데이터 (ex. 기업, 도서관 박물관 기록관등의문화기관, 교육, 정부, 과학분야 ) 시맨틱웹어휘로서의서지표준 (ex. RDA, FRBR, 주제명표목등 ) 메타데이터구축시소셜태깅및이용자참여 지식조직체계와 SKOS(Simple Knowledge Organization System) 온톨로지설계및개발 메타데이터와온톨로지의통합 검색엔진과메타데이터 Linked Data와시맨틱웹 ( 메타데이터및애플리케이션 ) 용어레지스트리와레지스트리서비스 1) 특정응용프로그램을위해정의된일련의메타데이터요소, 정책, 지침 국립중앙도서관도서관연구소 (K R IL I) 4
Ⅳ 컨퍼런스주요내용 1. 튜토리얼 일시 : 2011. 9. 21( 수 ), 09:00~17:00 장소 : 네덜란드국립기록관 목적 : 회의에서다루는주제에관한입문용교육강좌 (90 분 ) 더블린코어소개 (An Introduction to Dublin Core) 2) 발표자 : Stephanie Taylor (UKOLN, University of Bath, 영국 ) - 더블린코어메타데이터세트에관한기본적인소개 - 각기다른작업환경에서 DC의적용을설명하기위해실제적인사례를활용하여 Simple DC와 Qualified DC를설명함 - 그룹워크 : 참석자들이기술대상자료의요소를분석하고, 객체를기술하기위해 Simple & Qualified DC를사용하는기회를제공함 - 사물에관한구조화된데이터인 메타데이터 의현행표준으로는더블린코어, MARC, ONIX, EAD, MODS, METS, DIDL, PREMIS, MIX, RSLP-CD 등이있음 - 학술연구저작 ( 저널아티클, 워킹페이퍼, 논문, 북챕터, 보고서등 ) 을기술하기위한더블린코어애플리케이션프로파일 인 SWAP(Scholarly Works Application Profiles) 3) 모델을소개함 2) http://dcevents.dublincore.org/index.php/intconf/dc-2011/paper/view/66/34 국립중앙도서관도서관연구소 (K R IL I) 5
<SWAP 모델구조 ( 좌 ) 및예시 ( 우 )> 더블린코어에서 Linked Data로 (From Dublin Core to Linked Data) 4) 발표자 : Paul Hermans ( 벨기에 ) - XML/HTML로인코딩된더블린코어메타데이터애플리케이션을 Linked Data 버전으로마이그레이션하는구체적인방식을설명함. - 다음작업을수행하기위한각단계를설명함 * 자원의식별자 (URI) 를정의 * 적합한모델과어휘를선택 * 다른데이터세트로의링크를생성 3) http://dublincore.org/scholarwiki/swapdsp http://www.ukoln.ac.uk/repositories/digirep/index/scholarly_works_application_profile 4) http://dcevents.dublincore.org/index.php/intconf/dc-2011/paper/view/67/35 5) 참고 : http://dcevents.dublincore.org/index.php/intconf/dc-2011/paper/view/55/14 국립중앙도서관도서관연구소 (K R IL I) 6
* 필요한표현형 (representation)(rdf/xml, turtle, HTML) 으로변환 * 해당데이터를역참조가능한 (dereferenceable) Linked data로발행 (publish) - 사용될수있는도구와기술에관한개관 - Linked Data의원칙 * 사물의명칭으로 URI를사용함 * HTTP URI를사용하여사람들이쉽게찾아볼수있게함 * URI를찾았을때, 유용한정보 (RDF) 를제공 * 더많은것을검색할수있도록, 다른 HTTP URI로의링크를포함시킴 SKOS (Simple Knowledge Organization System) 6) 발표자 : Antoine Issac (Europeana & Vrije Universiteit Amsterdam, 네덜란드 ) - SKOS란 : 시맨틱웹의틀내에서지식조직체계 (KOS: 시소러스, 분류체계, 주제명표목시스템, 택소노미등 ) 의사용을지원하기위해, RDF를사용하여간단한방식으로표현하고연결하는데이터모델 - SKOS의다양한특성을소개하고, SKOS가현존하는 KOS의데이터를표현하기위하여어떻게사용될수있는가를설명함 * SKOS의유용성 : KOS를시맨틱웹과 Linked Data의비전에쉽게부합시킬수있음 ( 웹지향적인 (web-oriented) 표현, 개념및해당기술 (description) 의재사용 공유, 서로다른맥락의개념간의연결, 확장가능성 ) * SKOS의기술적인 (technical) 효용성 : 외부출처로부터의데이터획득, 데이터발행, 데이터세트간의연결등이쉬워짐 - 데이터의웹상에서영향력있는현행지식조직체계의비전이문화유산등의분야에서진행중인여러프로젝트에서어떻게채택되고있는지를살펴보고, KOS를생성 발행하기위한수단및방법, 기존의 KOS 데이터를 SKOS로 porting하는방법등에관해서도살펴보았음 6) http://dcevents.dublincore.org/index.php/intconf/dc-2011/paper/download/69/36 국립중앙도서관도서관연구소 (K R IL I) 7
- KOS 를 Linked Data 로구현한주요사례 * 도서관분야 7) 스웨덴국립도서관의 Libris catalogue and thesaurus (http://libris.kb.se ) 다양한유형의자원 ( 인물 도서 저자 주제등 ) 을서술한, 175 개도서관의수백만건의레코드 미국의회도서관의어휘집 (LCSH 포함 ) (http://id.loc.gov) 전거레코드 26 만건 독일국립도서관의 Gemeinsame Normdatei(GND) (SWD subject headings 포함 ) (http://d-nb.info/gnd) ( 현재독일, 오스트리아, 스위스도서관계에서전거제어및주제색인에사용 중인 ) 독일어전거파일을통합 ( 개인명, 단체명, 주제명포함 ) 프랑스국립도서관의 RAMEAU 주제명표목 (http://stitch.cs.vu.nl) 개념 ( 일반명사및지명포함 ) 16만건 OCLC의 1DDC 분류 (http://dewey.info) 및 2VIAF (http://viaf.org) 1 DDC를 1000구분까지 11개언어로이용가능 ( 축약본 14판은 3개언어 ) 2 OCLC 주관, 10여개국립도서관의합동프로젝트. 국립도서관의전거파일을연결시켜서해당정보를웹상에서이용가능케함 STW 경제시소러스 (http://zbw.eu/stw) 표준화된주제명 (6천여개), entry term(18천개 ) 을 RDF 표현형으로제공 헝가리국립도서관의목록및시소러스 (http://oszkdk.oszk.hu/resource/drj/404)( 예시 ) 헝가리국립도서관의 OPAC 목록, 전거데이터 Open Library Project (http://openlibrary.org) ' 모든책에하나씩의웹페이지를만들기 를목표로, 2 천만건의레코드를수집했 고, 객체를처리하기위해자원중심의구조를제공함 도서관영역의 Linked Data 세트 (http://thedatahub.org/group/lld) 7) 다음논문에서도참고함 http://dcevents.dublincore.org/index.php/intconf/dc-2011/paper/view/55/14 국립중앙도서관도서관연구소 (K R IL I) 8
* 기타분야 Wikipedia categories through DBpedia (http://dbpedia.org) 뉴욕타임즈 subject headings (http://data.nytimes.com) IVOA 천문학어휘 (http://www.ivoa.net/documents/latest/vocabularies.html) GEMET 환경시소러스 (http://eionet.europa.eu/gemet) Agrovoc (http://aims.fao.org) Linked Life Data (http://linkedlifedata.com) Taxonconcept (http://www.taxonconcept.org) UK Public sector vocabularies (http://standards.esd.org.uk) 국립중앙도서관도서관연구소 (K R IL I) 9
2. 기조연설 Metadata Harmonization 8) for fun and profit 9) 발표자 : Mikael Nilsson (Google, 스웨덴 ) - 메타데이터상호운용성 * 두개이상의시스템또는구성요소가사물에관한기술 (descriptive) 데이터를교환하고, 데이터생성자가해석한것과일치하는방식으로교환되어온기술 (descriptive) 데이터를해석할수있는능력 * 두응용프로그램간에메타데이터를교환할수있고, 두응용프로그램이모두그메타데이터를정확히해석할수있다면, 메타데이터는상호정보교환이가능하다 (interoperable) * 즉, 두시스템이동일한 ( 또는호환되는 ) 방식으로이루어졌다면, interoperable" 하다. 8) 참고 (DCMI glossary) : http://wiki.dublincore.org/index.php/glossary/metadata_harmonization 9) http://dcevents.dublincore.org/index.php/intconf/dc-2011/paper/download/71/41 국립중앙도서관도서관연구소 (K R IL I) 10
- 메타데이터 Harmonization * 두개이상의시스템또는구성요소가두개이상의메타데이터명세 (specification) 를따르는 " 결합된메타데이터 를교환하고, 데이터생성자가의도한것과일치하는방식으로교환되어온메타데이터를해석할수있는능력 * 두개의서로다른명세 (ex. DC와 IEEE/LOM 10) ) 에기반한메타데이터를채택하여이들을결합시키고, 그결합된메타데이터를정확히해석할수있다면, 메타데이터는 harmonized 되었다 * 즉, 두시스템이별도로이루어졌으나공통의모델로연결되었다면, harmonized 되었다. - 핵심메타데이터개념 * 메타데이터구문 (syntax) [ 예 ) RDF/XML, DC-HTML, LOM XML] 응용프로그램간에메타데이터를교환하기위해사용되는구체적인데이터포맷으로서, 메타데이터소프트웨어와프로토콜을실행하기위해사용됨. 실용적인도구이지만, harmonization 문제의본질은아님 * 메타데이터어휘 [ 예 ) DCMES, MARCREL, LCSH] 메타데이터기술 (description) 에사용하기위한기술적인 (descriptive) 용어세트로서, 메타데이터설계자들이메타데이터레코드를생성하기위해사용함. 다양한모델에따라정의되는데, 여러모델이상충하기때문에 harmonization 이슈가등장함 10) 학습객체메타데이터 (Learning Object Metadata : LOM) : 학습객체 ( 명확한교수 학습목표를가진콘텐츠로, 독립적이고재사용가능한최소단위의디지털콘텐츠 ) 의메타데이터기술을위한 IEEE 표준 ( 위키백과 : http://ko.wikipedia.org/wiki/%ed%95%99%ec%8a%b5%ea%b0%9d%ec%b2%b4) 국립중앙도서관도서관연구소 (K R IL I) 11
* Abstract Models [ 예 ) RDF triple 모델, IEEE LOM 계층모델, DCMI abstract 모델 ] 메타데이터용어의의미와사용방법을정의하는데에사용되는모델로, 용어설계자와구문생성자가상호운용가능한명세 (specification) 를생성하기위하여사용함. 호환성이없는모델들은 harmonization의주된장벽임 * Application profiles [ 예 ) eprints AP, OAI-DC 등 ] 특정한맥락에서 ( 영역, 응용프로그램등 ) 메타데이터레코드의구조를정의함 ( 구체적인구문을정의하기위해, abstract model에근거하여어휘를사용함 ). 특정분야의요구를성문화하기위하여해당영역의전문가또는응용프로그램설계자가사용함. 단일한 abstract model의맥락에서 harmonization에유용함 도서관, 기록관, 박물관을위한 Linked Data 를향하여 (Towards Linked Data for libraries, archives and museums) 11) 발표자 : Emmanuelle Bermes ( 퐁피두센터, 프랑스 ) - 문화유산기관 ( 도서관, 기록관, 박물관 ) 은자관의데이터를자유롭게사용 (seamless access) 할수있도록제공하라는이용자들의요구에직면하고있는데, 각영역의특성을보존하면서데이터를공동활용하는융합 (convergence) 의필요성이대두됨 - 변화의필요성 : 오늘날 Linked Data와시맨틱웹기술에관한관심이증가함에따라, 이들신기술이우리공동체에오랫동안존재해온문제들을해결할수있는지, 우리공동체는 Linked Data를채택하기위해필요한시간과예산을투자하고, 사고방식을변화시킬준비가되어있는지와같은의문이제기되고있음 11) http://dcevents.dublincore.org/index.php/intconf/dc-2011/paper/view/70/40 국립중앙도서관도서관연구소 (K R IL I) 12
Linked Data 원칙 * 사물의이름으로 URI를사용함 * 사람들이이들이름을찾을수있도록 HTTP URI를사용함 * 표준 (RDF, SPARQL) 을사용하여유용한정보를제공 * 다른데이터세트와의링크를생성 이용가능한데이터세트및어휘 * 메타데이터요소세트 : 더블린코어, RDA, FOAF, ISBD, FRBR * 유용한어휘 : LCSH, VIAF, MARC code lists.. * 기타데이터세트 : Geonames, DBpedia.. Library Linked Data : http://thedatahub.org/group/lld - 융합의사례 : 프랑스퐁피두센터 * 퐁피두센터내의박물관, 도서관, 기록관, 문화시설등다양한기관에서생산되는모든자원을온라인상에서이용할수있는인터페이스를구축중 * 네비게이션모델 채택 : 구성요소가패싯화되어있는매우유연한모델로서, 링크를따라가면서관련자료를발견할수있다. < 퐁피두센터의 네비게이션모델 > 예 ) 퐁피두센터개관 XX주년기념기획전 (Event) 에소개된 칸딘스키 (person) 의 Trente 라는작품 (work) 은 퐁피두센터 (place) 에소장되어있으며, 칸딘스키콜렉션 (collection) 에속해있음. 이작품은 디지털이미지 (resource) 등다양한형태로이용가능함. 또한이작품에관한 논문 (document) 이퐁피두센터도서관에소장되어있음 각패싯을검색하였을때, 관련된자원을추가로검색할수있음 국립중앙도서관도서관연구소 (K R IL I) 13
- 현재는각영역별로 ( 도서관, 박물관, 기록관등 ) 데이터가개별적으로존재하지만, 나중에는여러영역의데이터를결합하여이용을증진해야함. 또한 Linked Data로발행할때, 데이터를단순히공개하는게아니라, 실제로최종사용자가이데이터를어떻게사용할것인가를고려해야함 3. 논문 시맨틱세계에서맵핑 에관한재고 (Reconsideration of Mapping in a Semantic World) 12) 발표자 : Gordon Dunsire, Diane Ileana Hillmann, Jon Phipps, Karen Coyle - 지난 10년동안, 급증하는신규메타데이터스키마 ( 또는포맷 ) 를모으려는시도들은그다지성공적이지않았음 - 도서관데이터의장이시맨틱웹으로옮겨감에따라, 다양하고급변하는환경속에서상호운용성에관한우려가계속되고있으며, 구문적인상호연동 (syntactic crosswalks) 에기반한전략도더욱복잡해지고있음 - 본논문에서는전통적인상호연동 (crosswalking) 전략의최신방식을검토하고, 이에따른시사점과, 접근방식에있어서의변화 ( 레코드기반 문장 (statement) 기반, 구문기반 의미기반 ) 가어떻게결과에중요한차이를가져올수있는가를제안함 12) http://dcevents.dublincore.org/index.php/intconf/dc-2011/paper/view/52/6 국립중앙도서관도서관연구소 (K R IL I) 14
대규모의디지털도서관에서, free-text 콜렉션수준의주제메타데이터 (Free-text Collection-Level Subject Metadata in Large Scale Digital Libraries: A Comparative Content Analysis) 13) 발표자 : Oksana L. Zavalina (University of North Texas, 미국 ) - 메타데이터는디지털도서관이정보를조직하는데에있어서가장중요함. 현재는개별객체뿐만아니라전체디지털콜렉션을기술하기위하여메타데이터를생성하는디지털도서관이전세계적으로증가하고있는데, 콜렉션수준의메타데이터는아직실증적으로평가되지않았음 - 본논문에서는미국과유럽의대규모디지털문화유산집단 3개관의 'free-text 콜렉션수준의주제메타데이터 (Free-text Collection-Level Subject Metadata) ' 를평가하기위하여, 면밀한비교내용분석을사용한연구결과를보고하였음 - 이연구에서관찰한바와같이, 최근의모범사례는 free-text 콜렉션수준의기술 ( 記述 ) 메타데이터요소로표시된, 디지털콜렉션에관한다양한정보를포함함 특정주제정보 * 디지털콜렉션내객체의주제 * 지리적 시대적범위 * 유형 / 장르 주제에특정되지않은정보 * 제목, 크기, 출처, 콜렉션개발, 저작권, 이용자, 검색및기능성 * 디지털콜렉션내아이템의언어, 증가빈도, 아이템생성자 * 디지털콜렉션의관리기관또는기여기관, 자금출처 * 디지털콜렉션의중요성 독창성 포괄성 13) http://dcevents.dublincore.org/index.php/intconf/dc-2011/paper/view/50/19 국립중앙도서관도서관연구소 (K R IL I) 15
Linked Data 발행을위한시소러스 alignment 14) 발표자 : Johannes Keizer, Ahsan Morshed, Caterina Caracciolo, Gudrun Johannsen (UN식량농업기구(FAO), 이탈리아 ) - 사람과기계가동일하게데이터에접근할수있어야한다 라는시맨틱웹의비전에따라, 최근에는 Linked Data(LD) 로데이터를발행 (publishing) 하는방식이웹을통해데이터를이용할수있는방식으로서주목받고있음 - 데이터를 Linked Data로발행하기위해서는, 역참조 (dereferenceable) 할수있는 URI와, 표준언어 ( 주로 RDF(S)), 그리고데이터조각들간의링크가필요함. - 본논문에서는 AGROVOC 을 6개의잘알려진시소러스에맵핑하는작업을소개하고있는데, 이들 6개의시소러스는이미 RDF(S) 자원 ( 시소러스를 RDF(S) 로표현하기위해 SKOS 어휘를사용한 ) 으로서이용가능함 - 현행매칭시스템의한계를고려하여, 문헌에서논의된가장잘알려진매칭알고리즘을사용하였으며, 개념사이에서산출된평균유사도 (similarity) 값에해당하는단일한숫자를얻기위하여이들을결합하였음 - 이작업을통해, AGROVOC 의 Linked Data 버전에다른시소러스로의신뢰성있는링크를부여하는목표를달성하였음 14) http://dcevents.dublincore.org/index.php/intconf/dc-2011/paper/view/59/5 국립중앙도서관도서관연구소 (K R IL I) 16
주제명표목시스템을지리온톨로지에맞춰조정하는, 언어에독립적인접근법 15) (A Language Independent Approach for Aligning Subject Heading Systems with Geographic Ontologies) 발표자 : Nuno Freire, José Borbinha, Pável Calado (Instituto Superior Técnico, 포르투갈 ) - 주제명표목시스템은수년간도서관에의해개발되어온, 지식을조직화하는도구임. SKOS(Simple Knowledge Organization System) 는주제명표목시스템을표현하는실제적인방법을제공하며, 몇몇도서관에서는이러한시스템을 open linked data로서널리이용할수있도록앞장서고있음 - 각각의주제명표목은어떠한개념을설명하는데, 대부분의경우하나의주제명표목은여러개념의조합으로이루어짐 (ex. 지리적 시간적범위로제한된주제 ). 이러한사례에서, 그개념의표시 (label) 는실제로구조화된형태에서는표현되지않는여러개의개념을포함함 - 이논문에서는주제명표목시스템에기술된지리적인개념을지리온톨로지에서의관련성에맞춰조정하는것을다룬다. 접근방법은, 우선엔티티인식기술을사용하여주제명표목에서지명을파악하여, 대상지리온톨로지내의지명 ( 地名 ) 결정을따랐다. 이시스템은기계학습 (machine learning) 16) 에기반하고있으며, 현존하는다양한주제명표목시스템에적용될수있도록 언어에독립적으로 (language independent) 설계되었다. - 이러한접근방식은미의회도서관주제명표목표 (LCSH) 의부분집합으로서평가되었는데, 93% 의 F1 점수를달성하였음 15) http://dcevents.dublincore.org/index.php/intconf/dc-2011/paper/view/29/7 16) 인공지능의한분야로, 컴퓨터가학습할수있도록하는알고리즘과기술을개발하는분야 국립중앙도서관도서관연구소 (K R IL I) 17
data.europeana.eu - 유로피아나의 Linked Open Data 실험 17) 발표자 : Bernhard Haslhofer, Antoine Isaac - data.europeana.eu는유로피아나 의메타데이터를웹상에서 Linked Open Data로활용하기위해진행중인프로젝트로서, 표준웹기술을통해유로피아나의데이터제공기관 (data providers, 이하 DP) 으로부터수집된메타데이터를이용할수있게함 - 데이터는 EDM 형태로제시되며, 기술된자원은 URI 에의해자체주소를가지고 역참조 (dereferencable) 가능함. 유로피아나의자원들은 Linked Data Web 에서다른자원들과링크되어, 의미적으로연관된자원을발견할수있도록함. - 연구진들은유로피아나의 DP가자신들의데이터를 Linked Data로하는것을선택하게하고, DP의데이터를 EDM으로변환하는접근방식을개발하였음. ( 이과정에서유로피아나가변환한 EDM을웹상에서의미적으로연관된자원들과연결시키기때문에 DP에도이득이됨 ) - 이러한접근방식을통해, 유로피아나의첫번째 Linked Data 버전을생산하여해당데이터세트를웹상에발행 (publishing) 하였고, EDM HTTP URI 설계 RDF 저장방식등에관한경험도축적하였음 17) http://dcevents.dublincore.org/index.php/intconf/dc-2011/paper/view/55/14 국립중앙도서관도서관연구소 (K R IL I) 18
Performing Statistical Methods on Linked Data 18) 발표자 : Benjamin Zapilko, Brigitte Mathiak (GESIS Leibniz Institute, 독일 ) - 최근수년간, 많은정부기관은통계정보를 linked open data의형태로발행 (publish) 하였음 (ex. Eurostat, data.gov.uk) - 많은시각화도구가있음에도불구하고, 연구자들은자신들의연구질문에답하기위해과학적인통계분석을할필요가있음 - 현재, 연구자들은통계소프트웨어를사용하기위하여테이블기반포맷으로된통계데이터를다운로드받아야하는데, 이러한방식으로는 linked data가제공하는모든혜택 (ex. 해당데이터를다른데이터세트와연결하는것 ) 을받을수없음 - 이논문에서는연구자들이 linked open data에관한통계적인분석을수행하는것을돕기위해특별히설계된접근방법을제시함 - 분산된자원을 SPARQL을사용하여결합시킴으로써, 선형회귀분석등과같은간단한통계적인계산을적용하고그결과를사용자에게제공할수있음 - 이렇게다양한종류로이루어진데이터자료를가지고수행된계산을테스트한결과, 여러종류로이루어진통계데이터를가지고작업할때반드시인식해야할 데이터통합 에관한대표적인문제점들을파악할수있었음 마이크로서비스에기반한디지털큐레이션시스템을위한메타데이터 (Metadata for a Micro-services-based Digital Curation System) 19) 발표자 : Kevin Clair ( 펜실바니아주립대학도서관, 미국 ) - 미국펜실바니아주립대학의도서관및정보기술부서에서는대학의디지털 큐레이션및보존활동을지원하기위한서비스아키텍쳐를개발중임 - OpenCASA(Open Curation and Archival Services Architecture) 라불리는이시 18) http://dcevents.dublincore.org/index.php/intconf/dc-2011/paper/view/27/16 19) http://dcevents.dublincore.org/index.php/intconf/dc-2011/paper/view/17/8 국립중앙도서관도서관연구소 (K R IL I) 19
스템은캘리포니아디지털도서관이개척한디지털큐레이션에대한마이크로서비스접근방법 을바탕으로구축되었음 - 프로젝트보고서에서설명하고있는내용 * 이시스템을위한메타데이터개발에관련된상세한방법및철학 * 이방법이마이크로서비스모델의일반적인접근방식에맞춰어떻게조정될수있는지 * 아키텍쳐의현재제작상태, 시스템내에포함되어야하는미래의메타데이터서비스 * 이러한서비스가 OpenCASA 의이해관계자들과협력하여어떻게사용될것인가 메타브리지 (Meta-Bridge) : 일본내메타데이터정보인프라개발 20) 발표자 : Mitsuharu Nagamori, Shigeo Sugimoto, Masahide Kanzaki, Naohisa Torigoshi ( 일본 ) - 메타브리지 (Meta-Bridge)' 는일본총무성 (Ministry of Internal Affairs and Communication) 의자금지원을받아진행중인메타데이터정보인프라구축프로젝트임 - 프로젝트의목표 : 1인터넷상의메타데이터스키마 21) 공유를돕기위한인프라로서의메타데이터스키마레지스트리를구축하고, 2메타데이터스키마의재사용및메타데이터상호운용성을촉진하는것 - 일본내주요문화기관 ( 도서관 박물관 기록관등 ), 연구기관, 민간부문등다양한영역에서본프로젝트에참여하고있으며, 주요내용은 1참여기관의메타데이터스키마를수집하여 2(RDF 에기반하여정의된 ) 프로젝트의공식스키마로변환하는것임. - 보고서에서는 1프로젝트의배경, 목표, 2 Meta-Bridge' 라명명된레지스트리시스템의요건및설계에관하여설명하고있음 20) http://dcevents.dublincore.org/index.php/intconf/dc-2011/paper/view/37/9 21) 스키마 (Schema) : DB구성을설명하기위해일정한언어에의하여관련자료들사이의관계를기술한것 국립중앙도서관도서관연구소 (K R IL I) 20
- 메타데이터스키마및메타데이터의생애주기 * 인터넷상에서이용가능한콘텐츠로서의메타데이터는, 웹자원등과마찬가지로생애주기 (lifecycle) 를가짐. 본프로젝트에서는메타데이터의생애주기를 ' 계획, 생산, 사용, 유지 보존 ' 단계로설정하였음 * 메타데이터기록은장기간에걸쳐다양한목적으로사용되므로, 메타데이터스키마는오랜기간동안잘유지되어야함 - 프로젝트추진단계 * 메타데이터스키마레지스트리 ( 메타데이터어휘와애플리케이션프로파일을저장함 ) 를개발함. RDF 스키마는메타데이터어휘를정의하기위한기본틀로서사용되며, 싱가포르프레임워크와 RDF는애플리케이션프로파일을표현하기위해사용됨 * 새로운스키마를정의하려는이들을위해, 메타데이터스키마를정의하기위한가이드라인을수립. 이때, 메타데이터상호운용성을향상시키기위해현행스키마의재사용을적극권장해야함 * 다양한참여기관으로부터스키마를수집하고, 해당스키마들을프로젝트에서정의된표준형식으로온라인상에서이용할수있도록함 국립중앙도서관도서관연구소 (K R IL I) 21
BTP(Bamboo Technology Project) 콜렉션및콜렉션서비스기술 22) 발표자 : Timothy W. Cole, Myung-Ja K. Han, Doug Moncur, Harriett E. Green ( 미국 ) - 도서관이더많은디지털콘텐츠를획득및생성함에따라, 디지털콜렉션을기술 (description) 하기위한표준방식에합의해야할필요성도점점더명백해지고있음. 콜렉션기술을위한공유된규칙은검색뿐만아니라콜렉션및콜렉션아이템의재사용을용이하게할수있음 - 이전의작업에서는주로콜렉션검색을용이하게하고, 사람이읽을수있게콜렉션을기술하는표준및실습에중점을두었음 - 호주국립데이터서비스 (Australian National Data Service, ANDS), 그리고이글에서설명할 Bamboo Technology Project(BTP) 등의프로젝트의등장을계기로, 컴퓨터를매개로한콜렉션상호운용성 및 컴퓨터가주체가된 (computer-agent) 콜렉션이용 역시고려할필요가있음. - 이것은콜렉션기술에있어서 기계가수행할수있는 (machine-actionable) 콜렉션수준의서비스에대한기술 (desciption) 에더주목해야한다는것을나타내며, 시맨틱웹기술 (ex. RDF) 에더많이의존함으로써가능한혜택을시사함 - 초기프로젝트를수행한결과, 콘텐츠제공자들은 aggregator가사용하고자하는어떠한기능에적합한 ' 콜렉션수준의기술정보 ' 를스스로생성하지는않는다는것을알수있었는데, 이는콜렉션수준의기술 (description) 정보구축이대규모공동사업이되어야한다는것을시사함 - BTP의맥락에서, 본논문에서는콜렉션수준기술의생성및사용관련현행관례를논의하고, 콜렉션내콘텐츠의상호운용성을지원하는새로운개발및접근방식을소개함 22) http://dcevents.dublincore.org/index.php/intconf/dc-2011/paper/view/34/11 국립중앙도서관도서관연구소 (K R IL I) 22
일본인문학 DB의통합검색시스템을실현하기위한메타데이터관련도전 23) 발표자 : Biligsaikhan Batjargal, Fuminori Kimura, Akira Maeda ( 리츠메이칸대학, 일본 ) - 본보고서에서는현재진행중인 일본내여러디지털도서관, 기록관, 박물관에통합적으로접근하기위한프로젝트 의개요를설명함 - 일본인문학데이터베이스의통합검색시스템 ( 여러개의 DB를동시에검색하여, 결과를즉시취합하여제공함 ) 구축관련, 시스템은다양한포맷으로이루어진여러종류의메타데이터를처리할수있어야함 - 이프로젝트보고서에서는여러개의일본어 DB를동시에검색하고두개의언어로된검색결과를통합할때, 이용자단에서직면하게되는메타데이터관련문제점을논의함 - 다언어출처로부터검색을수행해야한다면, 영어와일본어로된검색결과를집적및통합하는것은복잡함 Linked Jazz : An Exploratory Prototype 24) 발표자 : Cristina Pattuelli, Chris Weller, Genevieve Szablya (Pratt Institute, 미국 ) - 본프로젝트보고서는디지털문화유산자료의검색및가시성을향상시키기위하여 Linked Open Data(LOD) 기술을적용하는연구와관련하여현재진행중인프로젝트의초기단계에관한보고임 - 프로젝트에서는음악가들간의관계와이들공동체의네트워크를드러내기위하여, 재즈역사의디지털아카이브에대한 Friend-Of-A-Friend(FOAF) 온톨로지의적용가능성을분석함 - 문화관련데이터를연결하는혁신적인방식을찾고이들전체를열린검색 23) http://dcevents.dublincore.org/index.php/intconf/dc-2011/paper/view/25/12 24) http://dcevents.dublincore.org/index.php/intconf/dc-2011/paper/view/54/20 국립중앙도서관도서관연구소 (K R IL I) 23
환경에서검색가능케하는것은, 새로운의미를생성하고새로운해석을이끌어내는전례없는기회를만들어냄 - 이프로젝트의목표는풍부하고다양한사회적네트워크속에서활동했던음악가들의개인적이고직업적인삶에관련된문서와데이터간의의미있는연관성을알아내도록돕는것임 - 프로젝트의첫번째단계에서는재즈아티스트의이름과그들의사회적연결을나타내는 RDF triples 데이터셋을생성하는방법을시험해보았는데, 향후추가적인사례연구와프로토타입테스트가필요함 더블린코어를위한콘텐츠표준으로서의 RDA( 자원의기술과접근 ) 25) 발표자 : Myung-Ja K. Han, Melanie Wacker, Judith Dartt ( 미국 ) - 자원의기술과접근 (Resource Description and Access, RDA)' 은모든유형의메타데이터표준에사용할콘텐츠표준으로서개발되었음 - 콜롬비아대학, 시카고대학, 일리노이대학은 2010년 10월 ~12월사이에진행된미국국립도서관의 RDA 테스트기간동안더블린코어요소세트로이새로운표준을평가하였음 - 보고서에서는테스트기간동안드러난문제점과, 그에관해 3개기관이각각고심한내용들, 사용된테스트셋업에대한기술 (description), 사용된도구, 직면한문제 (ex. 서지레코드의기능상요건 (FRBR) 의객체간의관계를더블린코어요소로기술할때의어려움 ) 등에관하여설명하고있음 25) http://dcevents.dublincore.org/index.php/intconf/dc-2011/paper/view/45/21 국립중앙도서관도서관연구소 (K R IL I) 24
음악메타데이터를 MARC FRBR RDF로변환하기 26) 발표자 : Madelyn Washington, Mark Notess, Jon W. Dunn ( 인디애나대학, 미국 ) - Variations/FRBR 프로젝트 27) 는 FRBR의실행에관한공동체의이해에기여하고자하며, FRBR의개념적모델을위한구체적인테스트베드의역할을함 - 본프로젝트는시스템및기관간에 FRBR 데이터의상호운용성및교환을증진시키는 FRBR-compliant 데이터포맷및인코딩 을공동체에제공하는것을목표로함. 이목표의첫번째성과로, 프로젝트팀은 FRBR-compliant XML 포맷을개발하여공개하였음 - 시맨틱웹표준을준수하는 (Semantic Web-compliant) 도서관 legacy 메타데이터 를생성하려는최근의활동에자극을받아서, V/FRBR 프로젝트는모든 FRBR 기반애플리케이션프로파일간의공식적인상호운용성증진에기여하게될 V/FRBR 데이터모델 을 RDF와연결하는작업 (RDF binding) 을최근완료하였음 - 이논문에서는 FRBR 개념적모델을실행하고포괄적또는음악에특화된환경에서모두사용가능한, 시맨틱웹표준을준수하며 (Semantic Web-compliant), 상호정보교환이가능한 (interoperable) 데이터모델 을만들기위해취해진조치에관하여논의함 26) http://dcevents.dublincore.org/index.php/intconf/dc-2011/paper/view/49/22 27) Variations/FRBR project : Variations as a Testbed for the FRBR Conceptual Model (http://www.dlib.indiana.edu/projects/vfrbr/) 국립중앙도서관도서관연구소 (K R IL I) 25
4. 포스터 온톨로지와 Linked Data에기반한 시맨틱서지 (Semantic Bibliography) 28) 발표자 : Haiyan Bai, Xiaodong Qiao, Bing Liang ( 중국과학기술정보연구소, 중국 ) - 추진배경 : 중국국립과학기술도서관 (NSTL) 의서지조직및통합의필요성 * 중국국립과학기술도서관 ( 이하 NSTL) 은과학관련 9개의주제분야별 ( 기초과학, 농학, 의학, 공학등 ) 국립도서관으로구성되어있으며, 종합목록은학술자원 ( 학술지, 프로시딩, 보고서등 ) 중심으로되어있음. * 전통적인서지조직방식은 MARC 필드에기반한색인및접근점을제공했는데, 이러한방식은서지에서추출된정보객체를구분하지못하고, 이들간의계층이나연관성을나타내지못함 - 본프로젝트의목적은 Linked Data 원칙을준수하여모든종류의서지적객체의특성과관계를식별, 기술, 조직화하기위한매커니즘을수립하는것임. 이를통해최종사용자는해당서지정보에접속하고브라우징할수있음 * 이를위해아래와같은특성에주목하였음 1정보형태의다양성 (ex. 해리포터 : 도서, 하드커버번역본, 오디오북, 영화, 게임등 ) 2정보수명의가변성 (ex. 학술지의표제변경, 새로운학술지로의합병등 ) 3복합객체의복잡성 (ex. 도서 ( 챕터 사진 표등으로구성됨 ), 논문 ( 초고 수정본 preprint 출판된버전등으로구성됨 )) - NSTL 은서지조직 (NSTL 서지온톨로지구축, 조직화방식의전환, linked data 발행을포함 ) 에온톨로지와 linked data의시맨틱기술을적용하였음. Scherzo: FRBR 기반의음악검색시스템 29) 발표자 : Jon W. Dunn, Juliet L. Hardesty ( 인디애나대학, 미국 ) 28) http://dcevents.dublincore.org/index.php/intconf/dc-2011/paper/view/20/24 29) http://dcevents.dublincore.org/index.php/intconf/dc-2011/paper/view/30/25 국립중앙도서관도서관연구소 (K R IL I) 26
- Scherzo" 란 : 인디애나대학의 Variations/FRBR 프로젝트를통해만들어진 FRBR 기반의음악검색시스템으로, 인디애나대학도서관의 MARC 기반목록에서추출한서지레코드를자동으로 FRBR화한 DB에서 19만건의악보및녹음자료를검색할수있음 (http://vfrbr.info/search) - 주요기능 : 연주법 작곡자등의카테고리를활용한패싯검색기능을통해, 음악의특정관심영역 (ex. 작곡자, 지휘자, 연주자..) 의 FRBR 관계검색이가능해짐. 또한결과페이지에저작 (work) 과구현형 (manifestation) 목록을함께제시함 historical engineering 아카이브즈의메타데이터통합 : 통합메타데이터레지스트리 (IMR) 구축 30) 발표자 : Ricardo Eito-Brun (Universidad Carlos III de Madrid, 스페인 ) - 스페인마드리드카를로스 3세대학 (Universidad Carlos III de Madrid) 의연구팀이수행한 historical engineering 아카이브즈를위한통합메타데이터레지스트리 (IMR) 구축 프로젝트에관한내용 - 토목공학분야의역사적가치있는문서군을소장한아카이브들의네트워크로부터메타데이터를수집및통합하기위한방식을제공함. - 메타데이터통합과상호운용성을가능하게하기위해, 네트워크에참여하는아카이브즈는 EAC-CPF 31) 의최종판으로인코딩된전거레코드와, 일련의시소러스에서추출한디스크립터 32) 를공유해야함 - 개발된프로토타입은 HTTP 를통한자동화된원격호출을사용하여 metadata assignments( 각기다른아카이브에서생성된 EAD및 EAC-CPF 레코드의부분집합이며, RDF로인코딩되었음 ) 를수집하고, XML포맷의 XML 토픽맵 (XTM) 을구축하기위해이들데이터를처리함. 30) http://dcevents.dublincore.org/index.php/intconf/dc-2011/paper/view/62/32 31) EAC-CPF(Encoded Archival Context Corporate bodies, Persons, and Families) 32) 디스크립터 (descriptor): 기록이나문헌의내용을표현하는색인어로서일반적으로통제어휘집에서추출됨 국립중앙도서관도서관연구소 (K R IL I) 27
- 레지스트리자체는서로다른페이지를구축하기위해나중에처리될 XTM 파일로구성되며, 최종사용자와연구자는레지스트리를탐색하고서로다른기록군과콜렉션에분산되어있는데이터와정보를검색하기위해사용함 - 통합메타데이터레지스트리 (Integrated Metadata Registry, IMR) 의효용 * 분산된아카이브즈의네트워크에서메타데이터의집적및검색을가능케함 * 메타데이터를교환 통합할수있도록시맨틱웹표준 (ex. RDF) 의적용가능성 국립중앙도서관도서관연구소 (K R IL I) 28
< 포스터 > 5. 워크샵 일시 / 장소 : 2011. 9. 22( 목 )-23( 금 ), 14:00~17:30 / 네덜란드국립도서관 목적 : 더블린코어커뮤니티 작업그룹별로진행되는현행작업에대한보고, 의제설정, 토의 국립중앙도서관도서관연구소 (K R IL I) 29
분야 RDA Libraries Libraries Application Profile Government Registry Translation Education Social Tagging Science & Metadata 주요안건 / 내용 - RDA( 자원의기술과접근 ) 요소및어휘 - RDA application profile 의개발에관한논의 - RDA 와, 관련된네임스페이스간의관계 - 유로피아나데이터모델 (EDM) - EDM 이도서관에어떻게작용하는가에관한사례 - 서지적인텍스트자원을위한더블린코어도서관애플리케이션 프로파일 (DC-Library Application Profile for Bibliographic Text Resource) 최종판소개및토의 - 정부정보의메타데이터활용사례발표및토의 * 캐나다정부의 Open Data Portal(ODP) * 기관의공식기록의메타데이터레코드를생산하기위해 DC 를사용 * 공공부문정보의재사용 / * 택소노미로서의법률 * 정부간상호운용성에있어서 DC, W3C 와같은공동체의역할 - Open Metadata Registry - 레지스트리유형, 레지스트리소프트웨어개관등 - 더블린코어문서및명세의번역자를위한안내 초안에관한 토의 검토 - DC-Education Application Profile - DCMI/LTSC 33) Joint Taskforce - ISO MLR(Metadata for Learning Resource) - 소셜태깅 - 웹기반소셜사이트 - 데이터발행, 인용, 큐레이션을위한학술메타데이터 34) 개관 - 학술데이터관련발표 ( 주제 : 큐레이션, linked data, 어휘등 ) 33) LTSC(Learning Technology Standards Committee) : IEEE 산하의 e-learning 기술표준기관으로, 교육관련기술표준화를개발, 보급하고있다. 34) Scientific Metadata: 학술데이터 ( 연구, 분석, 추적, 예측등의용도를위해방법론적으로수집된데이터 ) 를기술하기위한메타데이터 국립중앙도서관도서관연구소 (K R IL I) 30
6. 스페셜세션 어휘관리및 alignment 일시 : 2011. 9. 21( 수 ), 09:00~17:00 / 네덜란드국립도서관 발표자 : Diane Ileana Hillmann, Thomas Baker, Corey A. Harper, Gordon Dunsire, Johannes Keizer, Jon Phipps - 2010 년 DC 회의에서, DCMI 가어휘관리자들간의협력을촉진하고, vocabulary alignment 및상호운용성에관한모범사례를제공하는역할을수행해야한다는제안이있었음 - linked data 공간에서유용한어휘들이급증하는것은, 어휘의재사용 ( 및이를가능케하는도구 ) 이증가해야하고어휘의맵핑을위한핵심참조어휘와도구가필요함을시사하며, 이목적달성을위한첫단계로서최근에 DCMI와 FOAF간의협력이발표된바있음 - 안건 * 어휘관리인프라 ( 어휘관리자들의발표 / 기반, 정책, 전략적이슈 ) * 어휘검색, 맵핑, alignment ( 어휘검색솔루션 / vocabulary alignment 및맵핑 ) * 토론 (DCMI의역할 ) 미래의 DCMI 출판계획 일시 : 2011. 9. 23( 금 ), 14:00~17:30 / 네덜란드국립도서관 발표자 : Stuart A. Sutton, Thomas Baker : DCMI 의현재및미래의출판요구, 기회, 메커니즘에대한방향모색 - Open Journal System(OJS) 과 Open Conference System(OCS) 플랫폼을활용하여 DCMI의공식출판활동을확장시키는것이 DCMI의사명을얼마나효과적으로지원할수있는지를검토 - DCMI MediaWiki의현재및미래의역할에관한토의 : DCMI의영향력을관련실무를담당하는작업그룹뿐만아니라, 메타데이터설계 어휘관리및모범사례등에관심있는전세계사람들에게로확대할수있는기회를제공함 국립중앙도서관도서관연구소 (K R IL I) 31
Ⅴ 종합의견 본회의는메타데이터의상호운용성과관련된국제적인동향을파악하고, 도서관계등각분야별 Linked Data 추진현황에관한정보를습득할수 있는유익한시간이었음 지식의활용도와유용성을극대화하기위하여여러영역간의데이터협력및공동이용이활발해지고있음. 특히각국에서문화유산관련기관 ( 도서관, 기록관, 박물관등 ) 간의데이터협력및통합이용이활발히추진되고있으며, 이때각분야별정보의특성을살리면서도데이터를공동활용할수있는방안을적극모색하고있음을알수있었음 최근많은도서관이자관에서전통적으로수행해온지식조직활동의산출물 ( 서지데이터, 전거파일, 주제명표목등 ) 을 Linked Data로구현하여웹상에공개하고있음. 이러한활동은도서관이구축한데이터의재사용 공유를가능케하고다른데이터세트와연결하여부가가치를창출할수있게한다는점에서, 도서관이지식생태계를풍요롭게하는데에기여할수있는의미있는작업이라여겨짐 국립중앙도서관도서관연구소 (K R IL I) 32