우수디지털컬렉션구축을위한지침프레임워크제3 판 3 A Framework of Guidance for Good Digital Collection - 미국정보표준화기구, 2007년 12월발표 웹진 25호부터 28 호까지전문을제공합니다. < 순서> 서론컬렉션객체메타데이터이니셔티브 메타데이터 디지털환경에서가장큰도전과제중하나는웹에서이용할수있는자원의식별이다. 검색이가능한기술( 記述 ) 메타데이터로인해디지털콘텐츠가발견되고이용될수있는가능성도증가하였다. 장서수준메타데이터는이문서의컬렉션부분에설명되었다( 웹진 25호에실린장서원칙2 를참조하라). 이부분은개별적인객체와컬렉션내객체세트의기술에대해설명할것이다. 메타데이터는발견, 기술, 이용, 관리, 보존의목적을위해객체와관련된구조화된정보이다. 메타데이터생산은기관의다양한부서들이책임을공유해야하는점진적인과정이다. 다양한사람들이정보객체의생애주기중다양한단계에서다양한유형의메타데이터를추가한다. 예를들면, 생산단계에서객체의저자, 기타제작자, 출처, 이용대상에관한메타데이터는원 국립중앙도서관도서관연구소 (KRILI) 1
저자가제공할수있다. 조직화단계에서는목록자나색인자가주제, 출판이력, 접근권한에관한메타데이터를등록할수있다. 접근과이용 단계에서는, 이용자가리뷰, 주석같은평가정보를추가할수있다. 객체가이용되고배포되기전에가능한객체내에메타데이터를내장 하도록디지털객체의생산자를유도해야한다. 정보객체의생애주기 에관해서는게일호지스(Gail Hodges) 의논문, 바카(Baca) 의메타데이 터입문을참조하라. 둘다아래에나오는 메타데이터논의에관한개 론(General introductions to metadata issues) 에인용되었다. 일반적으로메타데이터는기본적인세종류로구별된다. 기술( 記述 ) 메타데이터는이용자들이객체및객체그룹중에서구별한한객체를찾고획득하고, 그내용을알수있도록도와준다. 관리메타데이터는파일관리, 권한관리, 보존과같은목적을위해장서관리자가객체에관한정보를얻을수있도록돕는다. 구조메타데이터는객체간의관계를문서화하고이용자가단행본의페이지와장( 章 ) 과같이복합객체를탐색할수있도록돕는다. 디지털컬렉션을구축하는가장중요한이유는조직이소장한자원에대한접근을늘리는것이다. 광범위하게접근가능한기술메타데이터를생성하는것은현재이용자의접근을극대화시키고, 새로운이용자층을끌어들인다. 메타데이터기반의접근도구사례에는도서관목록, 기록물검색도구, 박물관인벤토리제어시스템, 구글과같은검색유틸리티가포함된다. 수년간다양한메타데이터스키마가다양한유형의객체를기술하기위해개발되었다. 이렇게다양한스키마내에는상호운용성을지원하는어느정도의일관성이있다. 예를들면, 대부분의스키마는생산자혹은기타제작자이름, 날짜, 표제, 식별자등을제공한다. 문화유산기관은자신들의분야에서수용하고있는메타데이터표준을연구할때, 상호운용성을최대한보장하기위해, 초기부터메타데이터의이행 에있어상호운용성문제를고려하기를원하였다( 메타데이터원칙2와 국립중앙도서관도서관연구소 (KRILI) 2
객체원칙3 을참조하라). 기관은어떤메타데이터스키마와정보프로토콜이자신들의컬렉션에가장잘맞는지신중하게고려해야만한다. 기관들은어떤통제어휘와시소러스를활용하고, 어떤데이터내용표준이컬렉션내객체에가장적합한지도역시신중하게생각해야한다. AACR(Anglo-American Cataloging Rules) 과같이오랜기간을통해확립된목록지침이있고, 현재는새롭게떠오르는 DACS(Describing Archives: A Content Standard), CCO(Cataloging Cultural Objects), RDA(Resource Description and Access) 가있다. 기관이따르기로선택한목록표준과그목록표준의수정및조합은최종이용자가잘접근할있도록하고, 집합컬렉션내에서이행되고공유가능한메타데이터레코드를생성할수있는중요요인이다. 메타데이터원칙1의표에있는 이용지침(Guidelines for Use) 을참조하라. 다음표는메타데이터입문(Introduction to Metadata, 2008 년개정판) 에실린앤길리랜드(Anne Gilliland) 의평론에서나온것으로데이터표준의유형과함께작용하는사례를설명한다. 데이터표준유형 데이터표준의유형예데이터구조표준( 메타데이터요소세트, 스키마). 이는레코드나기타정보객체를구성하는데이터의 범주 또는 컨테이너 이다. Art(CDWA) VRA Core Categories 데이터값표준( 통제어휘, 시소러스, 통제리스트). 이들은데이터구조표준또는메타데이터요소세트에서사용되는용어, 이름, 기타값들이다. 데이터내용표준( 목록규칙). 이는메타데이터요소에사용되는형식과구문에관한지침이다. set of MARC(Machine-Readable Cataloging format) fields Encoded Archival Description(EAD) Dublin Core Metadata Element Set(DCMES) Categories for the Description of Works of Library of Congress Subject Headings(LCSH) Library of Congress Name Authority File(LCNAF) LC Thesaurus for Graphic Materials(TGM) Medical Subject Headings(MeSH) Art & Architecture Thesaurus(AAT) Union List of Artist Names(ULAN) Getty Thesaurus of Geographic Names(TGN) ICONCLASS Anglo-American Cataloguing Rules(AACR) Resource Description and Access(RDA) International Standard Bibliographic Description(ISBD) Cataloging Cultural Objects(CCO) Describing Archives: A Content Standard(DACS) 국립중앙도서관도서관연구소 (KRILI) 3
데이터형식/ 기술교환표준( 기계 MARC21, MARCXML, EAD XML DTD, METS 가독형태로표현된메타데이터 MODS, CDWA Lite XML schema 표준). 이표준의유형은특정한 Simple Dublin Core XML schema 데이터구조표준의표현형으로 Qualified Dublin Core XML schema 기계처리를위해인코딩된다. VRA Core 4.0 XML schema 메타데이터의생산비용과이용자의이익간에는일반적으로직접적인관계가있다. 각아이템을기술하는것은컬렉션이나아이템의그룹을기술하는것보다훨씬비용이많이든다. 풍부하고복합적인메타데이터스카마를이용하는것은단순한메타데이터스키마를이용하는것보다훨씬비용이많이든다. 표준주제어휘집과분류스키마를적용하는것은일부통제되지않은키워드를할당하는것보다훨씬비용이많이든다. 그러나이러한개발비용이결국최종이용자들을위한더큰능률성과유효성으로귀결되는것을주목해야만한다. 어떠한메타데이터표준을채택할것인가와어느계층까지기술할것인가에대한결정은컬렉션을개발하는조직의목적, 이용가능한인적, 기술적자원, 이용자및의도된이용, 특정한연구및지식영역내에서수용한접근방안등과같은상황을고려하여이루어져야한다. 고려해야만하는질문사항은다음을포함하지만, 이에한정되지는않는다. 디지털컬렉션의목적은무엇인가? 이컬렉션을구축하는목표는무엇인가? 대상이용자는누구인가? 그들이필요로하는정보는무엇이며, 그들의전형적인정보추구행동은무엇인가? 자료는장서수준으로접근하는가? 아니면개별적인아이템수준으로접근하는가? 혹은둘다접근하는가? 객체의복합적인버전이나구현형은서로간에구별될필요가있는가? 디지털컬렉션이구축되기전에컬렉션과장서는메타데이터를가질것인가? 관련된주제학문분야는무엇인가? 이학문분야에서일반적으로이용되는메타데이터표준은무엇인가? 국립중앙도서관도서관연구소 (KRILI) 4
이영역에서조직들이이용하는메타데이터표준은무엇인가? 어 떤메타데이터표준이이러한특정컬렉션에가장적합한가? 얼마나상세하게기술할것인가? 메타데이터는계층적관계를전달할필요가있는가? 기관은컬렉션의성격에따라, 단일메타데이터스키마가기관의모든요구에충분하지않을수있다는것을알아야만한다. 따라서메타데이터스키마의적절한조합은이러한문제에대해가장우수한해결책일수있다. 예를들면, 공통의출처를가진기록물장서에대해서는장서수준의스키마인 EAD 를이용하고, 아이템계층에대해서는 MODS, VRA Core 4.0, CDWA Lite, 기타적절한스키마를사용할수있다. 마찬가지로컬렉션에대해특정한, 발간된통제어휘를심사숙고하여선정하는것은선정된스키마의핵심접근요소에있는데이터값으로적용되어야만한다. 메타데이터원칙1 : 우수한메타데이터는컬렉션내의자료들, 컬렉션의이용자들, 컬렉션의현재와미래의이용에적합한방식으로공동체표준(community standards) 을따른다. 메타데이터원칙 2 : 우수한메타데이터는상호운용성을지원한다. 메타데이터원칙3 : 우수한메타데이터는객체를기술하고관련된객체를연결하기위해전거제어와내용표준을사용한다. 메타데이터원칙4 : 우수한메타데이터는디지털객체의이용조건과기간에대한명확한설명을포함한다. 메타데이터원칙5 : 우수한메타데이터는컬렉션내객체의장기적인제공과보존을지원한다. 메타데이터원칙 6 : 우수한메타데이터레코드는그자체가객체이 국립중앙도서관도서관연구소 (KRILI) 5
므로우수한객체의질적특성인권위성, 진본성, 보존성, 영속성, 유일식별성등을포함해야만한다. 메타데이터 메타데이터원칙 1 메타데이터원칙1 : 우수한메타데이터는컬렉션내의자료들, 컬렉션의이용자들, 컬렉션의현재와미래의이용에적합한방식으로공동체표준(community standards) 을따른다. 독점적혹은지역적인메타데이터스키마를이용하는것보다는잘알려진공동체메타데이터표준을따르거나적어도그에따라매핑하는것이더중요하다. 그러나단순히특정한메타데이터스키마를고려했다고해서, 표준이반드시모든컬렉션에적합하다는것을의미하지는않는다. 예를들어 EAD(Encoded Archival Description) 는공통의출처를가진완전한기록물장서를기술하는안정적인표준이지만, 서로다른출처의객체로구성된혼합적인문화유산컬렉션을기술하는최상의스키마는아니다. 메타데이터전략을실행하는제일첫단계중하나는컬렉션에가장적절한메타데이터표준또는세트표준을분석하고식별하는것이다. 특정공동체와자료유형을위해개발된메타데이터스키마, 통제어휘, 시소러스는조심스럽게연구되고분석되어야하며, 가장적절한것이선정되고이행되어야한다. 디지털객체를위해이용할수있는, 출판된다양한메타데이터가있다. 모든사서들을위한메타데이터기초 (Metadata Fundamentals for All Librarians, P. Caplan, 2003, 아래를참조하라) 라는책은교육기관, 과학기관, 문화기관이이용하는 15 가지이상의스키마를설명한다. 많 국립중앙도서관도서관연구소 (KRILI) 6
은경우에, 특정한컬렉션의자료에적용할수있는스키마가하나이상있을것이다. 스키마의선택은컬렉션자체의특성, 메타데이터생산에투자하는기관의자원수준, 메타데이터생산자의전문지식수준, 컬렉션에대한예상이용과이용자, 디지털컬렉션의상호운용성과공유를위한목적, 기타요인등을반영할것이다. 조직은자료에대해희망하는접근의깊이및범위측면에서, 기술( 記述 ) 수준을고려해야한다. 다시말해컬렉션계층, 시리즈혹은그룹계층, 아이템계층, 다계층중에서어느계층수준으로레코드를기술할것인지를고려해야만한다. 조직은또한유사한기관들이어떤스키마를일반적으로이용하는지고려해야한다. 동일한메타데이터스키마의이용은컬렉션간의상호운용성을증진시킬것이다. 일부경우최상의전략은통합된방식으로두가지혹은그이상의메타데이터스키마를활용하는것이다. 예를들어 MARC 혹은 EAD는컬렉션혹은그룹계층에서이용될수있으며 MODS나 CDWA Lite 혹은 VRA Core는컬렉션이나그룹내에있는개별적인아이템을기술할때사용될것이다. METS는다양한스키마로표현된메타데이터를연계하기위해메타데이터 래퍼(wrapper) 로써이용될수있다. 단순히컬렉션을위한적절한메타데이터스키마를식별하는것만으로는충분하지않다. 많은경우에기관들은선정된스키마를위한자체로컬 응용프로파일(application profiles) 1) 을개발하고이행할필요가있는데, 스킴이다양한선택안을허용하는영역에서이행될것을정확하게명시해야한다. 일단특정한컬렉션혹은컬렉션그룹에적용하기위해공동체메타데이터표준을선정하면, 그스키마가지역적으로어떻게이행되어야만하는지명시하는자세한프로파일을개발하고기 1) 응용프로파일(application profiles) : 하나이상의기존메타데이터스키마네임스페이스 (namespace) 에서추출한메타데이터요소들로새롭게구성한메타데이터스키마를말한다. 응용영역의목적에부합하는새로운시스템을개발하기위해서는메타데이터스카마에대한결정이우선되어야한다. 예를들어, 박물관, 교육, 웹자원, 전자저널등과같은영역에서디지털도서관을구축할경우, 이러한특정도메인에필요한메타데이터스키마를정의하는데사용되는개념이바로응용프로파일이다( 디지털도서관운영론, 이수상, 2008). 국립중앙도서관도서관연구소 (KRILI) 7
록해야한다. 응용프로파일은다양한기존메타데이터스키마에서나온메타데이터요소를조합시켜준다. 원래스키마에서나온정의, 요구, 우수실무사례, 한정어는특정한응용프로파일의필요에따라수정되거나추가될수있다. 프로파일은기존표준스키마에또한로컬요소를추가할수있게한다. 다음은많은문화유산기관이이용하는메타데이터스키마를선정한것이다< 주 : 아래의표는개별적인메타데이터스키마이므로이기사의뒷부분에원문으로제공합니다.>. 메타데이터논의에대한입문서는다음과같다. 편집인마사바카, 메타데이터입문: 디지털정보로가는길( 버전 2.1 은온라인이용가능, 버전 3.0은 2008 년공개) (Murtha Baca, editor, Introducation to Metadata: Pathways to Digital Information) http://www.getty.edu/research/conducting_research/standards/intrometadata/ 프리실라카플란, 모든사서들을위한메타데이터원칙( 시카고,ALA 편집,2003) (Priscilla Caplan, Metadata Fundamentals for All Librarians, Chicago:ALA Editions, 2003) 캐나다문화유산정보네트워크, 박물관편목작성을위한메타데이터표준 (Canadian Heritage Information Network(CHIN), Metadata Standards for Museum Cataloging) http://www.chin.gc.ca/english/standards/metadata_intro.html 제인그린버그, 메타데이터와메타데이터스키마이해 (Jane Greenberg, Understanding Metadata and Metadata Schemes, 2005) http://www.ils.unc.edu/mrc/pdf/greenberg05understanding.pdf 게일호지스, 디지털아카이빙의우수실무사례, 정보생애주기접근 D-Lib 매거진, v.6, no.1 (Gail Hodges, Best Practices for Digital Archiving: An Information Life Cycle Approah, D-Lib Magazine, 2000) 국립중앙도서관도서관연구소 (KRILI) 8
http://www.dlib.org/dlib/january00/01hodge.html 미국정보표준화기구, 메타데이터의이해 (National Information Standards Organization(NISO), Understanding Metadata, 2004) http://www.niso.org/standards/resources/understandingmetadata.pdf 이미지기술자문서비스, 메타데이터개관 (Technical Advisory Service for Images(TASI), Metadata Overview, 2006) http://www.tasi.ac.uk/advice/delivering/metadata.html 이미지를위한기술자문서비스, 메타데이터실용화 (Technical Advisory Service for Images(TASI), Getting Practical with Metadata, 2006) http://www.tasi.ac.uk/advice/delivering/metadata-practical.html 우수실무사례는다음과같다. 지구과학교육을위한디지털도서관, 메타데이터우수실무사례 (Digital Library for Earth System Education(DLESE), Metadata Best Practices) http://www.dlese.org/metadata/collections/metadata-best-practices.htm 디지털도서관연합, OAI데이터제공자이행과공유메타데이터를위한우수실무사례 (Digital Library Federation, Best Practices for OAI Data Provider Implementations and Shareable Metadata) http://webservices.itcs.umich.edu/mediawiki/oaibp/?publictoc 메타데이터자원을위한포털사이트는다음과같다. 국제도서관연맹, 디지털도서관 : 메타데이터자원 (International Federation of Library Associations(IFLA), Digital Libraries: Metadata Resources) http://www.ifla.org/ii/metadata.htm UKOLN 메타데이터 (UKOLN Metadata) 국립중앙도서관도서관연구소 (KRILI) 9
http://www.ukoln.ac.uk/metadata/ 응용프로파일은다음과같다. 토마스베이커등, 더블린코어응용프로파일지침 (Thomas Baker, et al., Dublin Core Application Profile Guidelines, 2005) http://dublincore.org/usage/documents/profile-guidelines/ 히리, 페텔, 응용프로파일메타데이터 : 스키마혼합과매칭 웹진아리아드네 25호 (R. Heery, and M. Patel, "Application Profiles: Mixing and Matching Metadata Schemas" in Ariadne 25, 2000) http://www.ariadne.ac.uk/issue25/app-profiles/intro.html 더블린코어와메타데이터응용 - 2007년더블린코어국제회의 (International Conference on Dublin Core and Metadata Applications DC-2007) http://www.dc2007.sg/ 회의주제는 응용프로파일의이론과실무 이다. 서부주( 州 ) 디지털표준메타데이터실무그룹, 서부주더블린코어우수실무사례 (Western States Digital Standards Group Metadata Working Group, Western States Dublin Core Best Practices, 2003) http://content.lib.utah.edu/cgi-bin/showfile.exe?cisoroot=/docs_regional&cisoptr=1 많은기관이참여한디지털컬렉션프로젝트를위한일반적응용프로파일사례 빅토리아온라인, 메타데이터응용프로파일과분류지침 (Victoria Online, Metadata Application Profile and Taxonomy Guidelines, 2006) http://egov.vic.gov.au/pdfs/vomapguidelinestaxv4.1_final-dec2006.pdf 전자정부포털을위한프로파일 국립중앙도서관도서관연구소 (KRILI) 10
메타데이터원칙 2 메타데이터원칙 2 : 우수한메타데이터는상호운용성을지원한다. 오늘날의교습, 학습, 연구는분산된네트워크환경에서이루어진다. 세계의도서관, 기록관, 박물관과역사단체에분산된자원을발견하는것은어려운과제일수있다. 이러한어려움을완화하기위해문화유산기관은이러한분산시스템의상호운용성을지원하는메타데이터시스템을설계해야만한다. 우수한메타데이터는개발될당시의로컬환경을넘어서서세계적인환경에서도일관성이있고의미있으며, 유용해야만한다. 이는메타데이터가로컬환경에서사용될당시의가정이폭넓은네트워크환경에서는더이상유효하지않을수도있으므로, 메타데이터가객체에관련된모든정보를포함해야한다는것을의미한다. 예를들면, 사진기록물의경우기술된객체자체가사진자료라는것을각레코드에서는명시하지않을수도있다. 그러나폭넓은네트워크환경에서는형식과장르정보가더욱중요해지고있다. 주제중심의디지털컬렉션은이용자들이디지털컬렉션핵심주제를안다고가정하면서, 비상호운용적인메타데이터를생성하는것으로유명하다. 보다큰컬렉션집합내에서이러한메타데이터를공유할때, 원래컬렉션내에서는이해되던기술이애매해질수있다. 이는하버드대학의테디루주벨트장서의사진 말을타고 문제와같은데, 테디루주벨트컬렉션내의모든자료는루주벨트와관련되어있기때문에, 사진에부여된제목으로는누가말을타고있는지표시하지못한다. 접근할수있으며의미있는공유컬렉션을구축하는것은데이터제공자( 메타데이터레코드를생성하고연합컬렉션에제공하는조직) 와서비스제공자( 연합컬렉션혹은종합목록에대한접근을제공하는집합제공자) 양쪽모두의책임이다. 데이터제공자는일관되고표준에기반 한메타데이터를생성하고, 적절한통제어휘, 시소러스를이용하며, 국립중앙도서관도서관연구소 (KRILI) 11
적절한데이터내용표준을따르도록( 예를들면, 목록작성) 노력해야한다. 서비스제공자는메타데이터의정규화, 수정, 강화를이행해야만하며, 그명칭이암시하는바와같이, 어휘지원검색, 주제클러스터링, 용어매핑, 기타강화안등추가적인 부가가치 서비스를제공해야한다. 적절한표준을준수하고, 데이터제공자와서비스제공자가협력하는것은효율적으로집합된디지털컬렉션의핵심요소이다. 세라쉬레브스, 리즈밀레취츠, 공유메타데이터를향한움직임, First Monday, v.11, no.8, (Sarah Sherves, Jenn Riley and Liz Milewicz, "Moving Towards Shareable Metadata", First Monday, v.11, no.8, 2004) http://www.firstmonday.org/issues/issue11_8/shreeves/index.html 지역적인기술( 記述 ) 이집합제공자(aggregation) 에서실패하는것을설명 스코틀랜드박물관위원회, 메타데이터상호운용성프로젝트 (Scottish Museums Council, Metadata Interoperability Project) http://cms.cdlr.strath.ac.uk/about.html 윌리엄암스등, 상호운용성의범위, 미국립과학디지털도서관을위한과학프로토타입사이트 ("A Spectrum of Interoperability: The Site for Science Prototype for the NSDL", D-Lib Magazine, v.8, no.2, 2002) http://www.dlib.org/dlib/january02/arms/01arms.html 이미지를위한기술자문서비스, 메타데이터표준과상호운용성 (Technical Advisory Service for Images(TASI), Metadata Standards and Interoperability) http://www.tasi.ac.uk/advice/delivering/metadata-standards.html 로이테넌트, 메타데이터의더나은수집, 라이브러리저널 (Roy Tennant, Metadata's Bitter harvest," Library Journal, 2004) http://www.libraryjournal.com/article/ca434443.html?display=digital+libr ariesnews&industry=digital+libraries&industryid=3760&verticalid=151 상호운용성의목적은학문영역과기관들사이에분산된정보객체를찾고접근할수있도록돕는것이다. 표준메타데이터스킴을이용하면, 선택한스킴을지원하는시스템을통해메타데이터레코드를교환하고 국립중앙도서관도서관연구소 (KRILI) 12
공유할수있다. 이론적으로말하면, 메타데이터스킴은각데이터요소의정의, 식별, 이용을위한표준화된정보를제공하는레지스트리에기록되어야만한다. 레지스트리는메타데이터특성과형식화필요조건을정의하는데, 이는한기관이이용하는메타데이터스킴과데이터요소를조직또는공동체내에서일관성있게적용하고, 다른공동체가재이용하며, 이용자뿐만아니라컴퓨터애플리케이션이해석할수있도록보증한다. ISO/IEC 11179-3:2003(E), 정보기술- 메타데이터레지스트리(MDR)- 제3부레지스트리메타모델과기본속성 (ISO/IEC 11179-3:2003(E), Information Technology-Metadata Registries (MDR)-Part3: Registry metamodel and basic attributes) http://standards.iso.org/ittf/publiclyavailablestandards/c031367_iso_iec_1 1179-3_2003(E).zip 메타데이터레지스트리표준은일관성있는정의, 해석, 데이터요소의이용을제공한다. ISO 11179-3의핵심필요조건은데이터요소이름, 데이터요소레이블, 데이터형태, 데이터요소식별자, 버전넘버, 반복성, 이용의책임( 예, 강제또는선택), 통제어휘, 이용환경이나정보범주를포함한다. 동영상컬렉션, 핵심데이터요소레지스트리 (The Moving Image Collections(MIC), Core Data Element Registry) http://gondolin.rutgers.edu/mic/text/how/unioncat_registry_table_04_23.htm 하나의프로젝트에서단순한보여준다. 11179 레지스트리를이용하는방법을 서로다른메타데이터스킴을이용해야만할때, 상호운용성을이루는한가지방법은하나의스킴에서다른스킴으로요소를매핑하는것이다. 한스킴의이용자가다른스킴을이해하는것을도와주는이러한매핑혹은변환은검색의자동번역에서이용될수있으며, 한스킴에따라생성된레코드를다른스킴으로변환할수있도록한다. 만약로컬에서생성된메타데이터스킴을표준스킴보다우선해서사용한다 국립중앙도서관도서관연구소 (KRILI) 13
면, 장래에상호운용성이요구될것을예상하여표준스킴으로의변환을개발해야만한다. 게티연구소, 메타데이터표준변환 (Getty Research Institute, Metadata Standards Crosswalks) http://www.getty.edu/research/conducting_research/standards/intrometadata/c rosswalks.html 게티표준프로그램이운영하는예술, 건축, 문화유산정보와관련된변환 미의회도서관, MARC 표준: MARC21 형식 (Library of Congress, MARC Standards: MARC21 Formats) http://www.loc.gov/marc/marcdocz.html MARC21 로의매핑( 변환) 과 MARC21 로매핑( 변환) 미국립과학디지털도서관,NSDL메타데이터자원페이지 (National Science Digital Library(NSDL), Metadata Resources Page) http://metamanagement.comm.nsdlib.org/intropage.html 주로변환을위한메타데이터자원페이지 워싱턴대학교, 메타데이터이행그룹 (University of Washington, Metadata Implementation Group) http://www.lib.washington.edu/msd/mig/datadicts/default.html 도서관의각디지털컬렉션에서이용하는데이터사전에서나온더블린코어를위한매핑을유지한다. 상호운용성을증대시키는다른방법은메타데이터수집을위한프로토콜인 OAI-PMH 2) 를지원하는것이다. OAI-PMH를지원하는시스템은자신들의메타데이터를수집기에제공하여메타데이터가연합데이터베이스에포함되어외부검색서비스에서이용될수있도록한다. Open Archives Initiative http://www.openarchives.org 메타데이터수집을위한프로토콜 (Protocol for Metadata Harvesting) 2) Open Archives Initiative Protocol for Metadata Harvesting 국립중앙도서관도서관연구소 (KRILI) 14
과지침으로링크한다. OAIster http://www.oaister.org/ 미시간대학의 OAIster 검색서비스는 OAI-PMH를통해수백개의컬렉션에서수집한디지털화된문화유산자료의레코드를포함한다. OAI 데이터제공자이행과공유메타데이터를위한우수실무사례 (Best Practices for OAI Data Provider Implementations and Shareable Metadata) http://webservices.itcs.umich.edu/mediawiki/oaibp/index.php/main_page 디지털도서관연합(Digital Library Federation) 과 국립과학디지털도서 관의연합이니셔티브 상호운용성을증대시키는또다른방법은 메타서치 라고불리는시스템간검색을위한프로토콜을지원하는것이다. 이러한모델에서는메타데이터는원래의리포지토리에남아있고, 로컬검색시스템은외부의원격검색시스템에서질의를받아들인다. 시스템간검색을위한가장유명한프로토콜은국제표준인 Z39.50 으로웹환경에적합하다. 미의회도서관,URL 을통한검색/ 탐색 (Library of Congress, SRU: Search/Retrieve via URL) http://www.loc.gov/standards/sru/ 일반질의언어(Common Query Language) 를이용하여, URL에서검색질의와같은 Z39.50 을전달하기위한표준프로토콜. 이사이트는또한 SRU 경우처럼질의가 URL을통하지않고통과하는 SRW( 탐색/ 검색웹서비스) 세부항목으로도링크한다. HTTP에대한 XML의 이용과 SOAP( 단일객체접근프로토콜) 의이용은제외이다. 국립중앙도서관도서관연구소 (KRILI) 15
메타데이터원칙 3 메타데이터원칙3 : 우수한메타데이터는객체를기술하고관련된객체를연결하기위해전거제어와내용표준을사용한다. 분산된객체의특성은가능하다면표준통제어를사용하여표현되어야한다. 이는인명, 단체명, 장소명, 저작표제, 주제, 장르표제를포함하지만, 이에한정되지는않는다. 이름과표제는표준기술목록규칙에따라공식화되어야하며, 주제어와장르는통제어휘와시소러스를따라야한다. 관련자료를계층적구조로분류하는통제어휘의일종인분류표는온라인주제접근을제공할때유용할수있다. 메타데이터스킴과함께, 발간된많은시소러스, 분류표, 전거파일이있지만 모든상황에적용할수있는 해결책은없다. 선택된메타데이터스킴, 기술되는장서의특성, 기관의자원, 이용자기대등과같은요소에따라이용을위한어휘의선정이좌우될것이다. 고려해야할요소는다음을포함한다. 디지털장서의예상이용자. 이용자는성인인가아동인가? 전문가 인가일반인인가? 이용자는어떤언어로말하는가? 이용자가이용 할수있는다른자원은무엇인가? 이자원에는어떠한어휘가사 용되는가? 어휘사용을지원하기위한도구. 온라인시소러스가있는가? 그것 은컬렉션검색시스템으로통합될수있는가? 상호참조와연관어 가있는가? 유지. 새로운단어가이용되고, 오래된단어는시대에뒤지게된다. 누가어휘를유지하고어떻게갱신할것인가? 가장효율적으로최종이용자가접근할수있도록, 발간된표준전거에서나온용어와이름을사용하며, 추가로로컬상황에적합하고컬렉션에특성화된전거와어휘를사용하는것이최상의전략이다. 어휘집을 국립중앙도서관도서관연구소 (KRILI) 16
어떻게조합하여선정하든간에, 그이용은신중하게기록되어야하고, 메타데이터구축자가일관되게단어를선정할수있도록기관내지침을제공해야한다. 전거리스트가매우짧고간단하게조직화되지않는다면, 저자들과기타숙련되지않은메타데이터구축자가통제어휘를성공적으로사용하도록기대하는것은어렵다. 고차적시소러스프로젝트 (The High Level Thesaurus Project(HILT), http://hilt.cdlr.strath.ac.uk/sources/index.html) 는관련자원, 프로젝트, 자모순시소러스리스트를포함하는통제어휘에관한정보센터이다. 일부조직은특정영역에서의이용을위하여시소러스를유지한다. 게티어휘프로그램 (The Getty Vocabulary Program) http://www.getty.edu/research/conducting_research/vocabularies/aat/ 게티연구소는시각예술, 건축, 물질문화를위한여러시소러스를구축하고유지하며배포한다. 예술과건축시소러스(The Art & Architecture Thesaurus, AAT) 는스페인어(http://www.aatespanol.cl/ ) 와네덜란드어 (http://www.aat-ned.nl/) 로이용가능하다. 박물관기록협회, 용어은행 (Museum Documentation Association(MDA), Terminology Bank) http://www.mda.org.uk/spectrum-terminology/termbank.htm MDA( 박물관기록협회는이전명칭으로현재는 Collections Trust) 는고고학객체, 수로, 철도, 의상, 항공기유형을기술하는어휘를포함하여박물관객체를위한시소러스를구축하고유지하며배포한다. 미의회도서관전거파일 (Library of Congress, Authorities) http://authorities.loc.gov/ 미의회도서관은주제명표목의통제리스트, 개인명과단체명의전거형태를포함한파일등서지적기술을위한전거파일을구축하고유지하며배포한다. 국립중앙도서관도서관연구소 (KRILI) 17
기타통제어휘는다음과같다. 박물관목록작성을위한명칭부여개정판: 로버트챈헐의수공객체 분류를위한체계개정확장판 (Revised Nomenclature for Museum Cataloging: A Revised and Expanded Version of Robert C. Chenhall's System for Classifying Man-made Objects(Nashville: American Association for State and Local History, 1988)) 웹상으로는이용할수없는이책은수많은소규모박물관과역사 단체가이용한다. 예술과건축시소러스(AAT) 의범위에들어가는, 이책의용어모두는예술과건축시소러스에포함된다. ICONCLASS http://www.iconclass.nl/ 예술품에있는서사성이있고도상적인콘텐츠와기타시각적인자 료들을기술하기위한분류체계로문자와숫자식의표기, 관련내 용, 관련키워드로구성된다. 원문은영어이며, 독일어, 이탈리아어, 프랑스어, 핀란드어로도이용가능하다. 그래픽자료를위한시소러스 I: 주제어 (Thesaurus for Graphic Materials(TGM) I: Subject Terms, 1995) http://lcweb.loc.gov/rr/print/tgm1/ 그래픽자료를위한시소러스 II: 장르와물리적특성에관한용어 (Thesaurus for Graphic Materials(TGM) II: Genre and Physical Characteristics Terms, 2004) http://lcweb.loc.gov/rr/print/tgm2/ 미국지질연구소, 지리명정보시스템위원회 (U.S. Geological Survey, U.S. Board on Geographic Names' Geographic Names Information System) http://geonames.usgs.gov/ 국립중앙도서관도서관연구소 (KRILI) 18
웹에서이용할수있는분류체계는다음과같다. 듀이십진분류법 (Dewey Decimal Classification) http://connexion.oclc.org/ [ 접근하기위해서는구독이요구됨] 미의회도서관분류법 (Library of Congress Classification) http://classweb.loc.gov/ [ 접근하기위해서는구독이요구됨] OCLC 의용어서비스(OCLC's Terminologies Service, http://www.oclc.org/terminologies/) 는게티어휘, MeSH, TCM I및 II를포함하여폭넓은통제어휘와시소러스에접근할수있도록하고메타데이터구축도구를함께제공한다. 메타데이터원칙 4 메타데이터원칙4 : 우수한메타데이터는디지털객체의이용조건과기간에대한명확한설명을포함한다. 객체의이용조건은객체의저작권이소멸된상태인지, 저작권이보호받고있는지와같은저작권상황을포함한다. 이용자는이용이제한된다면어떻게허락을얻어야하며, 이용을허락받았다면어떻게자료를인용해야하는지에대하여알수있어야한다. 기관은또한자원의출판여부와자원의생산자혹은권리소유자가누구인지를기록해야한다. 권리소유자의연락처정보는유지되어야만한다. 이러한정보가컬렉션의모든자료에동일하다면, 장서수준메타데이터에서이정보를기록하는것이적절하다( 컬렉션을참조하라). 그렇지않다면객체수준으로기록되어야한다. 많은메타데이터스킴은이러한정보를저장할장소를가지고있다. 국립중앙도서관도서관연구소 (KRILI) 19
만약그렇지않다면, 사용해야만한다. 외부스킴혹은로컬적으로정의된요소세트를 권한메타데이터(right metadata) 는급속히발전하는분야이다. 권한메타데이터는일반적으로 XML(eXtensible Markup Language) 로표현되며서로보완적이지만별개인세가지목적을가질수있다. 권한기술 (Right description) 은저작의저작권현황, 자원을이용할때권한보유자의요구조건, 자원의이용을허락받기위한이용자속성, 자원이용을위한양자의동의를포함한다. PREMIS 권한메타데이터, <indecs>rdd( 저작권데이터사전), 크리에이티브커먼스라이선스(Creative Commons License) 등은저작권기술의사례들이다. 캘리포니아디지털도서관의저작권메타데이터스키마 (copyrightmd Schema) 는표준으로발전할수있는, 상세한저작권정보를기록하기위한권한기술스키마이다 (http://www.cdlib.org/inside/projects/rights/schema/). 권한허가 (Right licensing) 는자원을위한라이선스정보의개발과교환에중점을두는도서관환경내에서새로떠오르는권한관리분야이다. OMIX-PL( 출판라이선스를위한 ONIX) 과 PLUS 라이선스데이터포맷(PLUS License Data Format) 은도서관의구독과그림이미지라이선스용어를각각교환하기위한메타데이터스키마이다. 권한워크플로 (Right workflow) - 권한표현언어 3) 는권한보유자와이용자사이의권한거래를지원한다. 이용자인증, 권한동의시행, 자원에대한접근제한, 자원이용추적, 또는이모두든지간에, 권한관리의디지털워크플로를관리하기위해권한표현언어는표준과프로토콜내에서실행되도록설계된다. 권한워크플로는일반적으로라이선스를포함하지만, 당사자간의동의를관리하기위한최종실행플랫폼을제공하기위해간단한라이선스메시지를넘어선다. MPEG-21 권한표현언어내의핵심기술인 R XrML, ORDL(Open Rights Description Language), XACML(eXtensible Access Control Markup Language) 은워크플로를위한권한표현언어의사례이다. 3) 권한표현언어저작권거래나협약을기술하는정보를전달하기위한 (rights expression languages) : 수단은일반적으로저작권용메타데이터스키마라고하지않고저작권권리언어라고한다. 국립중앙도서관도서관연구소 (KRILI) 20
권한메타데이터는오직법적으로시행할수있는메타데이터유형과구별된다. 세계지적재산권기구저작권조약(WCT) 과 세계지적재산권기구실연및음반조약(WPPT) 은국제저작권조약으로, 미국및유럽연합을포함한대부분의가맹국이비준하여국내법의지위를가진다. WCT와 WPPT는또한어느쪽에서든고의로권한관리정보를제거하거나변경하는것에대해조약국이법적인구제를제공하도록요구하는데, 이러한권한관리정보는 저작, 저작의저자, 저작에대한권리의소유자를식별하는정보, 저작의이용과조건에관한정보, 그러한정보를표현하는번호와코드등으로정의되며, 이러한정보개체가저작물의복제본에첨부되거나, 대중에게저작을유통할때나타난다. ( 세계지적재산권기구저작권조약, art.12) http://www.wipo.int/treaties/en/ip/wct/trtdocs_wo033.html-p66_786\5) 파일헤더, 특히 XMP(extensible metadata platform) 를활용하는이미지와문서를위한파일헤더와자원기술구조(RDF) 를활용하는파일헤더에서이러한메타데이터를볼가능성이높다. 이는파일헤더내의메타데이터를통합하고처리하기위한데이터저장모델을제공하기위해서이다. 어도비(Adobe) 사는 2001년에 XMP 를도입했고, 디지털객체생성과관리에이를수용하는곳이꾸준하게증가하고있다. XMP는문서와이미지를위해서널리사용되지만대부분의디지털파일포맷으로확장될수있다. 디지털객체내에메타데이터를통합하는다른방법은 MPEG-4 멀티미디어파일포맷으로메타데이터트랙을포함하고, 디지털멀티미디어를위한 MP-3 포맷과 ogg 컨테이너포맷(ogg container format) 내에서메타데이터지원을포함하는것이다. 기관들은출판사나배포자가허가하여상업적으로배포된수많은디지털객체에서법으로삭제나변경이금지되는권한메타데이터를볼수있을것이다. 디지털객체에통합된메타데이터는객체의생산과출처에관한유용한정보를포함할 것이다. 뿐만아니라이용허가와제한에관한정보도포함하는데, 이 국립중앙도서관도서관연구소 (KRILI) 21
는데이터수집방식이변경되지않는한, 자동데이터수집을통해메타데이터데이터베이스에저장되고, 메타데이터의이행을삭제하거나막는것에도움이될것이다. 메타데이터원칙 5 메타데이터원칙5 : 우수한메타데이터는컬렉션내객체의장기적인제공과보존을지원한다. 관리메타데이터는자원의관리를용의하게하려고의도한정보이다. 이것은객체의생산시기및방법, 접근제한혹은콘텐츠보존에대한책임자, 객체와관련된처리활동의이력, 접근및이용에대한제한적용에대한정보를포함한다. 기술( 技術 ) 메타데이터와보존메타데이터는관리메타데이터의특수한유형이다. 기술( 技術 ) 메타데이터는디지털파일을설명하며저장정보, 포맷, 파일크기, 체크섬(checksum), 샘플링주파수, 유사한특성을포함한다. 기술( 技術 ) 메타데이터는객체의지속적인이용을보장하고또는객체가손상되었을때복구하기위해필요할수있다. 보존메타데이터는디지털객체의장기간유지를지원한다. 보존메타데이터는객체의상황및관계, 관리및변화이력, 처리과정, 저장상태등에관련된정보뿐만아니라상세한기술( 技術 ) 메타데이터를포함할수있다. 그러므로보존메타데이터는기록보존기관의컬렉션관리워크플로와호환되어야만한다. 일부경우에는이를위해기관의워크플로와디지털객체기술( 記述 ) 을변환하기위한협의가필요할수있다. 레코드보존메타데이터는관리적, 프로그램적, 법적, 재정적요구와책 임을충족시키기위하여레코드의시스템적생성, 이용, 유지, 배열을 국립중앙도서관도서관연구소 (KRILI) 22
기록하고용이하게하며, 이는아키비스트와기록관리자의주요관심사이다. 구조메타데이터는복합객체의부분들을연결하고혹은객체로연결된묶음을패키지로연결한다. 예를들면단행본이개별페이지이미지로디지털화된다면, 구조메타데이터는파일순서( 페이지순서) 에관한정보를기록할수있고, 파일순서가단행본의구조( 목차) 와어떻게연결되었는가에대해서도역시요구한다. 보존메타데이터는다음과같다. 미의회도서관,PREMIS보존메타데이터유지활동 (Library of Congress, PREMIS Preservation Metadata Maintenance Activity) http://www.loc.gov/standards/premis/ PREMIS 데이터사전은보존을위한메타데이터요소의핵심세트 로, 여기서 핵심 은 대부분의보존리포지토리가항상알아야하 는것 으로정의된다. PREMIS는영어권세계에서기본보존메타 데이터를위한사실상의표준이되었고, 적극적인보존활동과이 행그룹을가진다. 독일국립도서관, 전자자원을위한 LMER 장기보존메타데이터 (Deutsche Nationalbibliothek, LMER Long-term Preservation Metadata for Electronic Resources) http://www.ddb.de/eng/standards/lmer/lmer.htm PREMIS에우선하여독일에서사용되는스키마 호주국립도서관, 디지털정보로의접근보존 (National Library of Australia, Preserving Access to Digital Information(PADI)) http://www.nla.gov.au/padi/ 메타데이터보존과관련된자원리스트를광범위한주석과함께제공한다. 국립중앙도서관도서관연구소 (KRILI) 23
기술( 技術 ) 메타데이터는다음과같다. ANSI/NISO Z39.87-2006, 데이터사전-디지털정지이미지를위한기술메타데이터 (ANSI/NISO Z39.87-2006, Data Dictionary-Technical Metadata for Digital Still Images) http://www.niso.org/standards/standard_detail.cfm?std_id=731 극소수인기술( 技術 ) 메타데이터공식표준중의하나. 이것은스캐 닝으로생성된이미지에중점을둔다. 이데이터세트의 XML 표현 은 MIX 스키마이다(http://www.loc.gov/standards/mix/). 두개의관리메타데이터를위한 AES 표준( 대략말하면, NISO 이미 지데이터사전과 MIX 의동등함) 이개발중에있다. AES-X098B( 오디 오객체스키마) AES-X098C( 처리이력스키마) 이다. JHOVE-JSTOR/ 하버드객체검증환경 (JHOVE-JSTOR/Harvard Object Validation Environment) http://hul.harvard.edu/jhove/ JHOVE 는오픈오디오, 비디오, 이미지, 텍스트포맷에중점을두는 기술( 技術 ) 메타데이터를자동추출을위한개방소스도구이다. 뉴질랜드국립도서관, 메타데이터추출도구 (National Library of New Zealand, Metadata Extraction Tool, 2007) http://meta-extractor.sourceforge.net/ 이는일반적인사무용애플리케이션이생성하는핸들링포맷을포 함하는기술( 技術 ) 메타데이터의자동추출을위한오픈소스도구이다. 레코드보존메타데이터는다음과같다. 호주, 연방정부를위한레코드보존메타데이터표준 (Commonwealth of Australia, Recordkeeping Metadata Standard for Commonwealth Agencies, 1999) http://www.naa.gov.au/images/rkms_pt1_2_tcm2-1036.pdf 미네소타역사학회, 미네소타레코드보존메타데이터표준 국립중앙도서관도서관연구소 (KRILI) 24
(Minnesota Historical Society, Minnesota Recordkeeping Metadata Standard, 2003) 주( 州 ) 표준의사례 구조메타데이터는다음과같다. 미의회도서관, 메타데이터인코딩과전송표준 (Library of Congress, Metadata Encoding and Transmission Standard(METS)) http://www.loc.gov/standards/mets/ METS는문화유산분야에서가장광범위하게이용되는패키징표준이다. METS는객체를위한구조적메타데이터를어떻게표현하는지명시하며또한기술( 記述 ) 적및관리메타데이터를결합하기위한프레임워크를제공한다. ISO/IEC 21000-2:2005 멀티미디어프레임워크(MPEG-21)-2부디지털개체선언 (ISO/IEC 21000-2:2005 Multimedia framework (MPEG-21)-Part 2: Digital Item Declaration) http://standards.iso.org/ittf/publiclyavailablestandards/c041112_iso_iec_2 1000-2_2005(E).zip 디지털개체선언언어 (Digital Item Declaration Language, 문화유산객체를패키지화하는데사용된다. DIDL) 는또한 세계교육컨소시엄,IMS 콘텐츠패키지정보모델,1.1.2버전 (IMS Global Learning Consortium, Inc., IMS Content Packaging Information Model, version 1.1.2, 2001) http://www.imsglobal.org/content/packaging/cpv1p1p2/imscp_infov1p1p2.html 교육계에서주로이용된다. 국립중앙도서관도서관연구소 (KRILI) 25
메타데이터원칙 6 메타데이터원칙6 : 우수한메타데이터레코드는그자체가객체이 므로우수한객체의질적특성인권위성, 진본성, 보존성, 영속성, 유일식별성등을포함해야만한다. 메타데이터는객체의출처, 무결성, 권위성을보장하는정보를전하기때문에메타데이터자체의권위성이확립되어야만한다. 메타-메타데이터 혹은메타데이터에관해저장된정보는메타데이터를생성한기관을식별하고, 생성시완전하고질적수준이높은어느표준을사용했는지도포함해야한다. 기관은이용자가메타데이터의정확성을평가할수있도록메타데이터가어떻게 ( 자동으로혹은수동으로) 생성되었고어떤표준과어휘가사용되었는지를포함하는충분한정보를제공해야한다. 일부메타데이터스킴은그내에서메타데이터레코드자체를기술하는메타데이터요소세트를포함한다. 여기에는 ( 메타- 메타데이터 라고불리는부분에있는)IEEE LOM, ( ead 헤더 에있는)EAD, ( recordinfo 에있는)MODS 가포함된다. 인증되지않고정확하지않은메타데이터문제는사실이며심각하다. 많은웹검색엔진은확산되는스프핑 4) 과스패밍 5) 문제때문에 HTML페이지에내장된메타데이터사용을일부러회피한다. 디지털문서의무결성과진본성을입증하기위해이용되는동일한기술( 예, 디지털서명) 은메타데이터에도적용될수있다. 데이터엔트리와데이터값에대한자동제어는질적수준이높은메타데이터를보장하도록돕는다. 오늘날많은메타데이터스킴은 XML 스키마 6) 로표준표현을가진다. XML스키마언어는반복가능성과의무 4) spoofing : 한조직이다른조직에속한자원을위해오도된메타데이터를공급하는것 5) spamming : 웹페이지순위를인위적으로올리기위해키워드를반복함 6) http://www.w3.org/xml/schema 국립중앙도서관도서관연구소 (KRILI) 26
와같은특성을정의할수있으며, 메타데이터레코드가스키마에대하여검증될때이러한특성들은이행할수있다.XML문서유형정의 (XML Document Type Definitions, DTDs) 7) 는또한메타데이터정보의표준화를제공하기위해사용될수있지만 XML 스키마보다덜효과적이다. 왜냐하면데이터에대하여그만큼많은편집제어를지원하지않기때문이다. 다음호웹진에서계속이어집니다. [ 출처] A Framework of Guidance for Building Good Digital Collections http://www.niso.org/publications/rp/framework3.pdf 7) http://www.w3schools.com/dtd/default.asp 국립중앙도서관도서관연구소 (KRILI) 27
< 메타데이터> 국립중앙도서관도서관연구소 (KRILI) 28
국립중앙도서관도서관연구소 (KRILI) 29
국립중앙도서관도서관연구소 (KRILI) 30
국립중앙도서관도서관연구소 (KRILI) 31
국립중앙도서관도서관연구소 (KRILI) 32