링크드데이터를활용한 학술정보개방과공유 2014. 6. 13. 이나니, nnlee@ewha.ac.kr 이화여자대학교도서관
도서관 : 정보 / 지식자원과이용자를 연결 하는역할 이용자와컬렉션사이의연결을더낫게하기위해, 자신이원하는곳에서, 자신이편하게사용하는툴을이용하여탐색할수있도록노력해옴. 그러나
Tim Berners-LEE : The Next W eb (2009) 누구나데이터를웹에올리고연결해봅시다. 우리가상상할수있는거의모든것이웹에존재하고, 데이터가모두연결될것입니다. 출처 : http://www.ted.com/talks/tim_berners_lee_on_the_next_web
링크드데이터의의의 기계가이해하고처리할수있는웹 저장소별로단절된데이터장벽을없애고, 일반적인웹기술을사용하여, 다른어플리케이션이데이터에접근 & 해석할수있는형태로, 웹에대중이관심을가진데이터를발행함으로써 데이터단위의접근과연결이가능하도록함 Linked Open Data!!
링크드데이터의원칙 특정개념, 정보를고유하게식별하거나명명하기위해 URI 를사용 HTTP를사용해서 URI로명명된자원에접근할수있도록함 URI로정보를찾는경우, RDF/XML, SPARQL과같은표준을이용하여유용한정보를제공 다른 URI에링크를기술하여더많은개념, 정보를발견할수있어야함 링크 는현재문서기반웹의하이퍼텍스트가아니라, RDF(Resource Description Framework) 로기술된개념, 정보사이의연결을의미
링크드데이터처리 : 트리플 별을보여드립니다 의저자는이청준이다. 별을보여드립니다 는 2007 년에출판되었다. 별을보여드립니다 의주제는 813.6 이다. 사람이읽을수있는형태 was written by 별을보여드립니다 이청준 was published in has subject of 2007 813.6 트리플형태의그래프로구성해보면
링크드데이터처리 : URI, 기계가독형 별을보여드립니다 http://data.riss.kr/resource /Book/000011050627 dc:creator 이청준 http://data.riss.kr/resource/a gent/000000012998 dcterms:date dc:subject 2007 813.6 http://data.riss.kr/resour ce/concept/kdc_1134134 기계가독형 JSON 포맷 ["http://data.riss.kr/resource/book/000011050627", {"http://purl.org/dc/elements/1.1/title":" 별을보여드립니다 "}, {"http://data.riss.kr/ontology/author":" 이청준 "},{"http://purl.org/dc/terms/date":"2007"}, {"http://purl.org/dc/elements/1.1/creator":"http://data.riss.kr/resource/agent/000000012998"}, * RISS Linked Data(http://data.riss.kr/main.do) 재구성
레코드단위 vs. 엔티티단위 ( 문헌 vs. 데이터 ) 출처 : Fons, Ted & Richard Wallis. Collective Impact and the Power of Shared Data
The Linking Open Data(LOD) cloud diagram ( 출처 : http://linkeddata.org )
The Linking Open Data(LOD) cloud diagram ( 출처 : http://linkeddata.org )
도서관링크드데이터인큐베이터그룹 2010 년 5 월부터 2011 년 8 월까지활동 링크드데이터기술을이용하여시맨틱웹환경에서도서관데이터의 상호운용성을증진시키기위한목적 링크드데이터의장점, 진행중인도서관링크드데이터이니셔티브, 법률적문제, 고려사항 + 도서관및관련기관의활용사례연구 활용사례 도서관및관련기관의링크드데이터활용사례및프로젝트를선정 { 서지데이터, 전거데이터, 어휘매핑, 아카이브와이기종데이터, 인용정보, 디지털객체, 컬렉션, 소셜사용 } 등 8 개군집의사례소개 http://www.w3.org/2005/incubator/lld/
서지데이터전거데이터어휘매핑아카이브와이기종데이터 Bibliographic Network AGRIS Community Information Service Data BNF Identification And Deduplication Of Library Records Linked Data and legacy library applications Migrating Library Legacy Data Open Library Data Regional Catalog Pode Polymath Virtual Library Talis Prism 3 AuthorClaim Authority Data Enrichment FAO Authority Description Concept Scheme International Registry for Authors Linked Data Service of the German National Library Virtual International Authority File (VIAF) AGROVOC Thesaurus Browsing And Searching In Repositories With Different Thesauri Civil War Data 150 Component Vocabularies Language Technology Subject Search Vocabulary Merging Bridging OWL and UML Archipel Digital Preservation Europeana LOCAH Photo Museum Radio Station Archive Digitisation Recollection
인용정보 Citation of Scientific Datasets Enhanced Publications Mapping Scholarly Debate 디지털객체 Collecting material related to courses at The Open University Digital Text Repository Enhanced Publications (shared with the Citations cluster) Editing reports on new academic documents NDNP (National Digital Newspaper Program) NLL Digitized Map Archive Publishing 20th Century Press Archives 컬렉션 AuthorClaim (shared with the Authority data cluster) Collection-Level Description Community Information Service (shared with the Bibliographic data cluster) Digital resources with access restrictions Library Address Data Nearest physical collection 소셜미디어, 뉴스사용 Community Information Service (shared with the Bibliographic data cluster) Crosslinking Environment Data and the Library Crowdsourced Catalog Mendeley Research Networks for linking researchers and publications Open Library Data (shared with the Bibliographic data cluster) Ranking Search Results by Popularity using Circulation Data SEO Support This Book Button Social Annotation Peer to Peer Bookswapping
도서관링크드데이터 @datahub http://datahub.io
링크드데이터구축 - 도서관의역할 (1) 세분화된분야에서 지식을조직하는 시소러스와분류 개인명, 단체명등의모호함을줄이기위해체계적으로정비한전거파일 출판물정보를제공하고, 사람, 조직, 주제등의정보를함께연결해주는서지데이터 웹에서의 데이터연결과 활용에주요한역할
링크드데이터구축 - 도서관의역할 (2) 도메인별링크드데이터현황 (2011. 9 현재 ) 도메인 데이터셋수 트리플수 비율 (%) 외부링크수 비율 (%) Media 25 1,841,852,061 5.82 % 50,440,705 10.01 % Geographic 31 6,145,532,484 19.43 % 35,812,328 7.11 % Government 49 13,315,009,400 42.09 % 19,343,519 3.84 % Publications 87 2,950,720,693 9.33 % 139,925,218 27.76 % Cross-domain 41 4,184,635,715 13.23 % 63,183,065 12.54 % Life sciences 41 3,036,336,004 9.60 % 191,844,090 38.06 % User-generate d content 20 134,127,413 0.42 % 3,449,143 0.68 % 295 31,634,213,770 503,998,829 출처 : http://lod-cloud.net/state/
링크드데이터구축 - 도서관의역할 (3) 구분 인명 ( 건 ) 기관명 ( 건 ) DBpedia 364,000 148,000 미의회도서관전거 3,800,000 900,000 독일국립도서관전거 1,797,911 1,262,404 VIAF 10,000,000 3,250,000 출처 : Neubert, Joachin & Klaus Tochtermann. 2012. Linking Library Data: Offering a Backbone for the Semantic Web. Communications in Computer and Information Science, 295: 37-45. 2014 년 6 월현재, 197,000,000 건의서지기술공개 (OCLC)
OCLC WorldCat 3 억건이상의데이터자원보유 Schema.org 마크업 Embedded RDFa 지원 Dewey, LCSH, LCNAF, DOI, VIAF, FAST 등으로의링크 ODC-BY 라이선스하에데이터공개 Schema.org 이니셔티브 (Google, Bing, Yahoo, Yandex 등 ) 는검색엔진및웹크롤러가직접적으로도서관데이터를사용할수있도록하는핵심온톨로지를제공 Open Data Commons Attribute License (ODC-BY) : 이용자가 OCLC Community Norm에따라 WorldCat에서추출한데이터를공유가능
http://www.worldcat.org/oclc/372138
http://www.worldcat.org/wcidentities/lccn-n79026812
Virtual International Authority File (1) 전거데이터의공유확대를통해목록비용을절감하고국제적인전거통제를목적으로하는프로젝트 OCLC 주관으로미국의회도서관 (LC), 독일국립도서관 (DNB), 프랑스국립도서관 (BnF) 등 40여기관참여 1,300만건이상의인명전거확보 개인명, 지명, 기관명, 서명, 가족, 이벤트등각항목마다 URI 부여, 링크드데이터로이용가능 단일인명 / 단체명에국가, 지역단위의전거레코드연결, 단일한클러스터레코드생성 선호언어, 스크립트, 철자로된변형에대한요구지원
Virtual International Authority File (2) VIAF 클러스터사례출처 : http://inkdroid.org/journal/2012/05/15/diving-into-viaf/
Virtual International Authority File (3)
독일국립도서관 (DNB) 의인명전거데이터 (1) 저자생몰년, 활동분야, 대표저작, 직업, 직위, 국가, 다른개인이나소속기관과의관계등이표시된고품질의데이터 링크드데이터서비스로발행 & VIAF 에전송 기존의링크드데이터허브와연결하는 크라우드소스 enrichment 작업진행 DNB와독일위키피디아에서위키피디아에 PND id를연결 55,000 DBpedia PND 링크형성 Leipzig 대학의 Linked History 프로젝트에서링크활용 영어위키피디아로작업확대
프랑스국립도서관 (BnF) (1) 모든자원에 URI 부여, 링크드데이터로발행 1,200 만건이상의소장자료목록을구조화, 상호링크 200 만건의저자, 기관, 저작, 주제전거와서지연결 전자도서관 Gallica 에 100 만건의전자자료구축 데이터모델링시 FRBR 개념반영 외부사이트와정보원데이터와링크 언어, 지역코드 : LC 데이터셋 (id.loc.gov) 주제명표목 : dewey.info 문헌유형 : DCMI 타입 저자정보 : VIAF, IdRef, DBpedia, Wikipedia 로확장, 링크 RAMEAU 주제명표목 : LCSH, DNB 의주제명표목, 프랑스아카이브의주제명표목, Agrovoc 시소러스, 지리데이터베이스 Geonames 등과링크
프랑스국립도서관 (BnF) (2) BnF 의 RDF 데이터모델 ( 출처 : http://data.bnf.fr/semanticweb)
프랑스국립도서관 (BnF) (3)
프랑스국립도서관 (BnF) (4)
미국의회도서관의주제명표목표 LCSH 를 RDF 로표현하여링크드데이터로발행 MARC21 포맷으로되어있는전거데이터를 SKOS 어휘를이용하여 RDF 로변환 전거레코드각항목을 skos:concept 의인스턴스로표현하고 LCCN 을이용하여 URI 를부여 필요에따라 SKOS 를확장하여사용 연계가능한외부데이터셋과의연계를통해링크드데이터 허브의역할도수행 지리명표목은 GeoNames, CIA World FactBook 과연계 일반적인정보는 DBpedia 와연계 FAO 시소러스, BnF 의 REMEAU 주제명표목과도상호연계제공
미국의회도서관의주제명표목표 (2) http://id.loc.gov/authorities/subjects/sh85088032 http://id.loc.gov/authorities/subjects/sh85020312 http://id.loc.gov/authorities/subjects/sh85088084
오레곤주립대학의학위논문정보 (1) 출처 : Johnson, Thomas and Michael Boock. 2012. Linked Data Services for Theses and Dissertations. Proceedings of the 15 th International Symposium on Electronic Theses and Dissertations, Lima, Peru, 12-14 Sep. 2012.
오레곤주립대학의학위논문정보 (2)
링크드데이터의기대효과 이용자에게는 정보탐색결과에풍부한정보표시가능 도서관자원노출증진 도서관자원으로의접근점확대 도서관과사서는 타분야구축정보활용 à 업무효율성확대 도서관구축정보의활용범위확대 à 인지도향상 Web of Data 에기여 관리자는 도서관시스템개발업체를넘어선기술활용가능성증가 도서관 외부자원연결
링크드데이터발행, 활용의고려사항 (1) 도서관경영진 링크드데이터로초기에공개할수있는데이터셋의규명 오픈데이터와권리에대한논의활성화 표준생성관련기관 시맨틱웹표준화에도서관의참여확대 링크드데이터와호환되는도서관데이터표준개발 도서관링크드데이터에맞춘우수설계사례의개발, 배포 데이터 / 시스템설계자 링크드데이터에맞는이용자서비스를설계하고테스트 도서관데이터셋의아이템에맞는 URI 생성 링크드데이터어휘와 URI를관리할수있는정책개발 기존의링크드데이터어휘를재사용 / 매핑하여도서관데이터표현 사서 / 아키비스트 링크드데이터엘리먼트셋, 어휘값을할당, 보존 링크드데이터데이터셋의큐레이션과장기적보존에도서관의경험을반영 출처 : W3C Library Linked Data Incubator Group Issues Final Report. http://www.w3.org/2005/incubator/lld/xgrlld-20111025/
링크드데이터발행, 활용의고려사항 (2) 활용가능성이높은데이터의선정, 정제, 공개 대상데이터의상호호환성에대한면밀한검토, 데이터모델링 데이터내 / 외부링킹을통한 data enrichment의강점활용 대상데이터의재활용가능성극대화 해외성공사례벤치마킹, 시범운영을통한모범사례발굴 도서관간, 도서관외분야 / 기관과의적극적인협력모색 기구축된데이터공개를위한도서관간협력 링크드데이터발행의필요성, 성과, 기대에대한인식공유 저작권정책의결정 디스커버리제공사등의상업기관에서사용할가능성고려 ODC-BY (OCLC) vs. CC0 (DNB)