Microsoft Word - 2011WP_9.Linked Open Data_2010_3.doc



Similar documents
Microsoft Word WP_8.Geospatial Ontology_2010_3.doc

Microsoft PowerPoint - kimswld ppt

[White Paper]다시보는 시맨틱 웹 그리고 시맨틱 기술 하는 Tabulator와 Sindice에 기반한 데이터 매쉬업 및 브라우징 서비스인 sig.ma는 꼭 한번 경험해 봐야 할 대상이 다. 또한, SemaPlorer나 DBpedia Mobile 경우는 LOD


음악부속물

음악부속물

음악부속물

게시판과 같은 구조화되지 않은 텍스트를 대상으로 주제 분류 와 예상 답변을 제시하는 방식으로 그 뼈대는 일반적인 텍스트 기반 정보 검색(IR) 기법을 기반으로 하고 있다. 이는 정보 검색에 대한 가장 일반적인 분야로서 텍스트 분석, 자연어 처리, 기계 학습과 같은 분야

회원번호 대표자 공동자 KR000****1 권 * 영 KR000****1 박 * 순 KR000****1 박 * 애 이 * 홍 KR000****2 김 * 근 하 * 희 KR000****2 박 * 순 KR000****3 최 * 정 KR000****4 박 * 희 조 * 제

³»Áö_1È£_0107L

intro

Æí¶÷4-¼Ö·ç¼Çc03ÖÁ¾š

4 꼬부랑 이라는 말이 재미있습니다. 5같은 말이 반복이 되어서 지루합니다. 4 꼬부랑 은 굽은 모양을 재미있게 흉내 낸 말입니다. 꼬부랑 을 빼고 읽는 것보다 넣어서 읽 으면 할머니와 엿가락, 강아지의 느낌이 좀 더 실감 나서 재미가 있습니다. 국어2(예습) / 1.

<464B4949B8AEC6F7C6AE2DC0AFBAF1C4F5C5CDBDBABBEABEF7C8AD28C3D6C1BE5FBCD5BFACB1B8BFF8BCF6C1A4292E687770>

<C3E6B3B2B1B3C0B C8A32DC5BEC0E7BFEB28C0DBB0D4292D332E706466>

Semantic Search and Data Interoperability for GeoWeb

Baekdoo91_05_16.p65


SIGIL 완벽입문

이도경, 최덕재 Dokyeong Lee, Deokjai Choi 1. 서론

오토 2, 3월호 내지최종

데이터베이스-4부0816

2002 Game White paper 2002 Game White paper

歯박지원-구운몽.PDF

U.Tu System Application DW Service AGENDA 1. 개요 4. 솔루션 모음 1.1. 제안의 배경 및 목적 4.1. 고객정의 DW구축에 필요한 메타정보 생성 1.2. 제품 개요 4.2. 사전 변경 관리 1.3. 제품 특장점 4.3. 부품화형

하는 요구이다. 또한 사람이 인지하고 처리하는 수준에 서 확장하여 사물 간의 통신이 이루어져 일처리를 해 주는 스마트한 세상을 만들고자 한다. 실제 M2M, IoT 등이 추구하는 바가 궁극적으로 이러한 세상을 만드는 것일 것이다. 그렇다면 사물 웹(WoT)의 의미를 어

슬라이드 1

슬라이드 1

아이콘의 정의 본 사용자 설명서에서는 다음 아이콘을 사용합니다. 참고 참고는 발생할 수 있는 상황에 대처하는 방법을 알려 주거나 다른 기능과 함께 작동하는 방법에 대한 요령을 제공합니다. 상표 Brother 로고는 Brother Industries, Ltd.의 등록 상

KT Community Relations White Book


hwp


노무관리업무 담당자 워크숍 속표지

(Microsoft Word - Q1\271\351\274\255_\303\326\301\276)

歯2002년3월수출입동향.PDF

<313220BDC9C1D82DB0CBBBF620C5B0BFF6B5E520C8AEC0E5C0BB20C0CCBFEBC7D120BFC2C5E7B7CEC1F620C0DAB5BF20BBFDBCBA20BDC3BDBAC5DB20B0B3B9DF2E687770>

Hitachi Content Platform 클라우드 & 소프트웨어정의클라우드오브젝트플랫폼 Hitachi Content Platform Hitachi Data Ingestor Hitachi Content Platform Anywhere REVISION NO

121220_워키디_상세설명서.indd

Cover Story Oracle Big Data Vision 01_Big Data의 배경 02_Big Data의 정의 03_Big Data의 활용 방안 04_Big Data의 가치

TTA Journal No.157_서체변경.indd

Microsoft PowerPoint - chap01-C언어개요.pptx

Office 365, FastTrack 4 FastTrack. Tony Striefel FastTrack FastTrack

consulting

멀티미디어 콘텐츠 접속을 위한 사용자인증 시스템_교열(박세환, ).hwp

[Brochure] KOR_TunA

8.µðÁöÅÐÄÜÅÙÃ÷ »ê¾÷º° º¸°í¼�.hwp

*캐릭부속물

Agenda 오픈소스 트렌드 전망 Red Hat Enterprise Virtualization Red Hat Enterprise Linux OpenStack Platform Open Hybrid Cloud

i4uNETWORKS_CompanyBrief_ key

¾Æµ¿ÇÐ´ë º»¹®.hwp

¼Òâ¹Ý¹®Áý¿ø°í.hwp

ºñ»óÀå±â¾÷ ¿ì¸®»çÁÖÁ¦µµ °³¼±¹æ¾È.hwp

½Å¹®319È£


자식농사웹완

chungo_story_2013.pdf

*중1부

2

Çѱ¹ÀÇ ¼º°øº¥Ã³µµÅ¥

...._



전반부-pdf

표1.4출력

003-p.ps

<4D F736F F F696E74202D20312E20B0E6C1A6C0FCB8C15F3136B3E2C7CFB9DDB1E25F325FC6ED28C0BA292E >

_

12월월간보고서내지편집3

중앙도서관소식지겨울내지33

에너지포커스 2007년 가을호


01_당선자공약_서울

인권문예대회_작품집4-2




목차

A°ø¸ðÀü ³»Áö1-¼öÁ¤

±¹³»°æÁ¦ º¹»ç1

¿¡³ÊÁö ÀÚ¿ø-Âü°í ³»Áö.PDF

전반부-pdf

뉴스레터6호

Microsoft PowerPoint 하반기 크레딧 전망_V3.pptx

50차 본문 최종

³»Áöc03âš

fsb9¿ù³»ÁöÃÖÁ¾Ãâ

¾ç¼º-¾÷¹«Æí¶÷-³»¿ëÃà¼Ò4

전도대회자료집

< DBAB4B9ABC3BB5FBAB9B9ABB0FCB8AEB8C5B4BABEF32D33B1C72E706466>

표1~4

<3344C7C1B8B0C6C320BFE4BEE02D E706466>

µ¶ÀÏÅëÀÏÁý1~2Æíq36£02Ð


양성내지b72뼈訪?303逞


OUTLINE 행사개요 행사명 Inside Bitcoins Conference & Expo 2015 장소 KINTEX 제 2전시장 3층 (회의실 301~304호) 행사시기 2015년 12월 9일(수) - 11일(금)ㅣ9일은

만화부속물

만화부속물

<C0CCBCF8BFE42DB1B3C1A4BFCFB7E12DB1E8B9CCBCB12DC0DBBCBAC0DAB0CBC1F5BFCFB7E12DB8D3B8AEB8BBB3BBBACEC0DAB0CBC1F52E687770>

Transcription:

White Paper Linked Open Data Release Date: 2010 Copyright(c) 2011 Saltlux Inc. All Rights Reserved. 1

Contents 1. LOD 개요 2. LOD 데이터 특징 3. LOD의 중요성 4. 각 국가별 LOD 도입 현황 5. LOD 도입전략 6. 참고문헌 저자 : 솔트룩스 수석 컨설턴트 안태성 솔트룩스 안태성 수석컨설턴트는 전자계산기 조직응용 기술사, 정보시스템 수석감리원, 정보검색, 텍스트마이닝, 시 맨틱웹 전문가, 다수의 국가 R&D 프로젝트 수행, 현 IT 기술 컨설팅을 수행한 솔트룩스의 대표 컨설턴트이다. 담당 영업 : 솔트룩스 SD사업본부 영업2팀 이제욱 부장, brian@saltlux.com Copyright(c) 2011 Saltlux Inc. All Rights Reserved. 2

Linked Open Data 1. LOD의 개요 1.1 LOD의 정의 LOD(Linking Open Data)는 시맨틱웹이 표방하는 데이터웹(Data Web)을 구체적으로 구현 하는 구체적 방법으로, 인터넷 상의 각 사이트에서 RDF 형식의 데이터를 인터넷 상에서 REST 프로토콜을 사용하여 정형화 데이터를 제공하는 것을 말한다. 1.2 LOD의 주요기능 데이터를 웹에 공개, 공유할 수 있다. URI를 통한 데이터 접근 및 이용이 가능하며, HTTP 프로토콜 사용하여 웹 상에 표 현이 가능하다. URI를 서로 링크하여 데이터 매시업/재사용 가능하다. 1.3 LOD의 등장 배경 시맨틱웹의 큰 특징 중 하나는 인터넷 상에서 거대한 시스템 간의 공유가 가능한 지식베 Copyright(c) 2011 Saltlux Inc. All Rights Reserved. 3

이스를 구현할 수 있다는 것이다. 이러한 지식베이스를 구현하기 위한 기반적 기술로 LOD가 등장했다. 이러한 LOD는 공공기관에서의 정보 공개, 시맨틱 메시업 등과 함께 관 심을 끌고 있다. 2. LOD 데이터 특징 개방성 : 인터넷 상에 공개되여 특별한 제약없이 손쉽게 접근이 가능하다. 모듈성 : 각 LOD 사이트별로 데이터 제공 도메인이 분류되어 데이터의 모듈화 형 태의 서비스가 가능하다. 유연성 : RDF 형식으로 구현되어 의미 모호성 없이 쉽게 변환, 활용이 가능하다. 3. LOD의 중요성 3.1 데이터 재사용 가능 각 데이터 엔티티별로 URI 링크를 해주면 외부에서 지속적으로 재사용이 가능하다. 3.2 데이터 중복성 및 유지관리 비용 감소 불필요한 데이터 중복 방지하여 전체적인 관리 비용을 절감한다. 전문 분야 데이터를 관리하며, 핵심 데이터 외에는 외부의 데이터를 연계 유지관리 비용 감소시킨다. 3.3 데이터 표준화 가능 시맨틱웹 표준 RDF 형태 사용하기 때문에 현재는 물론 향후의 시맨틱 웹 응용서비 스 등에서 활용이 가능하다. Copyright(c) 2011 Saltlux Inc. All Rights Reserved. 4

고유의 URI 및 온톨로지를 활용하여, 해당 개념에 대한 시맨틱 웹 상의 표준을 정 의한다. 3.4 데이터 상호운용성 극대화 및 데이터 퉁합 인터넷의 웹을 통한 접근 가능을 통해 데이터의 시스템의 종속화가 아니라 시스템 과 데이터간의 병행적으로 활용된다. WOA (Web Oriented Architecture) 형식의 서비스가 가능하여, 시맨틱웹 상의 다양 한 데이터 활용 서비스 구현이 가능하다. 3.5 네트워크 효과에 따른 부가가치 생성 서로간의 데이터 공유를 통해 새로운 부가가치 창출이 가능하다. 시맨틱 검색 등의 효과적으로 적용이 가능하다. 4. 각 국가별 LOD 도입 현황 4.1 W3C W3C egovernment Interest Group의 SWEO의 Linking Open Data 프로젝트 시맨틱웹 기술 및 전략 개발 목표를 수립하고 Linking Open Data 프로젝트 계속 수행 중 이며, 위키피디어의 RDF버전인 DBPedia를 중심으로 시작되었다. 4.2 영국 Copyright(c) 2011 Saltlux Inc. All Rights Reserved. 5

Digital Britain Report 영국 수상의 미 오바마 정부의 data.gov 같이 정부데이터의 공개 및 접근이 가능한 체계 를 웹의 창시자인 팀버너스리에게 2009년 7월에 도움을 요청하였다. 이러한 공공 정보의 공개는 인터넷 상의 웹 접근성을 높이기 위한 과정 중 하나이며, 이를 위해 광대역 네트 워크 및 무선 인프라에 대한 투자를 진행하고 있다. 현재 모든 공공 데이터의 공개와 접 근을 위한 작업을 착수 한 상태이다. BBC Program와 Music 사이트 BBC 방송의 TV, 라디오 프로그램의 콘텐츠의 활용성을 높이기 위해 시도된 실험적 서비 스로 모든 콘텐츠 리소스 별로 URI 부여하였으며, 기존의 서비스되고 있던 일반 웹페이지 별 리소스 단위 재구성되었다. 실험 내용은 팝가수 마돈나에 대한 웹페이지를 구현하였으 며, 가수의 프로파일을 위해 MusicBrainZ 연계하여 사용했으며, 일대기(Biography) 정보를 위해 DBPedia를 연계하였다. 그 외의 기존 BBC의 콘텐트 활용하여, 특별한 콘텐트 구축 노력없이 쉽게 사이트를 구축할 수 있게 되었다. 4.3 미국 Data.gov의 LOD 변환 오바마 대통령 집권이후 정부 투명성 확보 차원에서 연방정부 데이터 접근 방식 개선하는 시도가 이뤄지고 있다. 특히 데이터의 창조적 활용 측면에서 data.gov 사이트의 데이터 일부를 RDF로 변환 및 Linked Data Cloud 연계하는 방안이 검토되고 있다. 이 연구에는 팀버너스와 짐핸들러 교수의 Tetherless World 같은 시맨틱 기술을 주도하고 있는 연구진 이 참여하고 있다. 현재 16개의 데이터셋을 RDF화하여 약 3천억 개의 트리플 정보를 구 축하였다. (http://data-gov.tw.rpi.edu/wiki/data.gov_catalog) 의회 도서관(LCSH) 미국 의회 도서관에서는 도서관 정보를 LOD 형태로 서비스 하고 있다. 특히 표준어휘를 역참조 가능한 URI 통해 접근할 수 있도록 구성하여, 주제어, 세부분류, 장르/형식 등 관 련 데이터 제공하였다. (http://id.loc.gov/authorities/{identifier}) 사용자가 자신의 메타데이 터를 링크할 수 있도록 하여 참여, 공유를 가능하도록 하였다. BestBuy.com 미국 내 최상위 전자제품 판매회사로서 GoodRelations 온톨로지 사용 온라인 매장 제품 데이터의 RDF화하여 공개하였다. 제품정보(카탈로그)를 RDF화하여 외부 웹 개발자들이 접 근, 이용 가능하도록 하였으며, 전자상거래에서 활용되는 GoodRelation Ontology를 기반 으로 45만개 개별 아이템 세부정보에 대한 2천 7백만개 RDF 트리플을 구축하였다. Copyright(c) 2011 Saltlux Inc. All Rights Reserved. 6

4.4 독일 SemaPlorer Koblenz 대학 연구팀 개발된 LOD 사용 서버로 공개된 LOD를 사용 멀티미디어 데이터 검 색 및 브라우징 하는 응용프로그램으로 2008년도 Semantic Web Conference의 Billion Challenge 우승작이다. 특징으로는 Sparql을 이용하여 여러 데이터 셋의 큰 지식베이스를 질의, 검색할 수 있도록 하며, 활용 LOD는 DBPedia(위키피디어), Geonames(지명), CIA World Factbook(통계), Eurostat(통계), WordNet(영어사전) 등이 활용되었다. DBPedia Mobile DBPedia 모바일 서비스는 실험적으로 구축된 서비스로서 모바일 기반의 Linked Data 검 색을 위치정보등을 활용하여 제공한다. 예를 들어 현재 위치 근방에서 태어난 인물은? 하 는 형태로 가수의 경우는 MusicBranz 정보 활용 확장 정보 획득하였고, 다양한 매시업 서 비스 연계 가능한 아키텍처로 구성하였다. 5. LOD 도입 전략 LOD 구축을 통해 기존 보유 데이터의 통합과 외부에서 연계를 통한 시맨틱 데이터 매시 업 서비스를 가능하도록 할 수있다. 이러한 LOD를 실제로 구축하는 단계는 아래와 같다. 5.1 LOD 구축 방법론 LOD를 구축하는 방법은 크게 기존에 보유하고 있는 데이터를 RDF로의 변환과정을 거쳐 구축하는 것과 신규로 데이터를 만들고 구축하는 방법이 있다. 두 방법 모두 구축 후에는 인터넷 상을 통해 다른 에이전트, 시스템에서 활용할 수 있도록 데이터를 공개한다. 아래 는 이러한 Linked Open Data를 구축하는 단계를 설명한다. 어휘선택 어휘선택 단계에서는 보유한 데이터 혹은 신규로 구축할 데이터에 중요한 개념을 내포한 어휘를 선정하게 된다. 이러한 어휘는 개념간의 연결정보를 형태로 구성된 그래프형식의 데이터 구조를 가지게 된다. 기존 데이터 소스 검토 기존 응용 프로그램, 문서 기존의 외부 구축된 LOD 연계 모색 기존의 구축된 DBMS 스키 마 확보 및 검토 데이터 생성 범위 결정 RDF 그래프 생성 지나친 범위 확장은 스케일 서비스/응용 프로그램의 요구사항으로 제약 문제, 활용성 문제 발생 소 (범위 넓히지 말것) 지 존재 RDF 형식으로 구성된 RDF 그래프 구성 Protege등의 모델링 도구 기존 온톨로지(DC, FOAF, SKOS, SIOC 등) 연계 활용 검토 Copyright(c) 2011 Saltlux Inc. All Rights Reserved. 7

데이터페이지 구성 LOD는 HTTP 프로토콜을 기반으로 인터넷 상으로 서비스되며, 이러한 데이터서비스를 위 한 페이지 (RDF형식)의 구현 단계는 아래와 같다. RDF 문서의 Section별 분데이터 페이지에 들어갈 RDF를 주요한 문서에 모든 데이터 존재하는가? 해 Section별로 분해하고 각각의 페이지각 엔티티별로 하나의 문서인가? 로 구성함 엔티티 중에 일부는 그룹핑 되어 있 는가? 접근 속도, 업데이트 편이성 고려되 어 있는가? 데이터페이지 별 URI 부여 각각의 데이터 페이지는 인터넷 상에서 고유의 URI를 가지며, LOD 클라우드에 일부로 참 여할 수 있게 된다. 데이터 페이지 업로드 각 데이터 페이지를 온라인 접속 가능하도기존의 구축된 DBMS 스키마 록 업로드 확보 및 검토 RDF의 HTTP 프로토콜 기 http://www.ngii.go.kr/geonames/about.rdf 문서 크기 및 접근 속도 검토 반 서비스 제공 데이터페이지의 HTML 페이지 생성 RDF 파일의 경우는 시스템 간의 접속에 의한 정보를 제공하며, 이러한 정보에 대한 사람 이 확인할 수 있는 데이터 설명 HTML 페이지를 구성한다. LOD 사이트에서 제공하는 데이터와 서비스설명 페이지를 읽고 데이터 데이터 설명용 문서 생성 타입을 설명하는 HTML 페이지 작성 및 업제공 항목을 충분히 이해할 및 업로드 로드 수 있도록 작성 각 Entity 별로 URI 부여 제공되는 각 데이터 항목 별로 고유한 URI를 부여하여 인터넷 상에서 활용할 수 있도록 한다. URI 부여 URI 부여시 사이트 내의 계층 각 데이터 항목별로 지속 링크 형식 적으로 분류하여 직관적 이해 (Permalinks) 으로 URI를 부여 가 쉽도록 처리 Copyright(c) 2011 Saltlux Inc. All Rights Reserved. 8

각 페이지별 메타정보 입력 및 설명 기록 각 데이터 페이지별로 Client에서 접속 시 데이터페이지의 포함 내역을 확인할 수 있도록 각각의 메타정보를 입력한다. about.rdf 정보 입력 페이지 내 설명 입력 dc:date 초기 설명 페이지인 about.rdf 파일에 작성 dc:publisher 일, 출판자, 라이센스, 토픽등의 정보를 입 dc:license 력 foaf:primarytopic rdfs:label 각 데이터 페이지별로 entity 설명/정보를 rdf:type 입력 처리 렌더링과 네비게이션 지원 시맨틱 사이트맵 기록 구축된 LOD의 경우는 인터넷 상에 공개되기 때문에 수집기(인터넷 클롤러)에 의하여 발 견되어 검색 엔진 등에서 Sparql endpoint 정보를 찾을 수 있도록 한다. /예시 클롤러 정보 입력 User-agent: * robots.txt 에 정보를 입력하여 웹 클롤러의 Disallow: /tmp 접근 위치를 제어 Disallow: /logs LOD 데이터 파일을 sitemap.xml에 입력하 sitemap.xml 입력 여 클롤러가 Navigation을 할 수 있도록 처 리 참고 문헌 - Dr. Tom Heath, An Introduction to Linked Data, Talis Information Ltd. - A Quick Intro into Linked Data, LinkingOpenData, W3C SWEO Community Project - 오원석, Linked Data 동향과 전망., TopQuadrant Korea - Bernhard.haslhofer, Linked Data Tutorial, @Vlaams Theater Instituut Copyright(c) 2011 Saltlux Inc. All Rights Reserved. 9

About Saltlux Inc. 솔트룩스는 기업용 검색솔루션 및 정보 마이닝, 시맨틱 웹, 유비쿼터스 컴퓨팅 등 차세대 웹 및 지식 서비스 전문기업입니다. 정보 마이닝 및 시맨틱 기술 부문에서는 국내 1위 기업으로서의 시장을 확보 하고 있으며, 미국 및 유럽의 세계적인 기업 및 연구 단체들과 공동연구 및 협력을 통해 세계적인 기 술력을 보유하고 있습니다. 주요사업영역 및 핵심기술 핵심기술 : 빅데이터 처리, 분석 마이닝 기술, 시맨틱 기술 시맨틱 검색 : 초대용량 시맨틱 검색, 고정밀 텍스트 마이닝, 소셜 검색 및 분석 데이터 지능화 : 서비스 개인화, 추천, 상황인지, Geo-Semantic, 지능형 모바일 서비스 웹 3.0 : 시맨틱 웹, LOD, 온톨로지, 추론엔진, 소셜 미디어 분석(트랜드, 평판) www.saltlux.com Copyright(c) 2011 Saltlux Inc. All Rights Reserved. 10

Saltlux Inc. www.saltlux.com 서울시 강남구 대치동 967 덕일빌딩 5~7층 Tel. 3402-0081 Fax. 3402-0082 e-mail. marketing@saltlux.com Copyright(c) 2011 Saltlux Inc. All Rights Reserved. 11