링크드데이터구축공정가이드 v1.0 2014. 4 Linked Open Data
C O N T E N T S Ⅰ. 개요 1. 추진목표및배경 8 2. 가이드의구성 10 3. 기대효과 11 Ⅱ. 링크드데이터구축공정 1. 전체공정도 14 2. 세부공정도 15 Ⅲ. 태스크별상세내용 1. 준비단계 22 2. 구축및발행단계 25 2 링크드데이터구축공정가이드 v1.0
Ⅳ. 산출물상세내용 1. 산출물내용정의 30 2. 산출물내역 31 3. 산출물별상세내역및샘플 32 [ 부록 1] 링크드데이터선정기준참고자료 66 [ 부록 2] URI 생성및관리지침 67 [ 부록 3] 링크드데이터발행후체크리스트 74 3
링크드데이터구축공정가이드 v1.0 링크드데이터란무엇인가? 현재의웹은거의모든정보들이생산, 유통, 재생산, 폐기등이이루어지는거대한정보생태계임 - 이생태계는웹페이지 (HTML) 형식으로다양한도큐먼트들이연결되어이루어져있음 - 이미웹은거대한정보플랫폼으로모든정보들이웹에존재하고정보탐색활동이이루어지고있음 현재웹에서웹페이지에표현되는정보들은이미구조화되어있는데이터베이스에서추출된정보가기계적해석을거쳐단순히사람이읽고, 이해할수있는문자, 소리, 영상, 이미지등의형태로표현됨 - 각각의데이터베이스에존재하는데이터들은다양한데이터베이스관리시스템, 기술규칙, 메타데이터를사용하는갇힌형태 (silo) 로존재 - 데이터베이스의정보는 HTML로웹상에표현되나실제활용가치가높은데이터는데이터베이스에만존재 ( 웹에존재하지않음 ) - 개방되는데이터들은특정이용자의요구가있을경우에개방되거나 XLS, CSV, PDF 등의파일단위혹은 Open API로제공되지만비표준적인메타데이터사용으로재활용성이떨어지고웹이라는플랫폼을벗어나는구조임 링크드데이터는웹이라는거대한정보플랫폼위에기존웹을구성하는핵심개념 / 기술인 HTTP, URI를그대로활용하고표준기술규칙을활용함으로써웹을누구나활용할수있는거대한데이터베이스로활용이가능하도록함 - 웹을데이터베이스로활용함으로써다양한데이터수집을위한행정적, 기술적노력감소 4 링크드데이터구축공정가이드 v1.0
- 도큐먼트간의연결이아니라도큐먼트를구성하는개념 ( 주제, 사람, 장소, 시간등 ) 간의연결을통해서동일한객체간의식별이가능하도록하고소유하지않고있는외부데이터와의연결을통해서보다풍부한정보탐색환경이가능하도록함 - 기존웹 ( 도큐먼트간의연결 ) 이단순히사람이읽고활용할수있는문자형태정보간의실제적인연결인반면링크드데이터를통한데이터간의연계는데이터를기반으로하는새로운정보, 서비스창출이가능하도록함 5
PART 1 개요 6 링크드데이터구축공정가이드 v1.0
1. 추진목표및배경 2. 가이드의구성 3. 기대효과 7
1. 추진목표및배경 sns 1) 추진목표 본가이드는링크드데이터 (Linked Data) 원칙에맞추어기존에보유하고있는데이터를웹에발행하고자하는기관이나사업자들에게표준적인링크드데이터구축및발행공정을제공함 - 때문에본가이드에서는시맨틱웹 (Semantic Web), 링크드데이터 (Linked Data) 에대한일반적인이해를돕기위한내용을포함하지는않음 - 시맨틱웹, 링크드데이터에대한이해는 알기쉬운시맨틱웹, 링크드데이터 참조 링크드데이터구축사업추진에실체적으로적용가능한가이드개발 체계적이고효율적인구축과정제공 일관성있는공정관리를통해시행착오최소화및품질제고 본가이드는링크드데이터사업을추진하고자하는기관에서이를수행하고자하는 전문업체가선정된이후작업공정을대상으로함 8 링크드데이터구축공정가이드 v1.0
2) 추진배경 한국정보화진흥원은 데이터베이스구축방법론 을통해다양한종류의디지털화대상자료를효율적으로구축할수있는체계적인방법을제공하고있음 링크드데이터사업은단순히기존데이터베이스를새로운형태의파일로변환하는작업을넘어서웹을데이터베이스로누구나활용할수있도록하기위한작업으로기존의 데이터베이스구축방법론 의범위에포함되지않음 때문에본가이드는 데이터베이스구축방법론 의형태적인장점을취하되웹에데이터를공유하고연결하여재활용하기위한링크드데이터구축방법에초점을두어, 현장에서실제링크드데이터변환과발행에직접활용할수있도록구성하였음 본가이드는 2013년국가DB사업을통해수행한한국사와생물정보 LOD(Linked Open Data) 사업을바탕으로공통된구축공정을도출하여구성함 Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 Ⅲ. 태스크별상세내용 Ⅳ. 산출물상세내용부록 9
2. 가이드의구성 sns 1) 개요 본가이드는정보자원의효율적활용을위한데이터웹구축을위해웹에공개가능한데이터를발굴하고링크드데이터로변환하는활동을지원하기위해표준화된구축공정을제공함 이를위해링크드데이터구축을위한구축절차도, 산출물, 품질확인지침을핵심내용으로구성함 가이드의링크드데이터구축과발행은단계-세그먼트-태스크의체계를가짐 - 단계는링크드데이터구축과발행을위한기본단계로, 준비단계, 구축단계, 발행단계, 등록단계로구성함 - 세그먼트는단계별로원천자료유형에따라수행되어야하는표준적인작업절차를의미함 - 태스크는각세그먼트별로수행되어야할세부작업내용, 검토사항및작성되어야하는산출물내역으로구성됨 태스크색인방법 - 태스크색인은백단위세자리숫자와원천자료유형 ( 향후세구분이필요할경우추가하며, 현재단계에서는공통요소로통일함 ) 을구분한코드로구성됨 3 단계 2 세그먼트 1 태스크 C 원천자료유형 10 링크드데이터구축공정가이드 v1.0
3. 기대효과 sns 링크드데이터사업추진을위한기준정보를제공하여다양한링크드데이터사업에적용하고향후개선을통해완성도높은가이드라인으로발전 공공정보개방, 링크드데이터에대한관심과사업화가시작되는시점에서실제사업을준비, 추진하는기관에서실제적용가능한실무가이드제공으로업무효율성제고 Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 정보화사업추진프로세스를고려한실무지침으로현장업무에직접활용가능 Ⅲ. 태스크별상세내용 Ⅳ. 산출물상세내용부록 11
PART 2 링크드데이터 구축공정 12 링크드데이터구축공정가이드 v1.0
1. 전체공정도 2. 세부공정도 13
1. 전체공정도 sns 14 링크드데이터구축공정가이드 v1.0
2. 세부공정도 1) 자료준비단계 sns Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 Ⅲ. 태스크별상세내용 Ⅳ. 산출물상세내용부록 15
16 링크드데이터구축공정가이드 v1.0
2) 구축및발행단계 Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 Ⅲ. 태스크별상세내용 Ⅳ. 산출물상세내용부록 17
18 링크드데이터구축공정가이드 v1.0
Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 Ⅲ. 태스크별상세내용 Ⅳ. 산출물상세내용부록 19
PART 3 태스크별상세내용 20 링크드데이터구축공정가이드 v1.0
1. 준비단계 2. 구축및발행단계 21
1. 준비단계 sns 세그먼트태스크번호태스크정의주요활동산출물 사용자요구사항분석 111C 요구사항분석 - RFP, 사업수행계획서의명시 된요구사항체계화 요구사항분석서 현황조사 110C 112C 기초조사 내부데이터분석 - 링크드데이터에적합한내부자원의파악 ( 데이터형태, 분류등 ) 외부데이터분석 1) - 연계가능한도메인에대한고려 ( 적합성, 협조가능, 공개여부등 ) 기초현황조사서 원천데이터목록 링크드데이터구축기준정의 - 링크드데이터구축대상데 121C 기준정의 이터선정기준마련 - 데이터발행을위한구축및공개범위정의 구축 대상선정 120C 122C 구축대상자료세부조사 대상데이터상세조사 - 선정기준표 - 구축대상데이터에대한저작권조사 - 원천데이터의형태조사 - 원천데이터내사용가능한메타데이터의특징조사 선정데이터조사 서 ( 부록 1 참조 ) 123C 구축대상자료선정 구축대상자료선정 - 구축및연계대상및건수확정 1) 외부데이터는현재변환대상데이터가다른기관과연계되어있는경우혹은본사업의추진대상이 2 개이상기관간의공동추진인경우의데이터로새로운외부데이터와의인터링킹을의미하지않음 22 링크드데이터구축공정가이드 v1.0
세그먼트태스크번호태스크정의주요활동산출물 구축대상선정 120C 계획수립 130C 124C 131C 132C 133C 구축방안정의요건정의공정설계시범데이터구축 구축대상자료에대한구축방안정의 - 링크드데이터구축및서비스방향설정 - 데이터모델링가이드확립 링크드데이터구축및서비스시고려사항및요건정의 - 원천데이터입수시고려사항및요건정의 - 구축대상의형태및포맷정의 - 의미관계모델링설계를위한제약및규칙정의 - 데이터변환및연계시고려해야할사항을정의 - 2) 자료검사및품질 ( 원천데이터에대한 ) 요건정의 - 서비스를위한저작권처리방안정의 구축대상별상세공정설계 - 자료준비및실행단계에대한계획수립 - 구축각단계에대한태스크및작업내용정의 - 단계별공정산출물정의 - 각단계별사용툴 ( 및장비 ) 선정 시범데이터구축 - 시범구축대상데이터선정 - 시범데이터자료준비 - 모델링가이드에따른테스트모델링수행 - 시범데이터결과물에따른모델링지침및산출물보완 - 실구축중발생예상문제점정의및해결방안준비 ( 원천데이터의구조적, 데이터양적문제로변환후재활용, 연계등에문제발생가능성파악 ) 구축계획서공정도시범데이터구축보고서 Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 Ⅲ. 태스크별상세내용 Ⅳ. 산출물상세내용부록 2) 원천데이터구축의세부지침은데이터베이스구축방법론 3.0 을참조 23
세그먼트태스크번호태스크정의주요활동산출물 구축대상데이터반출에따른 계획안정의 실행계획 210C 211C 구축대상데이터반출계획수립 - 구축대상데이터보유기관및담당자와반출에따른협의진행 - 구축대상데이터반출에따른시기, 방법, 조건에대한정의 - 반출에따른지침확립 구축대상 데이터반출지침서 외부데이터연계를위한계획 수립 - 연계를위한외부링크드 212C 연계계획수립 데이터목록정의 - 대상데이터의건수및내용확인 - 외부데이터연계를위한모델링가이드보완 원천데이터목록작성 221C 구축대상데이터목록작성 - 반입되는원천데이터에대한목록작성 - 데이터에대한중복성검토 데이터준비 - 관리번호 ( 제어번호 ) 부여구축대상 220C 데이터목록 222C 구축대상데이터이관점검 구축대상데이터이관점검 - 구축대상데이터보수, 구축대상데이터의목록변경및대체 반입데이터확인 - 구축대상목표데이터목록표에 원천데이터 반입 230C 231C 데이터반입 근거한반입자료량확인 - 미반입, 추가반입될데이터에대한확인 인수인계증 추가반입작업 232C 추가반입 - 반입시누락되거나잘못된자료에대한추가반입 24 링크드데이터구축공정가이드 v1.0
2. 구축및발행단계 sns 세그먼트태스크번호태스크정의주요활동산출물목적및 링크드데이터로구축하고자 311C 범위설정하는목적과범위설정 해당도메인의특징등을 312C 도메인기술상세기술명세화구축명세서 310C 313C 시나리오구성 관리자, 이용자시나리오구성 Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 용어설계 410C 314C 적합질의 (competency questions) 구성 추론등링크드데이터로변환하는시스템이응답해야하는적합질의를구성 3) 데이터모델, 온톨로지현황조사 기구축된표준데이터모델, 온 411C 기존체계분석 톨로지확인및재활용확인 - 기존에존재하는온톨로지, 어휘집분석 온톨로지, 구축대상데이터가사용하고 어휘분석서 있는어휘분석 412C 어휘분석 - 기관에서정의한어휘 사용여부조사 - 표준어휘집사용여부조사 413C 용어선정 변환대상용어선정 국내외표준용어집선정 414C 표준용어집 - 원천데이터를가장잘표현할구축수있는용어집선정 - 기관에서정의한어휘선정 표준용어집 원천데이터용어를표준용어로 415C 용어매핑 매핑 - 매핑규칙구축 Ⅲ. 태스크별상세내용 Ⅳ. 산출물상세내용부록 3) 단순변환데이터제공의경우적합질의생략 (RDFa, MicroData 등 ) 25
세그먼트태스크번호태스크정의주요활동산출물 511C 모델정의 도메인개념모델정의개념모델명세서 온톨로지 설계 510C 512C 계층화 클래스계층화상향식 / 하향식 / 조합식 513C 관계정의 속성, 관계정의 클래스제약 (class restrictions) 514C 제약설계설계 (restriction) 속성제약 (property restrictions) 설계 온톨로지모델 명세서 611C 매핑규칙점검 원천데이터와변환대상데이터 요소간의매핑규칙점검 612C 변환규칙점검 변환기를통해변환될 변환규칙점검 데이터변환 (RDF 화 ) 610C 613C 데이터변환 데이터변환수행 614C 인스턴스생성 인스턴스생성 615C 일관성확인 온톨로지일관성확인 616C 유효성검증 온톨로지데이터검증서 26 링크드데이터구축공정가이드 v1.0
세그먼트태스크번호태스크정의주요활동산출물 저장및발행 710C 711C 데이터저장방식결정데이터 - 관계형DB, RDF 저장소, 저장방식결정 file시스템 712C 데이터저장 데이터저장 데이터발행방식결정 713C - RDB2RDF 데이터 - RDFa활용 CMS 발행방식결정 - 링크드데이터인터페이스 - 웹서버 (Web Server) 714C 데이터발행 데이터발행발행명세서 Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 등록 720C 721C 추후국내데이터등록플랫폼 구축후추가예정 Ⅲ. 태스크별상세내용 Ⅳ. 산출물상세내용부록 27
PART 4 산출물상세내용 28 링크드데이터구축공정가이드 v1.0
1. 산출물내용정의 2. 산출물내역 3. 산출물별상세내역및샘플 29
1. 산출물내용정의 sns 산출물에대한기본정의및특징정의 산출물의항목별상세내용정의 - 항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리 sns 30 링크드데이터구축공정가이드 v1.0
2. 산출물내역 sns 번호 산출물명 정의 011 요구사항분석서 서비스 ( 또는데이터 ) 구축을위한사용자요구사항에대한분석제안요청서, 사업수행계획서의요구사항의체계화 012 기초현황조사서 요구사항분석후실제구축대상데이터에대한현황조사분석서 Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 013 원천데이터목록사업범위에포함되는구축대상데이터리스트 014 선정데이터조사서 구축대상데이터의선정기준, 제공기관, 건수, 유형및입수가능여부등의현황조사결과 015 구축계획서 구축대상데이터및구축방안등에대한계획수립 016 공정도 DB구축방법론을활용하여수집, 구축, 자료검사단계까지전과정을포함하는공정, 산출물및담당을기술 017 시범데이터구축보고서 모델링가이드에따른온톨로지시범데이터구축 018 구축대상데이터반출지침서 구축대상데이터반출에따른계획및작업순서를정의 019 구축대상데이터목록 원천데이터중실제본사업에서구축할수있는실제데이터목록 110 인수인계증 자료의반입과반출을관리하는양식 021 구축명세서 사업대상데이터를기반으로하는링크드데이터구축목적, 범위, 도메인의특징, 관리자 / 이용자시나리오, 적합질의구성등구체적인목적과방법에대한명세서 022 온톨로지, 어휘분석서 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석 023 표준용어집 국내외표준용어집조사결과와원천데이터어휘집을중심으로최종결정된표준용어집 024 개념모델명세서 온톨로지개념모델에대한정의 025 온톨로지모델명세서 본사업에필요한온톨로지모델구축에대한명세서 Ⅲ. 태스크별상세내용 Ⅳ. 산출물상세내용부록 026 데이터검증서구축된데이터의품질및적합질의검증 027 발행명세서웹으로발행된데이터의명세서 31
3. 산출물별상세내역및샘플 sns 1) 준비단계 1-1) 요구사항분석서 정의 사업수행을위한사용자요구사항분석 필요시기 사업을준비하는시점 특징 필수 / 선택 작성자 필수 주관기관, 프로젝트관리자공동 작성량 1 부 관리항목 항목별상세내용 1. 관리번호 : 주관기관에서사용하고있는관리번호를이용 2. 사업명 : 사업명칭 3. 작성자 : 보고서작성자명 4. 작성일 : 보고서작성일기술항목 1. 요구사항체계화 - 요구사항식별번호, - 출처구분 ( 제안요청서, 사업수행계획서등 ) - 수행방법 - 담당자 - 관련산출물등기술 32 링크드데이터구축공정가이드 v1.0
활용예 관리번호 작성자명 요구사항분석서 사업명 작성일 No 요구사항출처수행방법담당자관련산출물 1 XX 소장예술가정보데이터의 RDF 변환 제안요청서개발홍길동온톨로지명세서 Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 Ⅲ. 태스크별상세내용 Ⅳ. 산출물상세내용부록 33
1-2) 기초현황조사서 정의 요구사항분석후실제구축대상데이터에대한현황조사분석서 필요시기 사업을준비하는시점 특징 필수 / 선택 작성자 필수 주관기관, 프로젝트관리자공동 작성량 1 부 관리항목 1. 관리번호 : 주관기관에서사용하고있는관리번호를이용 2. 사업명 : 사업명칭 3. 작성자 : 보고서작성자명 4. 작성일 : 보고서작성일 항목별상세내용 기술항목 1. 데이터현황분석 - RFP 상에기술된대상데이터의실제기술환경조사 - 대상데이터관련하드웨어, 소프트웨어현황조사 - 대상데이터반입, 반출관련기술환경조사 - 타데이터베이스혹은서비스와연계현황조사 - 대상데이터의활용가능여부 ( 저작권등 ) 조사 - 대상데이터의서비스제공형태조사 ( 파일형태등 ) 2. 메타데이터현황분석 - 대상데이터활용메타데이터현황조사 ( 국제표준혹은해당기관에서필요에의해정의한요소등조사 ) 3. 분석결과 - RFP 등기제시된현황과차이점문제점등발견시기술 - 차이점, 문제점해결방안등기술 34 링크드데이터구축공정가이드 v1.0
1-3) 원천데이터목록 정의특징항목별상세내용 사업범위에포함되는구축대상데이터리스트필요시기사업을준비하는시점필수 / 선택필수작성자주관기관, 프로젝트관리자공동작성량 1부관리항목 1. 관리번호 : 주관기관에서사용하고있는관리번호를이용 2. 사업명 : 사업명칭 3. 작성자 : 보고서작성자명 4. 작성일 : 보고서작성일기술항목 1. 데이터형태 - 구조, 반구조, 비구조등원천데이터의형태를기입 2. 데이터세부사항 - 메타데이터항목을기입 ( 분류, 유형, 시대, 일자등 ) 3. 소장기관 - 데이터의보유기관을기입 4. 내 / 외부정보 - 내부데이터또는외부연계데이터에대한기입 5. 건수 - 데이터의건수기입 Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 Ⅲ. 태스크별상세내용 Ⅳ. 산출물상세내용부록 35
활용예 원천데이터목록 관리번호 작성자명 사업명 작성일 구분 데이터형태 분류유형입력일소장기관내 / 외부건수 주소구조지리텍스트 20xx.xx.xx XXX 내부 200 건 36 링크드데이터구축공정가이드 v1.0
1-4) 선정데이터조사서 정의특징항목별상세내용 구축대상데이터의제공기관, 건수, 유형및입수가능여부등의현황조사결과필요시기구축대상데이터조사및선정시필수 / 선택필수작성자주관기관, 제공기관공동작성량 1부관리항목 1. 제공기관 : 제공기관명 2. 제공기관담당자명 : 데이터제공기관담당자명 3. 제공기관연락처 : 데이터제공기관담당자연락처 4. 작성일 : 보고서작성일기술항목 1. 데이터형태 - 구조, 반구조, 비구조등원천데이터의형태를기입 2. 분류 - 데이터의형태또는주제분류를기입 3. 데이터건수 - 구축데이터형태별제공건수 4. 데이터포맷 - 데이터베이스또는파일포맷등 5. 반출데이터형태 - 반출가능한데이터형태기술 Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 Ⅲ. 태스크별상세내용 Ⅳ. 산출물상세내용부록 37
활용예 선정데이터조사서 제공기관명 담당자명 작성일 연락처 구분 데이터형태 분류명 데이터건수 데이터포맷 반출형태 국보구조국보 300 RDB CSV 비고 반출가능데이터만 CSV 형태로제공 38 링크드데이터구축공정가이드 v1.0
1-5) 구축계획서 정의 특징 구축대상데이터및구축방안등에대한계획수립필요시기사업을준비하는시점필수 / 선택필수작성자주관기관작성량 1부관리항목 1. 사업명 : 사업명칭 2. 작성자명 : 작성기관명 / 작성사업자명 / 작성자명 3. 작성일 : 작성일 Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 항목별상세내용 기술항목 1. 구축개요 2. 구축대상및범위 - 기존구축현황기술 - 구축대상및범위기술 3. 구축방안 - 자료형태별구축방안기술 ( 예, 구조, 비구조등원천데이터의형태에따른구축방안제시 - 원천데이터의파일포맷 ( 엑셀, MARC, TXT, XML 등 ) 의 RDF화 Ⅲ. 태스크별상세내용 Ⅳ. 산출물상세내용부록 39
활용예 구축계획서 사업명 작성기관명 작성자명 사업자명 작성일 구축자료유형 1. 구축목적 - 본사업의목적, 필요성, 추진배경, 기대효과등을기술한다 - 기존구축현황을기술한다. - 본사업의구축대상및범위를기술한다 2. 구축대상및범위 제공기관 : 제공건수 : 자료형태 : 데이터포맷 : 3. 구축방안 - 자료형태별구축방안을기술한다 - 품질요건, 검사절차, 시기, 검사담당등을기술한다 4. 표준화방안 - 데이터수집, 구축시에기준이되는표준을기술한다 5. 모델링가이드 - 데이터모델링시고려해야하는사항에대한기술 40 링크드데이터구축공정가이드 v1.0
1-6) 공정도 정의특징항목별상세내용 DB구축방법론을활용하여수집, 구축, 자료검사단계까지전과정을포함하는공정, 산출물및담당을기술필요시기사업을준비하는시점필수 / 선택필수작성자공정관리자작성량 1부관리항목 1. 사업명 : 사업명칭 2. 작성자명 : 작성기관명 / 작성사업자명 / 작성자명 3. 작성일 : 작성일기술항목 1. 단계 - 구축단계기술 2. 태스크및태스크번호 - DB구축방법론을참조하여해당태스크기술 - 태스크는선별및확장이가능함 3. 작업내용 - 각태스크별작업내용기술 4. 산출물 - 각태스크별산출물 5. 담당 - 각태스크별책임자 / 관리자 6. 사용툴 - 작업시툴을사용하는경우기술 Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 Ⅲ. 태스크별상세내용 Ⅳ. 산출물상세내용부록 41
활용예 공정도 사업명 작성기관명 작성자명 사업자명 작성일 단계 태스크 ( 태스트번호 ) 작업내용산출물담당사용툴 포괄적인조사로현재보 유하고있는정보자원에 대한전수조사를실시 현황조사 기초조사 (111C) 아직국내 LOD는초기단계로 LOD로발행했을때 원천데이터목록 MS 오피스 EXCEL 효과가큰데이터가무엇 인지에대한정확한전수 조사필요 42 링크드데이터구축공정가이드 v1.0
1-7) 시범데이터구축보고서 정의특징항목별상세내용 모델링가이드에따른온톨로지시범데이터구축필요시기구축대상별상세공정설계이후필수 / 선택필수작성자온톨로지설계자및개발자작성량 1부관리항목 1. 관리번호 : 주관기관에서사용하고있는관리번호를이용 2. 사업명 : 사업명칭 3. 작성자 : 보고서작성자명 4. 작성일 : 보고서작성일기술항목 1. 시범구축대상데이터선정 - 구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위선정 2. 시범데이터자료준비 - 선정된범위에합당한내 / 외부데이터를수집 3. 모델링가이드에따른테스트모델링수행 - 논의된서비스방향및대상데이터에적합한온톨로지모델설계 - 전체서비스가아닌단위서비스에한해테스트모델구축 4. 시범데이터결과물에따른모델링지침및산출물보완 - 설계된테스트온톨로지모델을기반으로샘플데이터구축 - 샘플데이터의검수 5. 실구축중발생예상문제점정의및해결방안준비 - 샘플데이터검수결과에따른예상문제점정의및해결방안모색 Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 Ⅲ. 태스크별상세내용 Ⅳ. 산출물상세내용부록 43
활용예 시범데이터구축보고서 관리번호 작성자명 사업명 작성일 1. 테스트모델설계 - 인물의상세이름제공을위한테스트모델설계 1st_Property 2nd_Property Domain Range 설명 Person_Name Person String 상세이름 aliasname Person String 이칭 bonghoname Person String 봉호 buname Person String 부명 changedname Person String 개명 childhoodname Person String 아명 choname Person String 초명 janame Person String 자 myohoname Person String 묘호 nickname Person String 호, 아호 penname Person String 필명 posthumousname Person String 시호 2. 시범데이터구축 - 테스트모델에따른시범데이터구축 realname Person String 본명 데이터설명구축파일 aliasname 이칭 aliasname_fi.0000 anothername_kor 이명 ( 한국어 ) anothername_kor_fi.0000 bonghoname 봉호 bonghoname_fi.0000 Career 관직, 직업정보 Career_fi.0000 changedname 개명 changedname_fi.0000 childhoodname 아명 childhoodname_fi.0000 choname 초명 choname_fi.0000 44 링크드데이터구축공정가이드 v1.0
1-8) 구축대상데이터반출지침서 정의특징항목별상세내용 구축대상데이터반출에따른계획및작업순서를정의필요시기자료구축을시작하는시점필수 / 선택필수작성자주관기관, 프로젝트관리자공동작성량 1부관리항목 1. 사업명 : 사업명칭 2. 작성자명 : 작성기관명 / 작성사업자명 / 작성자명 3. 작성일 : 작성일기술항목 1. 목적 - 데이터반출대한목적및개요정의 2. 작업방법 - 각공정별작성순서상세기재 3. 예외사항처리방법 - 데이터반출시발생되는예외사항처리방법에대한기재 Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 Ⅲ. 태스크별상세내용 Ⅳ. 산출물상세내용부록 45
1-9) 구축대상데이터목록 정의 확정된구축대상데이터리스트 필요시기 구축단계 특징 필수 / 선택 작성자 필수 주관기관, 프로젝트관리자공동 작성량 1 부 관리항목 1. 관리번호 : 주관기관에서사용하고있는관리번호를이용 2. 사업명 : 사업명칭 3. 작성자 : 보고서작성자명 4. 작성일 : 보고서작성일 기술항목 항 목별상세내용 1. 데이터형태 - 구조, 반구조, 비구조등원천데이터의형태를기입 2. 데이터세부사항 - 메타데이터항목을기입 ( 분류, 유형, 시대, 일자등 ) 3. 소장기관 - 데이터의보유기관을기입 4. 내 / 외부정보 - 내부데이터또는외부연계데이터에대한기입 5. 건수 - 데이터의건수기입 46 링크드데이터구축공정가이드 v1.0
활용예 구분 관리번호 작성자명 데이터형태 구축대상데이터목록 사업명 작성일 분류유형입력일소장기관내 / 외부건수 주소구조지리텍스트 20xx.xx.xx XXX 내부 200 건 Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 Ⅲ. 태스크별상세내용 Ⅳ. 산출물상세내용부록 47
1-10) 인수인계증 정의 자료의반입과반출을관리하는양식 필요시기 자료의반출과반입이발생하는시점 특징 필수 / 선택 작성자 필수 작업자, 프로젝트관리자공동 작성량 서식당 1 부 관리항목 1. 관리번호 : 주관기관에서사용하고있는관리번호를이용 2. 사업명 : 사업명칭 3. 작성자 : 보고서작성자명 4. 작성일 : 보고서작성일 기술항목 항목별상세내용 1. 관리번호 : 작업대상자료의고유번호 2. 청구번호 : 데이터를보유한기관에서사용하는청구번호를기입 3. 비고 : 자료의반입과반출하면서자료의특이사항을기록 4. 대출자 : 자료를빌려가는사람이서명 5. 대여자 : 자료를대여해주는사람이서명 6. 자료명 : 자료의명칭기록 7. 자료수량 : 자료의수량기록 ( 예 : 건등 ) 8. 반입일 : 자료를반입하는날짜 9. 예정반납일 : 자료를사용하고반납하는예정일기록 10. 반출일 : 자료를반출하는날짜 48 링크드데이터구축공정가이드 v1.0
활용예 인수인계증 관리번호 사업명 작성자명 작성일 청구번호 관리번호 데이터명 자료수량 비고 051.1박49 263987 박문제12집 1939년 19월 10 Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 상기데이터를 ( 인수 / 인계 ) 하였음을확인하며, 자료손상없이 ( 인수 / 인계 ) 가되었음을확인합니다. 주관기관 ( 확인 ) 주관사업자 ( 확인 ) Ⅲ. 태스크별상세내용 Ⅳ. 산출물상세내용부록 49
2) 구축및발행단계 2-1) 구축명세서 정의 링크드데이터구축목적, 범위, 도메인의특징등기술 필요시기 구축및발행단계 특징 필수 / 선택 작성자 필수 주관기관, 프로젝트관리자공동 작성량 1 부 관리항목 1. 관리번호 : 주관기관에서사용하고있는관리번호를이용 2. 사업명 : 사업명칭 3. 작성자 : 보고서작성자명 4. 작성일 : 보고서작성일 항목별상세내용 기술항목 1. 도메인분석 - 해당도메인의특징등을상세분석 2. 목적및범위설정 - 링크드데이터로구축하고자하는목적과범위설정 3. 사용자선정 - 시스템이용자및관리자구성 4. 해당사업에필요한인력정보 - 개발자및필요인력구성 5. 사업수준정의 - 해당사업의 LOD 발행수준정의 6. 기타사업관련정보설정 - 해당사업에관련된필요한내용기술 50 링크드데이터구축공정가이드 v1.0
활용예 관리번호 작성자명 1. 분야구축분야명기술 2. 담당시스템담당 구축명세서 사업명 작성일 데이터담당 ( 원천데이터분석, 온톨로지설계, 트리플변환등 ) 자문담당 등을기재 3. 목적 LOD(Linked Open Data) 구축을위한목적을기술 4. 구축범위 LOD(Linked Open Data) 를적용하기위한데이터및시스템의범위를기술 5. 원천데이터 LOD(Linked Open Data) 를적용하는대상이되는원천데이터의데이터명, 특징및관계등 을기술 Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 Ⅲ. 태스크별상세내용 Ⅳ. 산출물상세내용부록 51
2-2) 온톨로지, 어휘분석서 정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석 필요시기 자료의구축을시작하는시점 특징 필수 / 선택 작성자 필수 주관기관, 프로젝트관리자공동 작성량 1 부 관리항목 1. 관리번호 : 주관기관에서사용하고있는관리번호를이용 2. 사업명 : 사업명칭 3. 작성자 : 보고서작성자명 4. 작성일 : 보고서작성일 기술항목 항목별상세 1. 해당데이터도메인기술 - 원천데이터가갖는도메인특징, 범위등기술 2. 현황조사 - 해당도메인에속하는국내외표준온톨로지조사 - 표준온톨로지에서활용하고있는표준어휘집조사 - 온톨로지모델및어휘집의도입가능성 ( 적합성 ) 여부조사 내 용 52 링크드데이터구축공정가이드 v1.0
활용예 온톨로지, 어휘분석서 관리번호사업명작성자명작성일 1. 원천데이터의특징 - 본사업대상원천데이터는인간문화재로 사람 을주객체로함 2. 해외온톨로지분석 - 국제적으로사람객체를표현하기위한표준으로 FOAF 모델활용 3. 표준어휘집 - FOAF 어휘집을주로활용함 Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 4. 적합성여부 - 사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를표현하기위한속성은부족함 - 이를위해별도로속성과하위클래스를정의하고공표하는것이필요함 Ⅲ. 태스크별상세내용 Ⅳ. 산출물상세내용부록 53
2-3) 표준용어집 정의 표준용어집 필요시기 자료의구축을시작하는시점 특징 필수 / 선택 작성자 필수 주관기관, 프로젝트관리자공동 작성량 1 부 관리항목 1. 관리번호 : 주관기관에서사용하고있는관리번호를이용 2. 사업명 : 사업명칭 3. 작성자 : 보고서작성자명 4. 작성일 : 보고서작성일 기술항목 항목별상세내 1. 국내외표준용어집선정 - 원천데이터를가장잘표현할수있는용어집선정 - 기관에서정의한어휘선정 2. 시스템표준용어집구축 3. 원천데이터용어를표준용어로매핑 - 매핑규칙구축 - 매핑규칙에따른원천데이터용어들의표준화 용 54 링크드데이터구축공정가이드 v1.0
활용예 표준용어집 관리번호 사업명 작성자명 작성일 용어 예시 비고 현재활용용어 선정표준용어 표제어 충선왕 ( 忠宣王 ) title dc:title 본명 왕장 ( 王璋 ) * 왕명으로발음이없는한자일경우 ( 조선왕실 ), 조선왕조실록사이트의음을사용 Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 호, 아호 필명 아명 개명 창씨명 가명 자 종교명 성별 초명 중앙 왕원 시호충선 ( 忠宣 ) 봉호 묘호 이칭 익지례보화 ( 益智禮普化 ) Ⅲ. 태스크별상세내용 Ⅳ. 산출물상세내용부록 55
2-4) 개념모델명세서 정의 온톨로지개념모델에대한정의 필요시기 LOD 에필요한온톨로지모델을구축하는시점 특징 필수 / 선택 작성자 필수 주관기관, 프로젝트관리자공동 작성량 1 부 관리항목 1. 관리번호 : 주관기관에서사용하고있는관리번호를이용 2. 사업명 : 사업명칭 3. 작성자 : 보고서작성자명 4. 작성일 : 보고서작성일 기술항목 항목별상세 1. 시스템의도메인및목적에적합한개념모델정의 - 작성된시나리오고려 - 활용가능개념모델분석 2. 표준용어집을활용하여개념모델어휘정의 3. 원천데이터에해당하는내용들의계층적지식표현 내 용 56 링크드데이터구축공정가이드 v1.0
활용예 관리번호 작성자명 1. 구조도 개념모델명세서 사업명 작성일 Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 2. 명세 상위개념 Agent Docu ment 개념개념 ( 한글명 ) ( 영문명 ) 주체 사람 그룹 문서 이미지 Agent Person Group Docu ment Image 개념설명 행위를하는주체에대한개념으로사람, 그룹등을포함 사람을나타내는개념 사람으로구성된단체를나타내는개념문서의형태로표현될수있는모든것들을포함하는개념 Document 의하위클래스이면서이미지를표현하기위한개념 관계 ( 한글명 ) 성별 생일 개인메일 관계 ( 영문명 ) gender birthday mbox 관계설명 male, fenale과같은성별을나타내기위한관계 출생과관련된날짜를기술하기위한관계 메일주소를기술하기위한관계 관계대상 날짜 나이 age 나이를나타내는관계 숫자 이름 firstname 사람의이름 문자열 성별 lastname 사람의성 문자열 멤버 주제 묘사 썸네일 member topic depicts thumbnail 그룹을구성하는하위집합요소 해당문서가나타내는모든요소 이미지와이미지가묘사하고있는사물과의관계를기술하기위한속성전체크기의이미지와이미지는대표하는작은이미지와의관계 Agent Thing Thing Image 관계특징 단일값을갖는관계 역관계가단일값을갖는관계 page 관계와역관계 depiction 관계와역관계 Ⅲ. 태스크별상세내용 Ⅳ. 산출물상세내용부록 57
2-5) 온톨로지모델명세서 정의 본사업에필요한온톨로지모델구축에대한명세서 필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점 특징 필수 / 선택 작성자 필수 주관기관, 프로젝트관리자공동 작성량 1 부 관리항목 1. 관리번호 : 주관기관에서사용하고있는관리번호를이용 2. 사업명 : 사업명칭 3. 작성자 : 보고서작성자명 4. 작성일 : 보고서작성일 기술항목 항목별상세내용 1. 클래스정의 - 같은분야의활용가능한관련온톨로지분석 - 개념모델을기반으로한클래스들의정의 - 정의된클래스들의계층화상향식 / 하향식 / 조합식 2. 속성정의 - 클래스에필요한속성정의 - 원천데이터에서제공되는내용들을기반으로구축 - 구축된클래스속성들의계층화상향식 / 하향식 / 조합식 3. 모델검증 - 구축된모델에대한검증 - W3C 표준에맞춰무결성검증 - 작성된시나리오를해결가능한지에대해검증 58 링크드데이터구축공정가이드 v1.0
활용예 관리번호 작성자명 온톨로지모델명세서 사업명 작성일 Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 Ⅲ. 태스크별상세내용 Ⅳ. 산출물상세내용부록 59
2-6) 데이터검증서 정의 구축된데이터의품질및적합질의검증 필요시기 LOD 데이터구축후유효성을검증해야하는시점 특징 필수 / 선택 작성자 필수 주관기관, 프로젝트관리자공동 작성량 1 부 관리항목 1. 관리번호 : 주관기관에서사용하고있는관리번호를이용 2. 사업명 : 사업명칭 3. 작성자 : 보고서작성자명 4. 작성일 : 보고서작성일 기술항목 항목별상 1. 적합질의에따른유효성검증 - 적합질의를해결하고자작성된 SPARQL에따른검증 - 시나리오가해결되었는지에대한검증 - 구축된 LOD 데이터들의원천데이터의내용을잘반영했는지에대한검증 - 단위테스트및통합테스트로이루어짐 세 내 용 60 링크드데이터구축공정가이드 v1.0
활용예 관리번호 작성자명 데이터검증서 사업명 작성일 작업권한시험항목검증방법 관리자 데이터수집및저장 관리자 LOD 모델관리및검증 관리자 관리자 LOD 인스턴스저장및 검증 SPARQL 처리기 내 / 외부데이터를수집하기위한수집및수집된데이 터저장을위한기능개발 개발된 LOD 모델에대한추가 / 삭제 / 변경등의관리 기능및적합성검증개발 구축된 LOD 인스턴스를저장하고적합성을검증하기 위한기능개발 시맨틱질의언어인 SPARQL 을지원하기위한기능을 개발 관리자 LOD 발행및관리 LOD 발행및관리를위한기능개발 관리자 LOD 통계정보서비스 LOD 발행및이용에관한통계정보제공기능개발 관리자 관리자 LOD 검색, 브라우징, 다 운로드서비스 인물관련서비스 LOD 를활용하기위한편이도구개발 ( 검색, 브라우 징, 다운로드서비스 ) 구축된데이터를활용한인물중심시맨틱웹서비스 개발 Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 Ⅲ. 태스크별상세내용 Ⅳ. 산출물상세내용부록 61
2-7) 발행명세서 정의 LOD 데이터구축이끝난후 LOD 서비스를발행하는시점 필요시기 LOD 데이터구축이끝난후 LOD 서비스를발행하는시점 특징 필수 / 선택 작성자 필수 주관기관, 프로젝트관리자공동 작성량 1 부 관리항목 1. 관리번호 : 주관기관에서사용하고있는관리번호를이용 2. 사업명 : 사업명칭 3. 작성자 : 보고서작성자명 4. 작성일 : 보고서작성일 기술항목 항목별상세내 1. 데이터저장방식의결정 - 관계형DB, API, RDF 저장소, RDF 파일등데이터저장방식을결정 2. 데이터발행방식의결정 - RDF2RDF( 예 :D2R) - RDFa 활용 CMS - 링크드데이터인터페이스 ( 예 :Pubby) - 웹서버 (Web server) 용 62 링크드데이터구축공정가이드 v1.0
Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 Ⅲ. 태스크별상세내용 Ⅳ. 산출물상세내용부록 63
부록 64 링크드데이터구축공정가이드 v1.0
[ 부록 1] 링크드데이터선정기준참고자료 [ 부록 2] URI 생성및관리지침 [ 부록 3] 링크드데이터발행후체크리스트 65
[ 부록 1] 링크드데이터선정기준참고자료 sns 1. 개요 링크드데이터사업을추진하고자하는기관의보유데이터중링크드데이터로개방했을때효과가가장큰데이터와개발할수있는데이터를식별하기위해서기본적으로확인해야하는선정기준 2. 선정기준 공개하고자하는데이터가높은이용가치를가지고있는가? 데이터에대한저작권문제는없는가? 개인정보에위배되지않는가? 구축후오픈된라이선스 (Creative Commons와같은 ) 로활용이가능한가? 데이터제공자는참조사이트를보유하고있는가? 데이터의확보가가능한가? 데이터오픈에대한정책을보유하고있는가? 66 링크드데이터구축공정가이드 v1.0
[ 부록 2] URI 생성및관리지침 1. 배경 웹에서 URI 는웹페이지나특정개체 (PDF 등특정파일 ) 를식별하는데활용되지만 실세계의개념, 객체를나타내기도함 - 웹은 URI 를단일한글로벌식별체계로활용함 sns Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 링크드데이터에서 HTTP URI 는 URI 에의해서식별가능한정보자원에대한탐색과 역참조를지원함 - 링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록하고구체적으로정의함 - 체계적인 URI 생성, 할당, 관리는이용자의데이터탐색과구조분석을용이하게함 그러나 URI 생성과관리는표준적인체계가존재하지는않음 본가이드에서의 URI 생성및관리지침은권고사항으로반드시준수하여야하는표준원칙은아니지만현재 Open Data, Linked Data 발행시일반적으로준수되고있는사항들로향후링크드데이터프로젝트결과물이웹에서보다효율적으로운용될수있도록하고타데이터셋과상호운용성을원활하게할수있음 Ⅲ. 태스크별 Ⅳ. 산출물상세내용 - URI 생성지침은 223 Best Practices URI Construction 4), Designing URI Sets for the UK Public Sector 5) 를참조함 부록 4) http://www.w3.org/2011/gld/wiki/223_best_practices_uri_construction 5) https://www.gov.uk/government/publications/designing-uri-sets-for-the-uk-public-sector 67
2. URI 생성을위한사전확인리스트 본격적인 URI 설계전에서비스하고자하는데이터의유형과 URI 부여를위해아래사항을확인함 - URI로제시, 표현하고자하는정보는구체적으로무엇인가? - 다운로드가능한정보자원을가리키기위한것인가?(PDF, CSV, RDF, TTL, ZIP) - 실세계에존재하는객체 ( 개념 ) 를식별하기위한것인가?( 학교, 부서등 ) - 실세계에존재하는객체 ( 개념 ) 에관한정보를가리키기위한것인가? - 추상적인어떤것을식별하기위한것인가? ( 지위, 서비스, 관계 ) - 개념을정의하기위한것인가?( 용어집의용어혹은메타데이터요소 ) - 이러한것들을지칭하는비URI 형태의명칭혹은식별자가존재하는가?( 다른정보시스템에서사용하고있는것들 ) - 이러한것들을지칭하기위한 URI가이미존재하는가? - 정보자원에새로운 URI를부여할경우이를관리할수있는권한은누가갖고있는가? - URI 구문과관련된특별한사항이나요구사항들이있는가? - 이해관계자가쉽게 URI를기억하거나활용할수있는가, 그럴정도로직관적인가? - 생성된 URI가지칭하는자원을충분히이해할수있을정도로쉬운가? - URI가관련된다른 URI를추측할수있는구조를가질필요가있는가? - URI를장기적으로지속적으로유지하기위한요구사항은무엇인가? - URI를변경해야하는주기가존재하는가?( 정기적조직변경, 업무변경등 ) - URI에서표현하는용어혹은분류가공식적인가?( 법적으로보장된공식적인 68 링크드데이터구축공정가이드 v1.0
조직명, 혹은표준적인학명등 ) - 비공식적인명칭의사용도가능한가? 3. URI 유형구분 링크드데이터로발행하기위한자원의유형에따라이를표현하기위한 URI 유형을 아래와같이구분함 각자원의유형별로별도의 URI 로구분하고각 URI 유형별로별도의 URI 규칙을따름 자원유형 URI 유형정의와범위 실세계의 어떤것 실세계에존재하는객체, 개념에대한웹에존재하는정보 하나의집합 (set) 안에포함되어있는각식별자들의색인 개념정의 Identifier URI Document URI Representation URI List URI Ontology URI 어떤것 은실세계에물리적으로존재하거나추상적인객체, 개념을의미함 물리적객체 : 사람, 학교, 도로 추상적객체 : 정부부문, 인종 ( 민족 ), 이벤트 문서나저작물들또한실세계의객체에속함 실세계의객체나개념은웹에존재하지않지만그것에관한 정보는존재 URI 구문을생성할때객체에대한정보와객체자체를지칭 하는것을구분할수있도록해야함 (DBpedia 의 Resource 와 Page 구분참조 ) 실세계의객체나개념에관한정보제공을목적으로개별적 인 identifier URI 가정보제공자 (publisher) 에의해서할당되 어명시적으로링크되어웹에존재하는문서 6) 에부여함 Document URI 제공자가하나이상의형태 (format) 에대한 정보를제공하는경우로, 각각의형태는 representation URI 에의해서명명화됨으로써구분할수있음 형태에따라서일부의 representation URI 는기계가독형문서 에명명하여명명된자원에관한더많은연결 (link) 을제공할 수있음 하나의집합 (set) 에포함되어있는 Identifier URI 의목록을제 공함 개념의정의를제공해줄필요또한있음 실세계의객체, 개념은그객체, 개념들의개별적인인스턴스 를식별하기때문에개념의정의를제공해줄필요가있음 Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 Ⅲ. 태스크별 Ⅳ. 산출물상세내용부록 6) document 를문서로번역한것으로실제로이미지, 동영상등다양한포맷들도포함하는개념 69
자원유형 URI 유형정의와범위 객체, 개념간의관계 Ontology URI RDF 구문의각부분은 URI로명명이가능함 이는실세계의객체, 개념간의관계를포함하고있음 온톨로지 URI는온톨로지내부의연결관계를맺어주고보다나은 reasoning이가능하도록함 URI set Set URI URI set은하나의출처로부터관리되는하나의개념에대해서 URI를활용해서출판된참조데이터의집합을의미한다. 예를들어각각의학교, 각각의도로등은별도의분리된 URI 셋으로구성된다 URI set에명명된 URI 식별자유형은셋 ( 집합 ) 의품질특성을제공하기위해명명함 4. URI 설계원칙 HTTP를활용해서 URI가해석가능하도록함 (resolve) 명시적인 URI의형태를나타개기위해일관된경로구조를사용 데이터발행자 (publisher) 는데이터셋이다른분야혹은관련된분야에서재사용이가능한지여부를확인해야함 URI 셋은재사용이가능한잠재적수명 ( 유효기간등 ) 을명시해야함 URI 셋은최소한 10년이상재사용이가능하도록해야함 여러가지의 Representation URI를사용할수있는경우내용협상 (contents negotiation) 으로가장적절한표현을제공할수있는 Document URI를제공해야함 최소한기계가독형 Representation URI를제공해야함 적절한경우, 사람이읽을수있는형태의 Representation URI를 HTML안에포함시켜야함 단일 Document URI를위해서활용가능한각각의 Representation URI를탐색할수있는방법을제공해야함 URI set은일반적인어휘를사용해서데이터품질특성, 권한, 인증관련정보를제공해야함 70 링크드데이터구축공정가이드 v1.0
URI 구조에는 session ID 와같이변경될가능성이있는것을포함시켜서는안됨 URI 경로구조는사람이읽을수있는형태로 URI가대표하고있는내용을합리적으로이해할수있어야함 5. 각유형별 URI 설계 ( 안 ) URI 설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라독자적으로설계가가능함 1) URI 기본구조설정 기본적으로링크드데이터기반서비스는기존에사용하고있는대표도메인명을활용하며, 기존도메인에 data 서비스페이지임을인지할수있도록 data 라는용어를부기할것을권장함 단, 링크드데이터프로젝트를추진하는주체 ( 기관 ) 의유형에따라다음 3가지의경우별로별도의세부지침을제시함 - 유형1 : 특정도메인을대표하는기관의경우 ( 예 : 국립중앙도서관, 대한민국정부, 국립민속박물관등 ) - 유형2 : 특정도메인을대표하나정형화된조직구조를갖추고있어하나의조직 ( 도메인 ) 으로분류되는경우 ( 예 : 기획재정부, 안전행정부등 ) 단, 데이터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별도의서비스체계가없을경우에적용. 그외개별단위서비스가필요한경우유형1을준수함. - 유형3 : 그외일반적인조직유형 ( 기업등 ) 에속하는경우 유형1의기본 URI 구조는다음과같이함 - 1안 : http://data.[ 기존도메인 ] < 예, http://data.homepage.go.kr> Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 Ⅲ. 태스크별 Ⅳ. 산출물상세내용부록 - 2 안 : http://[ 기존도메인 ]/data < 예, http://www.homepage.go.kr/data> 71
유형2의기본 URI 구조는다음과같이함 - 1안 : http://[ 지식분야 ].data.[ 기존도메인 ] 예, http://education.data.go.kr> - 2안 : http://[ 기존도메인 ]/data/[ 지식분야 ] 예, http://data.go.kr/data/education> 유형3의기본 URI 구조는다음과같이함 - 1안 : http://data.[ 기존도메인 ] 예, http://data.homepage.co.kr> - 2안 : http://[ 기존도메인 ]/data < 예, http://homepage.co.kr/data> - 3안 7) : http://data.[ 기존도메인 ]/[ 지식도메인 ] 예, http://data.homepage.co.kr/education> http://[ 기존도메인 ]/data.[ 지식도메인 ] 예, http://homepage.co.kr/data/education> 2) URI 유형별구조설계 1) 의기본설계를기본도메인 [base domain] 으로하여각유형별로 URI 를아래와같 은약어로표현함 URI 유형 약어표현 Identifier URI Document URI Representation URI Ontology URI [base domain]/id [base domain]/doc [base domain]/def Set URI [base domain]/set 7) 개방될데이터의지식도메인이여러가지일경우 72 링크드데이터구축공정가이드 v1.0
Document URI, Representation URI 는파일확장자를반드시표현하여해당정보자 원의유형을식별할수있도록함 - 예시, [base domain]/doc/guideline.hwp Identifier URI 구조상세설계 - 기본구조 : [base domain]/id/{concept}/{reference} [base domain]/{concept}/{reference}#id - 구조예시 : [base domain]/id/library/011001 [base domain]/library/011001#id {concept}/{reference} 는표현하고자하는개념과실제객체사이의쌍으로데이터의구조를상세하게표현가능함 ( 예, 한국 / 시도 / 군구등 ) Document URI 구조상세설계 Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 - 기본구조 : [base domain]/doc/{concept}/{reference} - 구조예시 : [base domain]/doc/school/011001 Representation URI 구조상세설계 - 기본구조 : [base domain]/doc/{concept}/{reference}/{ 파일명. 파일확장자 } - 구조예시 : [base domain]/doc/school/011001/school.rdf 개념을정의하기위한 URI( 온톨로지스키마 ) - 기본구조 : [base domain]/def/{concept}/ - 구조예시 : [base domain]/def/school URI set - 기본구조 : [base domain]/set/{concept}/ - 구조예시 : [base domain]/set/school Ⅲ. 태스크별 Ⅳ. 산출물상세내용부록 73
[ 부록 3] 링크드데이터발행후체크리스트 sns 1. 대상 링크드데이터로출판된데이터셋에대한품질체크리스트로출판된데이터셋이기대수준을충족하는가를확인하기위한기준 항목별로필수, 권고, 선택사항으로구분함 현재의체크리스트는 LATC Dataset Publishing Checklist를참조하여작성됨 2. 체크리스트 1) 링크드데이터서비스페이지는이용자가데이터를활용하는데필요한정보를구체적으로잘설명하고있어야함 1.1) 링크드데이터서비스페이지 ( 웹사이트 ) 는데이터셋에대한구체적인설명 을포함하고있는가? 필수 : 서비스하고있는데이터가무엇에관한것인가에대한설명 필수 : 서비스하고있는데이터의출처 (source) 에대한설명 ( 원데이터에대한링 크 ( 위치정보 )) 필수 : 서비스하고있는데이터의라이센스, 저작권에대한설명 권고 : 제공하고있는데이터로이용자가할수있는것에대한설명 ( 데이터를제 공하는이유에대한설명포함 ) 권고 : 데이터를업데이트하는주기 ( 일, 월, 없음등 ) 에대한설명과마지막업데 이트일자에대한정보 권고 : 원천데이터의변환과정에대한설명 74 링크드데이터구축공정가이드 v1.0
선택 : 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된 소스코드에대한설명및링크정보 1.2) 데이터접근에대한정보를표현하고있는가? 권고 : SPARQL 접점과질의폼제공여부확인 권고 : RDF 데이터덤프다운로드제공여부확인 권고 : 데이터셋을제공받을수있는구문에대한정보제공여부 (RDF/XML, Turtle, RDFa 등 ) 선택 : SPARQL, 덤프, resolvable URIs을통해서제공받는데이터들의차이가무엇인지에대한설명 1.3) 제공하고있는데이터셋에대한예제정보를제공하고있는가? 필수 : 예제 권고 : 다른데이터셋으로링크가가능한예제 URIs 권고 : SPARQL 질의예제 선택 : 객체모델을보여줄수있는 Turtle snippet 1.4) 모델링과데이터크기에관한정보제공을하고있는가? 필수 : 전체트리플크기에관한정보 필수 : 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에대한정보 권고 : SPARQL 질의예제 구축공정 Ⅰ. 개요 Ⅱ. 링크드데이터 Ⅲ. 태스크별 Ⅳ. 산출물상세내용부록 권고 : 어떤객체 (entities) 들이기술되어있으며얼마나많은종류를가지고있는 가에대한정보 75
권고 : 어떤용어집을사용하였는가에대한정보 선택 : 다양한유형의객체에대한 URI 패턴정보 선택 : 데이터셋스키마에대한다이어그램정보 1.5) 데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가? 필수 : 브랜드로고와링크정보를제공하고있는지와서비스를지원, 운영하고 있는주체에대한정보제공 1.6) 제한사항과향후데이터서비스에대한작업등정보를제공하고있는가? 필수 : 권고, 선택등제안된모든사항에대한기준을충족하고있는지여부를확 인하여부족한부분에대한향후제공계획등정보제공 2) 링크드데이터서비스는제공하고있는기능을점검할수있는기능을제공해야하고표준을준수하고있는지여부를확인할수있어야함 2.1) 내용협상과해석가능한 URI(Resolvable URIs) 제공여부를확인할수있는 지확인 필수 : 모든예제자원에대한 URI resolve 확인 (HTTP 200 반환성공여부 ) 예 ) curl -i http://example-uri 권고 : HTTP 내용협상확인 예 ) curl -H Accept: text/html http://example-uri 권고 : RDF 내용협상이가능한지확인 예 ) curl -H Accept: application/rdf+xml http://example-uri curl -H Accept: text/turtle http://example-uri 권고 : 내용협상의구현이완료되었는지확인 예 ) curl -H Accept: application/rdf+xml http://example-uri curl -H Accept: application/rdf+xml, text/html;q=0.1 http://example-uri 76 링크드데이터구축공정가이드 v1.0
curl -H Accept: text/html;q=0.1, application/rdf+xml http://example-uri 필수 : 반환된 RDF 는 RDF 파서나유효성검증도구로분석이가능해야함 2.2) 연결확인 필수 : 다른데이터셋과연결되어있는예제의 URI 해석 (resolve) 가가능해야함 2.3) SPARQL 접점 (Endpoint) 기능점검 권고 : SPARQL 예제질의문이모두정상적으로작동하는지확인 권고 : 단순 SPARQL 질의가작동해야함 예 ) SELECT * {?s?p?o } LIMIT 10 SELECT DISTINCT?type WHERE {?x a?type } 3) RDF 를활용하여표현하고있는데이터는재사용과표준을준수하고있는지확인 권고 : 자연어문자열로표현된값들은영문, 한글등대상을잘표현할수있는 적절한언어를사용하고있는지확인 권고 : 숫자와날짜등특정표현을위해적절한속성, 유형구분 (XSD datatype) 을활용하고있는가? 예 ) rdf:type 과적절한레이블 (rdfs:label, dc:title, skos:preflabel) 권고 : 공백노드가존재하는지여부확인 선택 : 모든예제자원은 RDF 로기계가독형표현을가지고있는지확인 Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 Ⅲ. 태스크별 Ⅳ. 산출물상세내용부록 77
4) 기존용어집의사용과표준용어집활용에관한점검 4.1) 기존용어집의재사용 필수 : 재사용된용어집이정확한네임스페이스를사용하고있는지여부 필수 : 클래스와속성들이기존용어집에정확하게정의되어있는지확인. 오표기된클래스와속성명이존재하는지확인 4.2) 자기정의용어집 권고 : 클래스와속성의 URI 해석 (URI resolve) 이가능한지확인 권고 : 클래스와속성들이적절한레이블을가지고있는지확인 권고 : 용어집의접두부 ( 네임스페이스 URI 검색 ) 가정상적으로등록되어있는지확인 선택 : 모든클래스와속성이용어집과일치하는지확인 선택 : 속성이 domain과 range를가지고있는지확인 선택 : 클래스 / 속성 URIs로부터용어집문서를가리키고있는 rdfs:isdefinedby 가존재하는지여부확인 5) 현재대부분의링크드데이터는기존에존재하는데이터의변환으로구성되지만인터링킹을통해서새로운정보관계를생성하므로연결상태를확인하고대상플랫폼을확인해야함 선택 : 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인 78 링크드데이터구축공정가이드 v1.0
Ⅰ. 개요 Ⅱ. 링크드데이터구축공정 Ⅲ. 태스크별 Ⅳ. 산출물상세내용부록 79
1. 본보고서는 2013 년국가 DB 사업으로수행한 LOD 구축사업 ( 한국사, 생물정보 ) 의결과로만들었습니다. 2. 본보고서의내용은한국정보화진흥원의공식견해와다를수있습니다. 3. 본보고서의내용에대한무단전재를금하며, 가공 인용할때는출처를밝혀주시기바랍니다. 링크드데이터구축공정가이드 v1.0 2014 년 4 월인쇄 2014 년 4 월발행 발행인장광수 발행처한국정보화진흥원지식자원활용부 집행필이병하, 이동철, 김택훈, 박진호 주행소서울시중구청계천로 14 연락처 (02) 2131-0114 인행쇄 ( 사 ) 장애인생산품판매지원협회인쇄사업소 < 비매품 >