情報檢索 Information Retrieval 제 7 장시맨틱웹 2013. 08. 08 가천대학교 IT 대학 컴퓨터미디어융합학과
목차 7.1 웹의진화 7.2 XML 7.3 RDF 7.4 온톨로지 7.5 시맨틱웹익힘문제
Why Semantic Web? Semantic is power of knowledge. 의미를아는것이진정한힘이다. 세상은넓고웹사이트는많은데자료의의미를알지못하면,, 알고싶은것은많으나정보가웹사이트에흩어져있어서,,, 같은자료도사용할때마다다른의미를알아야,,, 지식검색이목표 3
7.1 웹의진화 초기의웹팀버너스리 : Client/Server 시스템에 HTML을결합한수준. 물리적통신망위에논리적 HTTP를설치하여논리공간연결. 이질적환경을극복 Semantic Web - 컴퓨터가정보자원의뜻을이해하고, 논리적추론까지할수있는차세대지능형웹. - 분산환경에서자원에대한정보와자원사이의관계-의미 정보를기계가온톨로지형태로표현하고처리할수있는 4
7.1 개요 Web 의비교 구분 웹 1.0 웹 2.0 웹 3.0 시기 ( 년 ) 1994-2004 2000-2010 2010-2020 상호작용 read only read & write read, write & execute 키워드 공유 공유, 참여, 개방 상황인식 (context) 이용자 인간 인간 인간, 기계 이용형태일방적공급이용자가생산, 소비웹이원하는콘텐츠제공 검색게시판수준여러사이트에개방이용자맞춤형검색 기반기술서버관리브로드밴드, 서버관리시맨틱기술, 상황인식 대응단말 PC PC 와모바일일부 PC, 모바일, 시계등 5
7.1 개요 World Wide Web Client/Server + HTML + HTTP : 단순성, 편리성 보급 by Tim Berbers-Lee 문제점단어빈도수와어휘정보로검색 비관련문서이유 : HTML은보기용 내용과의미표현곤란 에이전트이용곤란 Semantic Web - 정보에잘정의된의미를부여 사람과기계의협동가능 (Tim) - 표준을기반으로자료를추상적으로표현 (W3C) 6
7.1.1 웰드와이드웹의진화 (1) Web 1.0 웹의기원 : 하이퍼텍스트 ( 테드넬슨이 1965년에발표 ) 하이퍼텍스트기능의현실화 : 더글러스잉글버트의마우스 1989년. 팀버너스리 WWW 발표. 특징 - 온라인게시판 - 텍스트와링크 - 정적웹페이지 7
7.1.1 웰드와이드웹의진화 (2) Web 2.0 2004년 O Reilly Media사의주장자료의소유자나독점자없이쉽게자료를생산하고공유하기위한환경특징 - 프랫폼의웹플랫폼으로부터독립 : hw, sw로부터구글 : 서비스만제공 - 집단지능의웹 위키피디아, 유투브 8
7.1.1 웰드와이드웹의진화 (3) Web 3.0 2006년 John Marfoff(Yew York Times 기자 ) 주창지능화된웹 - 시맨틱기술, 맞춤형컨텐츠와서비스시맨틱웹 : 기술이정보를이해하는기술웹 3.0: 기술적관점 + 시장적관점특징 - 연결된자료의웹 : 생산자, 유통업자, 소비자들이모두연결되어야 - 시맨틱웹 - 시맨틱웹과웹 2.0의결합 9
7.1.1 웰드와이드웹의진화 (3) Web 3.0 팀버너스리와핸들러의웹 3.0 웹 3.0 웹 2.0 시맨틱웹 (RDFS, OWL) 연결된자료 (RDF, SPARQL) 10
7.1 개요 World Wide Web 사람의눈으로이해하는웹. 눈으로수많은사이트의자료를종합해야,, 불가 기계가자료를읽고이해해야 Semantic Web Def. - 기계가정보를읽고의미를이해하고새로운정보를만드는웹. - 사용자질의와웹이저장하고있는자원을이해하고, 두개를연결하여적합한결과를제공할수있는웹 - 기계가정보의의미를이해하는웹 생각하는웹 이해 : 웹에서새정보발견시기존의정보와관련시킬수있 11
7.1 개요 Semantic Web의기능과목표기능 - 조직과어플리케이션에걸친데이터상호운영 지식교환을위한상호운영표준체계 공동체와어휘의상호연결아키텍처목표 1) 검색시에정확한결과 2) 이질형자료와통합및비교 3) 모든자료에의미와기술정보연관 4) 웹서비스의자동화 12
7.1 개요 실례 1 키워드기반질의키워드 : 문서의내용이나제목을요약한핵심적인단어. 차량정비 : 자동차수리? 테이블 : 가구? 자료? 재규어 : 짐승? 자동차? 단어의의미를명확히하기위해문서들을분석하고, 개념을정리문맥에따라결정 개념기반질의개념기반질의의장점 : 개념이있으면, 다른언어로도질의가능 계층구조화 : 내포와외연으로범위축소및확장 13
7.1 개요 실례 2 외국행사에참여하려고호텔을예약하려한다. 대책행사장 : 행사사이트에, 호텔 : 호텔사이트에 - 행사장에서가까운 A급호텔과의거리는? - 호텔에서의교통수단은? 시간과가격은? 실례 4 환자의진료기록과응급치료 14
7.1 개요 실례 3: 기존의휴가계획관광지선정후호텔예약, 교통예약신휴가계획 ( 휴가일정 + 개인기호 ) 를입력하면, 자료의의미를파악하고, 웹상의정보를해독하여일정을제시하고, 선정하면예약전제관광정보, 숙박정보, 비행기및운송정보 분산화 15
7.2 XML 기존웹의문제점 HTML의스키마부재구조화된자료표현곤란 프로그램이 HTML 문서를이해하기곤란. 문서내부의자료구조표현곤란 일반응용곤란 ex. Display는가능하나저자의이름과성을구분하기곤란 복잡한문서교환에부적합. 실례 : 전자상거래사이트. 주로 DB 작업 동적페이지대두 16
7.1 개요 문제점과대책 HTML: 프로그램이이해곤란자료구조표현 : 내부구조표현곤란복잡한문서 : 교환곤란 Semantic Web HTML XML RDF Ontology 구조문제해결의미문제해결개념문제해결 17
7.2 XML Def. 웹상에서구조화된문서를구현할수있는표식언어. 1996년 W3C: HTML의한계극복을위해제안. 특징검색용이, 체계적이고일관적인접근, 재가공용이. 문서의구조적인정보만기억 간단하게조작하기곤란. 용도현재 B2B의문서양식으로사용. 소규모 DB를대체. 18
7.2 XML 정의 - 웹에서문서를구조화하고전송할수있는표식언어. - HTML의문서표현과 DBMS의스키마기능을통합한도구. 기능어떤문서도태그를이용하여조직가능. HTML 문서와 DB 스키마사이를연결. XML의특징 : 1) Tag로자료에대한구조제공 : DB화가능, self-documenting 2) 구조와내용의분리 : 효율적검색, 중첩구조허용 3) 정확한내용전달 : 정보교환및자료공유용이, 4) 문서작성간편 5) 사용자 Tag: 무제한정의, 비고정적형식 19
7.2 XML HTML 과 XML 비교 구분 HTML XML 태그 고정식, 제한적 사용자정의 의미부여 정보표현단순표현정보의내부구조표현 Database 연계 속성구분곤란 속성별로저장, 교환과공유가능 검색효율비효율적구조와내용을분리 효율적 장점쉽고간결복잡한문서작성편리 20
7.2 XML XML의목표 : 1) SGML과호환,, 2) XML 프로세서를작성하기쉬워야,, 3) 설계가용이해야 : 형식적이고정교해야,, XML의구조 : 1) HTML과비슷하게보여야 2) 엘리먼트라불리는사용자-정의태그의계층구조 3) 자료 : 엘리먼트로기술, 엘리먼트 : 속성으로기술 21
7.2 XML HTML 과 XML 문서 <HTML> <HEAD></HEAD> <BODY> <font size=3> 과학 <p> 정보검색 </p> <p> 도서출판그린 </p> <p> 2009 년 4 월 </p> </font> </BODY> </HTML> <?xml version="1.0" encoding="euc-kr"?> < 과학 > < 제목 > 정보검색 </ 제목 > < 출판사 > 도서출판그린 </ 출판사 > < 출판일자 >2009 년 4 월 9 일 </ 출판일자 > </ 과학 > 22
7.2 XML 실례 <HTML> <HEAD></HEAD> <BODY> <font size=3> 제품정보 <p> 배 </p> <p> 나주시 </p> <p> 1 </p> <p> 56000 </p> </font> </BODY> </HTML> <?xml version= 1.0 encoding= utf-8? > < 제품정보 > < 과일 > 배 </ 과일 > < 생산지역 > 나주시 </ 생산지역 > < 수량 > 1 </ 수량 > < 가격 > 56000 </ 가격 > </ 제품정보 > HTML: 디스플레이용언어 * XML: 표준화작업과자료보관용언어 23
7.2 XML 문서구조 XML 문서 = Prolog + Body Prolog: XML 문서에대한정보를기술 PI, DTD, XML 스키마등으로구성 Body: 문서기술부분. 여러요소element들로구성 XML 문서의구성요소 - PI Processing Instruction - comment - element - attribute 24
7.2 XML XML 문서의구성요소 <?xml verion= 1.0" encoding= euc-kr?> <!-- BODY (This is Comment) -- > Prolog: PI < 제품정보 > < 과일종류 = 배 > < 생산지역 > 나주시 </ 생산지역 > < 수량 > 1 </ 수량 > < 가격 > 56000 </ 가격 > Root element comment attribute </ 과일 > element </ 제품정보 > 25
7.2.2 XML 문서구조 : DTD DTD : Document Type Definition SGML, XML 표식언어에서문서형식을정의하는양식 <!ELEMENT 책 ( 저자, TITLE)> <!ELEMENT 저자 (#PCDATA)> <!ELEMENT 제목 (#PCDATA)> <!ATTLIST 책 GENERE ( 과학 소설 ) #Required> < 책 GENERE=' 소설 '> < 저자 > 허균 </ 저자 > < 제목 > 홍길동 </ 제목 > (a) DTD 실례 (b) DTD 에의한 XML 문서 26
7.2 XML 문서구조 : XML Schema XML Schema DTD의한계 - DTD는구현이어렵다. - DTD는제한된자료형만제공된다. - DTD는재사용성과확장성이불가능하다. 스키마문서의물리적구성 schema, element, attribute와주석문기본형식 <xs:schema xmlns:xs= http://www.w3.org/2002/xmlschema > </xs:schema> 27
7.2 XML 문서구조 : XML Schema XML Schema Def. XML 문서가표시되는방식을정의하는도구. DTD와함께 XML 문서의구조를정의하는표준 특징 : 별도의구문분석기가필요없고, 다양한자료형을제공. 필요성 : DTD 는구문분석기필요, 다양한자료형요구 <xs:schema xmlns:xs= http://www.w3.org/2002/xmlschema > targetnamespace=http://www.gachon.ac.kr elementformdefault= qualified attributreformdefault= unqualified > </xs:schema> 28
7.2 XML 문서구조 : XML Schema XML Schema 실례 <complextype name=" 강사 "> <sequence> <element name=" 성 "type="string" minoccurs="1"/> <element name=" 이름 "type="string" minoccurs="1"/> </sequence> <attribute name=" 제목 type="string use="optional"/> </complextype> 29
7.2 XML NameSpace 동일한이름충돌방지기술 접두사기본형식 : <prefix:elementname xmlns:prefix=url> <?xml version= 1.0 encoding= euc-kr?> <Cus:User xmlns:cus= http://www.pop.com/buy/cus xmlns:order= http://www.tech.net/2002 > <Cus:ID> working-girl</cus:id> <Cus:Name> 소유춘 </Cus:Name> <Cus:Goods> <Order:Good> <Order:ID>2008-098</Order:ID> <Order:Name>NoteBook</Order:Name> </Order:Good> </Cus:Goods> </Cus:User> 30
7.2 XML : XSL XML 문서 : 자료를저장하는구조적인문서. XSL XML 문서를표현하기위한스타일을정의하는언어. XML의특징 : 문서의구조를나타내는부분과표현하는부분을분리. 문서구조를변경하지않고표현만달리할수있음. 31
7.2 XML : XSL XML 문서의표현 XML은문서의구조를기술하는방법과표현하는방법이다르다. XML 문서는 HTML로변환되어야표현된다. XML 문서. XSL 프로세서 (msxml) HTML 문서 Display XSL 문서 32
7.2 XML : XSL XML 문서 : 자료를저장하는구조적인문서. XSL XML 문서를표현하기위한스타일을정의하는언어. XSLT: Transformation. XML 문서를다른문서로변환하는방법을정의 XSL-FO : Formatting Object. XSLT 결과로나온문서를다양한형식으로바꾸는처리 ( 문서표현을정의 ) XSLT XSL XSL-FO 33
7.2 XML : XSL XSL 문서의문법 XML 문서를표현하기위한스타일을정의하는언어. xsl:stylesheet: xml 문서가스타일시트임을알려주는 XSL의루트. xsl:template: 변환규칙정의 xsl:apply-template: xsl:template 에서지정한자식노드중에서 특정노드가선택되도록하기위해서기술한다. 34
7.2 XML : XSL XSL 문서 xsl:stylesheet: xml 문서가스타일시트임을알려주는 XSL 의루트. xsl:template: 어느부분을어떻게변환할것인지를결정. xsl:apply-template: xsl:template 에서지정한자식노드중에서특정노드가선택되도록하기위해서기술. <xsl:stylesheet xmlns:xsl=http://www.w3.org/1999/xsl/transform version= 1.0 > < xsl:template match= 패턴 > // 변환규칙정의변환할내용 < /xsl:template> 35
7.2 XML : XSL XSL 의예제 c:\xml\test.xsl ---------------------------------------- <?xml version="1.0" encoding="euc-kr"?> <xsl:stylesheet xmlns:xsl= http://www.w3.org/1999/xsl/transform" version="1.0"> <xsl:template match="/ 제품 / 자동차 "> <h3> * 자동차목록 * </h3> <xsl: apply-templates select=" 모델명 "/> </xsl:template> < xsl:template match=" 모델명 "> <h5> 모델명 : <xsl:value-of select="."/> </h5> </xsl:template> </xsl:stylesheet> ---------------------------------------- 36
7.2 XML : XSL XSL 의예제 c:\xml\test.xml --------------------------------------- <?xml version="1.0" encoding="euc-kr"?> <?xml:stylesheet type="text/xsl href="test.xsl?> // XSL 문서적용을위함 < 제품 > < 자동차 > < 모델명 > 그랜저 TG</ 모델명 > </ 자동차 > < 자동차 > < 모델명 >NF 소나타 </ 모델명 > </ 자동차 > </ 제품 > 37
7.2 XML : XSL XSL 을실행한결과 ---------------------------------------- * 자동차목록 모델명 : 그랜저 TG * 자동차목록 모델명 : NF 소나타 38
7.2 XML XML 의단점 for Semantic web 구조표현, 그러나의미파악곤란 - 태그이름은다르나내용이같을경우 - 이름은같으나내용은상이상호운영성 : 두태그이름이같은의미를가진다는표현 <heading>, <subject> - 같은내용을구조가다르게표현한경우 ex. <date>12/11/2009</date> <day>12</day> <month>11</month> <year>2009</year> 39
7.3 RDF resource description framework RDF의필요성 XML은자료를구조화할수있으나자료의의미를전달하지못함 의미문제점해결 RDF는리소스, 특성, 서술문구조로구성되므로같은내용에대해서같은해석이가능하다. 단, 태그이름의중첩성과모호성은여전히존재대책 : 온톨로지, RDF schema : 온톨로지가보다일반적이고확장된개념 40
7.3 RDF Resource Description Framework XML 의문제점 <party name=" 활빈당 > <chairman> 홍길동 </chairman> </party> (a) XML 1 <chairman> 홍길동 </chairman> <party name=" 활빈당 > </chairman> (b) XML 2 XML 의두가지애매한표현둘중에서어느것이더정확한표현인가? 41
7.3 RDF resource description framework 정의 : -정보의특성과값을명세하여정보간의관계를기술하는도구. -특정자원의메타데이터를기술하는 XML 기반의 framework. -웹자원에관한메타정보를표현하기위한언어. 웹문서에관한메타자료를 XML을기반으로간단하게표현. 선언적문장 <S,P,O> 들의모음. <S,P,O> 은정보의기본단위. 용도 - 정보검색, - 문서분류 - 지능형에이전트 - 기타 : 등급표시, 선호도표현,,, 42
7.3 RDF Data Model Def. - 메타자료의일관적인인코딩과교환, 작성을지원하는표 현모형. - 자원을 ( 주체, 술어, 개체 ) 의 3 요소로정의. 정보자원 Resource 구조 / 자원 / 주체 Http://www.kwu.ac.kr/c 저자 omputer/database.xml 속셩유형 Property Type 특성 / 술어 Http://www.google.co m/hanhwa/node.htm 속성값 Value 값 / 객체 Http://www.naver.com/ chemical/main.htm (a) RDF 자료모형 a (b) RDF 자료모형 b (c) RDF 자료모형의실례 43
7.3 RDF 구조 RDF 자료모델 : 정보자원의특성과값을명세함으로써자원간의상호관계를기술하는모델. 구성요소 내역 실례 1 일반온톨로지 실례 2 - 웹온톨로지 - 자원 Resource 주체 subject 데이터베이스 www.kwu.ac.kr/computer/database.xml 속성 Property 술어 predicate 저자 dblab.kyungwon.ac.kr/1.2/author 속성값 value 객체 object 홍길동 dblab.org/cs/professor/58603 * Hong, kil-dong 44
7.3 RDF Data Model RDF: 자원을 ( 주체, 술어, 개체 ) 의 3요소로정의 - 아버지가방에들어가신다. - 박태환의나이는 21세다. - 한국의수도는서울이다. 아버지 박태환 한국 들어가신다 21 서울 가방 나이 수도 45
7.3 RDF Data Model RDF 문장의실례 <rdf: RDF> <rdf:description about="http://www.ksii.or.kr/paper"> <s:publisher> Korean Society of Internet Information</s:Publisher> <s:title> Internet Information thesis</s:title> <s:date>2011-10-01</s:date> </rdf:description> </rdf:rdf> 46
7.3 RDF RDF 웹상의자원을 XML 형식으로메타데이터를표현. 객체지향방식으로지식을표현객체-속성-값의구조를갖지만객체중심이아니라속성중심. RDF schema: 특정한메타자료에서정의하고있는어휘들을선언하기위해사용. 정보자원의특성과다른자원과의관계정의. * RDF 는기존 meta-data 에대한정보만표현하기때문. 47
7.3 RDF Structure Resource (subject) : http://www.bookstore.org/id2009 Property (predicate) : http://www.schema.org/#author Value (object) : "Taehee Kim <rdf:rdf> <rdf:description about= http://www.bookstore.org/id2009 > <s:author> Taehee Kim </s:author> </rdf:description> </rdf:rdf> http://www. bookstore.org/id2009 s:author Taehee Kim RDF 데이터모델의구조 48
7.3 RDF RDF 예제 1 <rdf: RDF> <rdf:description about= http://www.w3c.org > <s:publisher> World Wide Web Consortium</s:Publisher> <s:title> W3C Home Page</s:Title> <s:date>2009-10-01</s:date> </rdf:description> </rdf:rdf> Serialization: RDF 를 XML 로표현한것. 49
7.3 RDF RDF 예제 2 <?xml version= 1.0?> <rdf: RDF> xmlns:rdf= http://www.w3c.org/2009/10/01 > xmlns:s= http://description.org/schema/ > <rdf:description about= http://www.w3c.org/home/lassila > <s:creator> Ora Lassila</s:Creator> </rdf:description> </rdf:rdf> Ora Lassila is the Creator of the resource http://www.w3c.org/home/lassila 50
7.3.2 RDF Schema 사실표현 : RDF Schema의필요성 1) 홍길동이인공지능을강의한다. 2) 공학관이안철수를강의한다. 3) 인공지능이안철수를강의한다. 4) 공학관이인공지능을강의한다. 여러가지문장의모순을방지하는방법은? 주어가될단어와목적어가될단어의구분 51
7.3.2 RDF Schema RDF Schema 1) 자원의클래스를지정하는도구 ( 어휘정의능력지원 ) 2) 새로운용어를정의하는도구. 3) 정보자원의특성선언과다른자원과의관계를정의하는도구 정의역 관계 치역 RDFS RDF 주체 술어 객체 52
7.3.2 RDF Schema 계층적 Class 관계도 교직원 교원 직원 전임비전임정직원임시직 교수 강사 RDF 와 RDFS 의계층구조 subclassof 교직원 subpropertyof range 관계하다 교원 subclassof 전임 domain 강의하다 range range 교수 subclassof type 이철수 type 강의하다 type 보안 과목 RDFS RDF 53
7.3.3 RDF 의장단점 RDF의장점 - XML: 여러가지표현방법 애매 - 객체의의미를하나로만표현하므로명확. - URI를이용하여웹자원표현에적합 RDF의단점 - XML의모호함이적지만여전히존재같은 tag가여러가지용도로사용 RDF 스키마의문제점 - 동의요소, 역관계, union, intersection 등주요관계표현곤란 54
7.3.3 RDF 의장단점 RDF의대책 RDF schema: 특성에대한정의와사용상의제약사항기술. RDF 문의단어정의, 단어에대한세부적인의미기술자원이소속하는 class 정의및속성정의 RDF의용도정보검색문서분류지능형에이전트기타 : 등급표시, 선호도표현 55
7.4 온톨로지 Ontology Def. - 담론에의하여합의된정보를기계가다룰수있는형태로표현한모델. - 개념의형태, 사용상의제약조건을명시적으로정의한기술. - 특정한영역에속하는개념과, 개념사이의관계를기술하는정형화된어휘집합. ** 공유된개념과이들의관계를명확하게정형화한명세. 실례 : 생물과생물사이의종의관계. 단어들사이의관계용도 : 추론. 형태 : 정형언어로기술된어휘의집합 56
7.4 온톨로지 Ontology 온톨로지개념의 3 각관계 나무 에대한생각 Ontology Concept 기의 (signifie) 나무 라는표현 Thesaurus Term Symbolized Stand for Refers to 실존하는 나무 Object 개체 기표 (Signifiant) 실물 개념, 용어, 존재물의 3 각도 57
7.4 온톨로지 Ontology 존재와의미와표현의관계 : 표현 정신세계 실물세계 비고 시소러스 온톨로지 객체 시맨틱웹 용어 개념 개체 문자검색 기표 기의 실물 구조언어학 소리, 글 표상 시각, 청각, 촉각 현실 58
7.4 온톨로지 Ontology 형태 : 단어와관계들로구성된사전. 특정도메인에관련된단어들을계층구조로표현. 확장가능한추론규칙포함. 구조 : 단어계층 : 계층분류 ( class, subclass, relationship) 추론규칙 : 계층구조확장기능 사자? 호랑이? 고양이 포유류 동물 IS-A 관계, Instance-of 관계 59
7.4 온톨로지 Ontology 어원 : 존재의본질과유형에관한이론 Def. 1) 공유된개념화에대한정형화되고명시적인명세 (Gruber) 2) 해당영역의개념들과이들개념들간의상호관계를설정 3) 낱말에대한뜻과각낱말사이의관계를잘설명한것 ( 사전, 체제 ) 4) 존재하는현상에대해공유하고있는개념을명확하고명시적으로규정하는것 5) 단어와관계들로구성된사전. 6) 일종의지식표현. 60
7.4 온톨로지 Ontology Def. 공유된개념과이들의관계를명확하게정형화한명세. 용어 내역 비고 공유 정보의의미를합의하여공통적으로사용 공용성 개념화 사물의공통점을집합으로묶고분류 분류 명확성 개념들의종류, 관계, 제약조건을정의 정확성 정형화 기계가정보를읽을수있는형식정의 형식화 명세화 개념내용을상세하게기술 상세한기술 61
7.4 온톨로지 Ontology 구성요소 구성요소내역비고 클래스정보자원에부여하는이름 컴퓨터, 사랑 관계클래스간에존재하는연결성 is-a 관계, 인스턴스관계 속성클래스나인스턴스의특정한성질 ( 값 ) hassize TV 의크기는 42inch 인스턴스정보자원의구체적인사례 LG 3D 42 LCD TV 정보자원 : 사물이나개념 62
7.4 온톨로지 관계 1) 개념관계 : 분류특성 IS-A 관계 : 일반화 ( 개념화 ), 특수화자손들의공통적인속성이루트가되고, 뿌리의속성을구체화한것이자손. Instance-of 관계 : 객체를이루고있는여러사례 ( 실체 ) 중의하나자손들은실체이므로식별가능하게구체성이있어야한다. 2) 비개념관계 cause 관계 : 원인과결과 hassize 관계 : 특성표현 63
7.4 온톨로지 클래스와인스턴스들사이의관계 동물 건강 사자늑대곰 운동식사업무 (a) is-a 관계 (b) cause-of 다리 자동차 한강교양수교잠수교 (c) Instance-OF 관계 엔진차체바퀴 (d) part-of 64
7.4 온톨로지 관계의종류 관계 내역 비고 is-a 요소들의개념을일반화 ( 특수화 ) Instance-OF 개념을실체로구체화 구체적인실물 cause-of part-of 원인과결과를연결 부분이모여서전체를완성 65
7.4 온톨로지 Ontology 의구성요소 1) Class or Concept: 영역또는일에대한개념단위. 사람, 대학 * Axiom: 공리. - 모든사람은이름이있다. 2) Relation: 클래스나인스턴스들사이의연결내용 * isa 관계 : 포함관계. 사람은동물이다. * cause 관계 : 운동하면건강하다. - Function: 잘정의된관계. - 홍길동의아버지이름은 3) Instance: 사물이나개념의구체적인사례. ex. 경원전자 HappyCam 518W 모니터 4) Property: 클래스나인스턴스의특정한성질, 성향 ex. 경원전자의 HappyCam 21W 는 42 인치다. hassize 66
7.4 온톨로지 Ontology 의구성요소 - designer work job employee isa consult design support engineer 원자로 자동차 Class isa SUV Class Instance-of Sportage Instance hassize 4,440m m (a) 공사온톨로지스키마 (b) 자동차온톨로지스키마 67
7.4 온톨로지 Ontology 구축절차 순서 단계별작업 내역 1 범위와목적 온톨로지구축범위와목적을명세 2 개념화 주제영역의핵심개념정리 3 범주화 주제영역의단어들을분류 4 클래스정의 계층에있는기본적인단어들을분류 5 속성정의클래스간의관계정리및상세하게속성을정의 6 Facet 정의제약조건과같은상세한속성들을정의 7 인스턴스정의온톨로지언어로인스턴스생성 8 검증기술적측면에서불일치여부검토 68
7.4 온톨로지언어 OWL Ontology Web Language Def. 온톨로지를발간및공유하기위한시맨틱웹생성언어. 웹온톨로지와그에관련된지식을정의하는언어. -추론시스템에축적된명제들을정의 -클래스와그구성원간의관계를기술 DAML+OIL: 웹리소스에대한시맨틱마크업언어 W3C 표준안. RDF의확장언어로시작. 웹검색, SW agent 및지식관리기능제공. 구문적으로정의되지않은사실의논리적유추를가능하게하는클래스및속성과이에적용할수있는제약사항의 집합으로구성 69
7.4 온톨로지 Ontology 언어 온톨로지를표현하기위해스키마와구문구조정의 DAML+OIL: 웹자원에대한마크업언어 Rdf의단점을보완해온톨로지를구축하기위한확장언어 OIL: 정보를추론하고통합하기위한도구 OWL: DAML+OIL 기반으로온톨로지의공유와출판목적의 ML 적용분야 - 인공지능 : 지식표현과활용 - 정보검색 : 용어모음, 동의어사전 - 유비쿼터스 : 작은무선기기들의네트워크형성 - 전자상거래 : 다양한상거래개념처리 70
7.4 온톨로지 기존도구의문제점과 OWL 기능 구분종류내역 HTML 사용자태그의한정과문서표현력부족 기존 도구 XML RDF 정의된메타자료요소와다른요소와의관계표현곤란 클래스와속성의명확한정의, 클래스와클래스의관계그리 고속성과속성의관계를규정하지못함 RDFS 동의요소, 역관계, 합집합, 교집합등의주요관계표현곤란 OWL 온톨로지언어구조재정립 71
7.4 온톨로지 자동차온톨로지실례 Car Bus SUV Engine Sportage Assembler Puma 72
7.4 온톨로지 온톨로지클래스를위한 OWL 코드 구분내역 OWL 코드 1 2 3 클래스정의부클래스정의최하위클래스정의 <owl: Class rdf:id="car"/> <owl: Class rdf:id="bus"/> <owl: Class rdf:id="suv"/> <owl: Class rdf:id="sportage"/> <rdf:subclassof rdf:resource="#suv"/> <owl: Class rdf:id="puma"/> <rdsf:subclassof rdf:resource = "#Sportage"/> <rdfs:label xml:lang='en'>puma</rdfs:label> <rdfs:label xml:lang='fr'>cougouar</rdfs:label> <owl:class> 73
7.4 온톨로지 구성원및속성정의 순서구분 OWL 코드 1 2 구성원정의속성정의 <Bus rdf:id="engine"/> <owl:thing rdf:id="bus"/> <owl:type rdf:resource="bus"/> <owl:objectproperty rdf:id="madebyassembler"/> <rdfs:domain rdf:resource = "#Puma"/> <rdfs:range rdf:resource = "#Assembler"/> </owl:objectproperty> 74
7.4 온톨로지 Ontology와추론 If Employee Park isallowedtoread Sales Report B AND Employee Kim issupervisorof Employee Park THEN Employee Kim isallowedtoread Sales Report B 직원 isallowedtoread 문서 Is-A Is-A Is-A Is-A Kim 방재보고서 사업보고서 issupervisorof Park isallowedtoread isallowedtoread 영업계획서 Instance-of hastitle B (a) 온톨로지의클래스관계 75
7.4 온톨로지언어 온톨로지추론과정 전제 1 IF 직원 Park isallowedtoread 영업계획서 B 전제 2 AND 직원 Kim issupervisorof 직원 Park 결론 THEN 직원 Kim isallowedtoread 영업계획서 B (b) 3 단논법에의한추론 76
7.4 온톨로지언어 SWRL: 온톨로지추론언어 SWRL 실례 : [ 그림 7.22] 의추론절차 employee(?p) isallowedtoread(?p, B) employee(?k) issupervisorof(?k,?p) -> isallowedtoread(?k, B) 77
7.4 온톨로지 Ontology 와추론 78
7.4 온톨로지 Ontology 와추론 79
7.5 시맨틱웹 Def. - 컴퓨터가정보자원의뜻을이해하고, 논리적추론까지할수있는차세대지능형웹. - 분산환경에서자원에대한정보와자원사이의관계-의미정보를기계가온톨로지형태로표현하고처리할수있는기술 ( 프레임워크 ) - 컴퓨터가정보의의미를이해하고의미를조작할수있는웹. 정보의의미를명세화하여자료의의미망을기계가처리할수있는웹. 이해 : 웹에서새정보발견시기존의정보와관련시킬수있 어야 80
7.5 Semantic Web Def: - 자료의개념, 유사성, 상관관계등의의미를파악하여결과물을생성하여제공하는웹. - 컴퓨터가정보의의미를이해하고논리적추론까지하는웹. - 기계가정보를읽고이해하고정보를만드는웹 - 기계가질의와저장정보를이해하고두개를연결하여적합한결과를제공하는웹 - 생각하는웹 - 자료의웹 81
7.5 시맨틱웹 시맨틱웹과기존웹의비교 구분월드와이드웹시맨틱웹 제안자 ( 제안기관 ) 1989, Tim Berners-Lee 2004, Dale Dougherty(web 2.0) (ISO) 1999, Tim Berners-Lee (W3C) 검색주체인간기계 ( 프로그램 ) 자료연결비형식적의미적, 형식적 검색기능단어수준의검색의미적연결관계와추론검색 키워드오류시검색불가의미적추론으로검색 연관정보키워드의의미와연관정보부재관계에의한연관정보브라우징 주요기술 Folksonomy, Wiki, Ajax, RSS 온톨로지, RDF 주요기능사용자중심 ( 개방, 공개, 참여 ) 기술중심 ( 지능형에이전트 ) 82
7.5 Semantic Web 시맨틱웹이필요로하는기능 : 1) 조직과어플리케이션에걸친자료를상호운영할수있다. 2) 지식교환을위하여상호운영표준체계를지원한다. 3) 공동체와어휘의상호연결구조를지원한다. 83
7.5 시맨틱웹 Semantic Web 의목표 구분 시맨틱웹의목표 1 검색시정확한결과를도출한다. 2 이질형자료와쉽게통합하고비교할수있다 3 모든자료에의미와기술정보를연관시킬수있다 4 웹서비스를자동화할수있다 84
7.5 시맨틱웹 정보관리에대한고민 - 인간의지식을어떻게온전하게표현하고공유할것인가? > 추상적개념, 경험, 지식을어떻게표현 / 전달 / 저장 / 공유하나? > 사람, 컴퓨터간에명확한의사소통은어떻게가능한가? 논리세계에서표현하는언어 - 논리언어 : woman = person female - 규칙언어 : if then else - 시각언어 : car engine - tile - 자연언어 : 85
7.5 시맨틱웹 Semantic Web의구조주요구성요소 1) 자원서술 XML, RDF: RDF는메타언어기능의 XML로표현가능 2) 지식서술온톨로지 : 용어들간의관계를표현하는컴퓨터판독가능규정 3) 통합운용 agent: 인간을대신하여정보자원을수집, 검색, 추론하고온톨로지를이용하여다른 agent와정보를교환하는지능형 프로그램. 86
7.5 시맨틱웹 Semantic Web Layer Cake 1: 자원서술 & 식별체계 2: 정보전달 & 표현형식 3: 의미연결, 의미표현 4: 온톨로지기술 5: 추론 6: 증명 7: 신뢰성 8: 보안 출처 : W3C, 2007 질의 : SPARQL 자료교환 : RDF 사용자인터페이스와응용 통합논리 온톨로지 : OWL RDFS URI / IRI 증명 XML 신뢰 규칙 : RIF 암호화 87
7.5 시맨틱웹 Semantic 기술적용분야 지식정보검색 지식관리시스템 시스템통합 시맨틱기술과추론 멀티미디어정보처리 유비쿼터스컴퓨팅 의미기반전자상거래 시맨틱커뮤니티블로그 88
7.5 시맨틱웹 Semantic Web Service의진화 Semantic web과 Web2.0은자연스럽게차세대웹기술로통합. 정보자원 지식 Semantic Web KnowledgeWeb Application Semantic Web Service 분산서비스 서비스 Web Service SOA 웹서비스 : 인터넷에서 XML 자료를주고받는인터페이스 SOAP, WSDL, UDDI 를이용. 89
7.5 시맨틱웹 Semantic Web의미래 Semantic web의현재발전속도 : slow 복잡도 : too complex 표준화 : not easy 해결할문제점 1) 기반기술 : RDF, OIL, DAML,,, 부족 2) 언어관계 : not easy 3) 표준화 : not easy 90
7.5 시맨틱웹 Semantic Web 의방향 고급웹 : 다양한도메인의지식처리 종합적의사결정지 원. 지식연결과추론 Web 3.0 Semantic Web (2005-2020) Ontologies Web 4.0 Ubiquitous Web (2015-2030) Semantic Wikis Web 1.0 The Web (1990-2000) Databases Web 2.0 The Social Web (2000-2010) Wikis 사회적연결성 91
7.6 요점정리 시맨틱웹컴퓨터가정보를이해하고추론할수있는웹. 웹1.0 사용자가정보를읽을수만있는웹. 웹2.0 사용자가정보를읽고쓸수있으므로공유와참여가가능. 웹3.0 컴퓨터가정보의의미를이해하고처리할수있는웹. HTML의문제점과대책의미파악곤란. XML, RDF, ontology, semantic web XML 웹상에서구조화된문서를구현할수있는표식언어. 92
7.6 요점정리 XML의특징 tag로문서구조화, 구조와내용분리, 무제한사용자 tag,, XML의문서구성 Processing Instruction, comment, element, attribute. DTD XML 표식언어에서문서형식을정의하는양식 DTD의한계구현난이, 제한된자료형만제공, 재사용과확장불가,, XML Schema : DTD 한계극복 XML 문서가표시되는방식을정의하는도구. 93
7.6 요점정리 XML schema 의특징 구문분석기가필요없고, 다양한자료형제공 XML Namespace 접두사로동일한이름충돌방지기술 XSL XML 문서를표현하기위한스타일을정의하는언어. XML의단점 for Semantic web 구조표현, 의미파악곤란 RDF 정보의특성과값을명세하여정보간의관계를기술하는도구. RDF Data Model 메타자료의일관적인인코딩과교환, 작성을지원하는표현모형. 94
7.6 요점정리 RDF schema: 특정한메타자료에서정의하고있는어휘들을선언하기위해사용. RDF는자원특성정의, 자원간관계정의기능이없기때 Ontology 공유된개념과이들의관계를명확하게정형화한명세 (Gruber). 미리합의된정보를기계가다룰수있는형태로표현한모델. Ontology 구성요소 클래스, 관계, 속성, 인스턴스 OWL Ontology Web Language 95
7.6 요점정리 SWRL 온톨로지를이용한추론언어. 시맨틱웹컴퓨터가정보자원의뜻을이해하고, 추론까지할수있는웹. 96
7.6 익힘문제 세문제를선택하여해법을제시하시오. 97