RDA 를기반으로한국가서지데이터의 FRBR 모형연구 연구책임자 : 김정현 ( 전남대학교문헌정보학과교수 ) 2014. 10.
국립중앙도서관출판예정도서목록 (CIP) RDA 를기반으로한국가서지데이터의 FRBR 모형연구 / 연구주관 : 국립중앙도서관 ; 연구수행 : 전남대학교산학협력단 ; 책임연구원 : 김정현 ; 공동연구원 : 이성숙, 이지원. -- [ 서울 ] : 국립중앙도서관국가서지과, 2014 p. ; cm FRBR 은 "Functional Requirements for Bibliographic Records" 의약어임 RDA 는 "Resource Description and Access" 의약어임참고문헌수록 ISBN 979-11-5687-069-2 93020 : 비매품 목록규칙 [ 目錄規則 ] 서지기술 [ 書誌記述 ] 024.3-KDC5 025.3-DDC21 CIP2014031610
제출문 국립중앙도서관장귀하 이보고서를 RDA 를기반으로한국가서지데이터의 FRBR 모형연구 의최종보고서로제출합니다. 2014. 10. 28. 연구수행기관 : 전남대학교산학협력단책임연구원 : 김정현교수 ( 전남대학교문헌정보학과 ) 공동연구원 : 이성숙교수 ( 충남대학교문헌정보학과 ) 이지원교수 ( 대구가톨릭대학교도서관학과 ) 연구보조원 : 이유정박사 ( 영남대학교중앙도서관 ) 문지현박사 ( 전남대학교문헌정보학과 ) 강미희박사 ( 전남대학교문헌정보학과 )
목차 제 1 장연구개요 7 1. 연구필요성및목적 7 2. 연구내용 8 3. 연구방법 9 제2장 FRBR, RDA, MARC의이론적배경 0 1 1. FRBR 11.3 2. RDA 15 3. MARC 22 4. FRBR, RDA, MARC의매핑 6 2 제3장 FRBR 및 RDA 적용사례분석 4 3 1. FRBR 알고리즘에대한논의개요 4 3 2. 기존 FRBR 알고리즘비교 64 제4장 FRBR 및 RDA의알고리즘설계 1 5 1. 알고리즘설계원칙및방법 15 2. 실험데이터선정및분석 51 3. 알고리즘설계 61 제5장 FRBR 및 RDA의알고리즘구현 6 6 1. 검색결과 66 2. 검색및검색결과화면구성 17 제 6 장결론및제언 75 참고문헌 77-5 -
제 1 장연구개요 1. 연구필요성및목적 미국의회도서관의 B.B. Tillett은 만약도서관을계속존속시켜야한다면, 우리는도서관을이용자의요구에부합하는것으로해야한다. 점점더많은서비스가웹에존재하게되고, 정보자원에관하여필요한것은모두웹에있다고많은사람이기대하고있다 라고하면서오늘날도서관의어려운환경을대변하고있다. 도서관은웹상에서의존재감을얻기위해큰진전을이루었지만, 오래된카드목록의전자버전을제공하고있는것에불과한도서관도많다. 소장자료를열거하고선형적으로단순하게나타내고있는목록접근은기술된자원의디지털버전에대한링크를포함하는경우가있지만, 일반적으로다른관계자원이나그것을뛰어넘어기계처리가가능한연결은제외하고있다. 기술사항의단순나열을하고있는목록방법에서컴퓨터시스템이이해할수있는식별특성과개인, 가족, 단체및다른자원과관계표시에의한자원기술로확장할필요가있다. 그렇게함으로써, 이용자는필요한정보를빨리얻기위하여링크된대체자원의내용을검색할수있다. 그것은또한목록작업을쉽게하기위해더나은시스템에이르게도된다. 1990년대이후목록과관련하여이러한문제들을제기하면서 AACR2가 21 세기에는더이상유용한규칙이아니라는우려를하기시작했다. 이러한위기의식을바탕으로 JSC(Joint Steering Committee for Development of RDA) 는그동안수많은노력과시행착오를거듭하면서 Panizzi, Cutter, Lubetzky 등의선각자로부터파리원칙과국제목록원칙규범, FRBR 및 FRAD에이르기까지전통을계승하여마침내 RDA라는새로운규칙을제정하였다. RDA가제정되자마자 2013년 3월부터 LC와 OCLC를비롯한많은도서관들이 RDA를적용하기시작하였으며, 조만간이들의서지레코드가국내에도반입될것이다. 또한일본의경우 2010년부터 RDA를반영하여목록규칙을전면개편하기시작하였다. 이와같이 FRBR은자료의다양성과목록의관계성을수용하는이용자지향적모형으로서이미전세계목록계의변화를주도하고있으며, 이를수용하는새로운목록규칙인 RDA가발표되어널리활용되고있다. 또한우리목록환경에서이러한변화가능동적으로수용될수있도록표준지침과실제검색시스템에관하여연구하여야하며, 특히국가대표도서관인국립중앙도서관의서지레코드를대상으로직접실험하여우리현행목록체계에 FRBR 모형을접목한구체적인사례를제시할필요가있다. 따라서이연구는 FRBR 모형과 RDA를적용한자료검색알고리즘을설계하여국립중앙도서관의서지레코드를대상으로직접실험해봄으로써장차국립중앙도서관의국가서지작성과관련하여 RDA 적용을위한기초자료를제공하고자한다. - 7 -
2. 연구내용 이연구는크게 RDA 의국내적용을위한기반연구와 RDA 및 FRBR 모형을적용한자료 검색알고리즘설계의두가지로구분할수있다. 첫째, RDA의국내적용을위한기반연구 RDA의국내적용을위한기반연구를위해서는다음과같은연구를수행한다. 1 RDA의개정및업데이트내용을포함하여본문전체를다시검토수정보완함으로써명실상부한 RDA 한글판본문을완성한다. RDA는 2008년초안이완성된이후, 2010년에 RDA 초판이발행되었다. 이후 2012, 2013, 2014년도에각각업데이트됨으로써 2008년의초안에비하면상당부분내용이수정보완되었다. 따라서이들내용을모두반영하여한글판을완성해야한다. 기존의한글번역은 2008년의 RDA 초안이며, 부록과용어집, 색인등이작성되어있지않다. 2 기존에번역되지않은부록과용어집을번역하고, 한글색인을새로이작성한다. 그동안세차례에걸쳐업데이트된부분까지반영하여부록 A L과용어집을전면번역한후, 최종적으로한글색인을작성하여 RDA 한글판을완성한다. 둘째, RDA와 FRBR 모형을적용한자료검색알고리즘설계 1 국립중앙도서관소장문학류 (1910~2013년발행 ) 단행본약 20만종을실험대상으로한다. 문학류가다양한서지적관계유형을가장많이포함하고있는것으로알려져있어이를실험대상으로하였다. 단행본으로한정하였지만단행본에서파생된다양한유형의자료도검색알고리즘에는포함될수있도록설계한다. 2 KORMARC 레코드에내포된다양한서지적관계유형을 FRBR 모형에적용하여검색에반영하는알고리즘을설계한다. FRBR 모형을적용하여알고리즘을개발하더라도기존의 KORMARC 레코드를정비하지않으면만족할만한성과를거두기가어려움것으로판단되며, 따라서기존의레코드를적용함으로써미비한점에대한개선방안을제시할예정이다. - 8 -
3. 연구방법 첫째, RDA의국내적용을위한기반연구는관련문헌연구와 RDA의전문번역및한글색인작성을중심으로한다. 둘째, RDA와 FRBR 모형을적용한자료검색알고리즘설계는아래와같은순서로연구를진행한다. 1 사례분석 : 알고리즘설계관련국내외사례분석을한다. 특히이연구와관련이높은 OCLC의저작세트알고리즘, FictionFinder, LC 디스플레이툴등을중점적으로분석한다. 2 모형설계 : FRBR 알고리즘사례와 RDA 내용분석을바탕으로국립중앙도서관의서지데이터를분석하여 FRBR 모형을적용한알고리즘을설계한다. 3 실험대상 : 국립중앙도서관의문학류서지레코드 20만여건을대상으로하며, 이들가운데다양한저작유형을반영할수있는사례들을엄선하여실험대상으로한다. 4 모형구현 : 알고리즘설계내용을바탕으로유형별로엄선한실험대상을직접구현해봄으로써 RDA와 FRBR 모형적용과관련된문제점을분석한다. 셋째, 분석내용을바탕으로목록작성과서지모형에관한국제적변화에대응방안을도출하고, 국가서지작성기관으로서미래목록작성에관한지침을제시한다. - 9 -
제 2 장 FRBR 및 RDA 의이론적배경 1. FRBR 1) FRBR 의발달 IFLA에서는 1961년파리원칙과 1971년 ISBD(M) 을비롯한일련의규칙을발표한이후, 도서관이처한환경이크게변화함에따라 1990년스톡홀름에서개최된서지제어회의에서서지제어용도구의개정이필요하다는데인식을같이하게되었다. 여기서서지레코드의기능요건을새로이정의하기위한연구의필요성이거론되었으며, 그후관계전문가들의연구결과 1997 년 FRBR에대한최종보고서 1) 가발표되었다. Cutter는목록의기능을 첫째는이용자가알고있는저자명이나표제, 주제명으로자료를검색하게하고, 둘째는도서관이소장하고있는특정도서를저자명, 주제명, 문헌의유형으로보여주며, 셋째는특정판 ( 서지적 ) 또는저작의특성 ( 문자나주제별 ) 에따라자료의선정을지원하는데있다 고하였다. 2) 즉, 저자명이나표제, 주제명, 판표시, 소장내용등을기술하여둠으로써이용자가원하는정보를찾을수있도록하는것이목록의목적이다. 이것은 FRBR이저작수준에서작품의표제와저자를기술한다음, 특정작품에관한판표시, 언어표시, 물리적특성을표현형이나구현형수준에서기술하게하는구조와연결되고있다. 이와같이목록의이용자지향형에대한배경을바탕으로 FRBR의구조를생각하여보면, 누구에의해창작된어떤제목의작품인가를식별하는개념을정점으로하여그아래에판이나언어의차이를구별하는표현형이연결되고, 다시물리적특성이나소장상황을기술하는구현형이나개별자료수준이연결되어있는것이다. 이러한이용자지향형의배경은일찍이 Cutter 와 Lubetzky에서 AACR과 ISBD, 그리고 FRBR로이어진다고생각되며, 특히최근에 Tillet 3) 이나 Smiraglia와 Leazer 4) 등이주장한 목록에있어관계성 을도입하여, ISBD나 UNIMARC 매뉴얼등을바탕으로서지기술및표목규칙의구조재편을시도한것이라고할수있다. 즉, 목록의역사적배경을바탕으로 FRBR에서이용자지향형의저작개념이정립되고, 이저작개 1) IFLA Study Group on the Functional Requirements for Bibliographic Records. Functional Requirements for Bibliographic Records: Final Report(Munich: Saur, 1998). 2) Charles Ammi Cutter. Rules for Dictionary Catalog, 4th ed.(washington, D.C. : Government Printing Office, 1904), p.12. 3) Barbara B. Tillett. Bibliographic Relationships, in Relationships in the Organization of Knowledge(edited by Carol A. Bean and Rebecca Green. Dordrecht : Kluwer Academic Pub., 2001), pp.19-35. 4) R. P. Smiraglia and G. H. Leazer. Derivative Bibliographic Relationships; the Work Relationship in a Global Bibliographic Database, Journal of the American Society for Information Science, Vol.50(1999), pp.493-504. - 10 -
념을중심으로관계성을도입하여서지세계 (bibliographic universe) 의개념준거로서 FRBR이제안되었다할수있다. 목록에있어관계성을도입하면, 무엇보다저작간의집합형성이나전거제어에유리하며, 지금까지목록규칙에서제대로취급하지못하였던네트워크전자자료나멀티미디어와같은자료를수용할수가있다. FRBR은목록레코드의데이터요소를이용자요구와의관계에착안하여재편한것이며, 이의목적을보다구체적으로요약하면다음과같다. 서지레코드로기록된데이터와이용자요구를연결시키기위해명확히구조화된전거를제공하고있다. 각국에서작성된서지데이터베이스시스템을위해공통의개념모형을작성한다. 각국에서작성된서지레코드의기본수준을제시한다. 이와같이 FRBR은도서관에서지금까지작성해온서지레코드를분석하여다양한정보원에대해이용자의요구에부응할수있도록필요한요소를하나로통합하였다고볼수있다. 그내용은서지데이터베이스구축에필요한항목을제시하고, 항목간에관계를표시한서지모형즉, 서지레코드의구조를나타내기위한개념모형이다. 또한이개념모형은데이터베이스를구축할때사용되는모형화의방법으로도의미가있으며, FRBR에서는개체-관계모형이라고하는방법을사용하고있다. 이러한개념모형을사용함으로써각국도서관이국가서지를작성하여국가간에서지레코드를공유할수가있다. 2) FRBR 의구조 FRBR에서는서지적영역을대상으로이용자가검색할때중요하다고생각되는것을 10개의개체로추출한후, 이것을 3개의집단으로나누고있으며, 이들 3개집단의관계를모형화하여나타낸기본구조는 < 그림 1> 과같다. 5) 제1집단은 서지레코드에기술되어있는지적예술적활동의성과 로서정보원을이용자가어떻게인식하고있는가를 4개의개체즉, 저작 (work), 표현형 (expression), 구현형 (manifestation), 개별저작 (item) 으로표현하고있다. 제2집단은지적예술적내용, 물리적생산, 배포, 생산물의관리, 보관에책임을갖는것으로서개인저자, 단체저자, 출판사, 도서관등을개인과단체라는두개의개체로나타내고있다. 개인또는단체는제1집단의 4개개체인저작을창조하고, 표현형을실현하고, 구현형을제작하며, 개별자료를소장하는기능을하고있다. 즉, 저작은추상적인관점으로서독창적인지적예술적창작물을나타내고, 표현형은저작의지적예술적창작물을실현 ( 실감, 이해, 현실화 ) 한것을나타낸다. 구현형은지적예술적내용을물리적으로구체화 ( 구현 ) 한것을나타내며, 개별자료는그일례를나타낸다. 5) 이경호, 김정현. 자료목록법, 제 5 판 ( 대구 : 인쇄마당, 2012), pp.31-35. - 11 -
제3집단은지적예술적활동의대상이되는주제 ( 테마, 개념, 인물, 사건, 시대, 영역등 ) 를개념, 대상, 사건, 장소의 4개개체로나타내고있다. 이러한 3개집단의관계는제2집단이주체가되어제3집단을대상으로작용하면, 그결과제1집단의성과가생겨나는것으로되어있다. 따라서 3개집단가운데제1집단이정보원자체를기술하는핵심적인부분으로구성되어있음을알수있다. < 그림 1> FRBR 모형의구조 여기서 FRBR 의핵심이라고할수있는제 1 집단을좀더자세하게분석하면아래와같다. (1) 저작저작이라는개체는지적예술적창작물이며, 추상적인것이다. 보다구체적으로말하면, 학술적인연구와독창적인문학작품이나음악작품등이며, 그것이언어나음성으로표현되기이전의상태를가리킨다. 이와같이저작은동일작품에서유래한다양한표현형식의차이점을보고싶거나, 동일작품에서유래한어떤하나의표현형식에서다른표현형식을보고싶을경우에표현형식의차이점을구별하고있는표현형을하위수준으로하여작품을식별한다. 다만저작은동일작품에서유래한것이라도의역, 개작, 아동용으로각색, 풍자적으로개작, 초록, 발췌, 요약, 문학작품에서드라마로각색한것등은별개의다른저작으로구별하여기술된다. 예를들어, Ernest Hemingway 의저작 For Whom the Bell Tolls( 누구를위하여종은울리나 ) 는이저작의특정텍스트를말하는것이아니라, For Whom the Bell Tolls라는지적창작물의추상적인개념을의미한다. - 12 -
(2) 표현형표현형이라는개체는문자, 숫자, 악보기보법, 무용기보법, 음향, 화상, 실물, 동작, 또는그것을조합한형식으로표현의차이를동일저작아래에서구별하여기술하기위한기능을한다. 이개체는원문, 번역문, 영화시나리오, 라디오방송시나리오등과같은표현형식을기술하며, 서체나지면배치와같은물리적형식은그하위의구현형에서기술한다. 원작의형식변경 ( 예 : 문어체에서구어체로변조 ) 이나번역과같이다른언어로변경된것은원작과동일저작으로간주한다. 표현형의수준에서식별되는것은크게 1 내용이변화된것 ( 예 : 개정, 갱신, 축소, 증보 ), 2 본문의열이변화된것 ( 예 : 번역, 악곡의편곡, 문장표현에서특정단어 어구 문장이변화된것, 음악작품의표현에서음표나구절법이변화된것 ), 3 내용이추가된것 ( 예 : 악곡에성부나반주를추가한것, 외국영화의대사를자국어로녹음하거나자막이첨부된것 ) 등이다. Ernest Hemingway의저작 For Whom the Bell Tolls에대한표현형의구체적인예시는 < 그림 2> 와같다. 저작 : Ernest Hemingway 의 For Whom the Bell Tolls > 표현형1: 저자의영문원본 > 표현형2: Denise van Moppès의불어번역본 > 표현형3: Paul Baudisch의독일어번역본 > 표현형4: 大久保康雄의일본어번역본 > 표현형5: 鄭栱植의한국어번역본 > 표현형6: 吳國根의한국어번역본 > 표현형7: 김욱동의한국어번역본 < 그림 2> 표현형의예시 (3) 구현형구현형은추상적인것 ( 저작 ) 이표현형식을수반하여 ( 표현형 ) 물리적으로구체화된것에대해기술하도록설정된개체이다. 즉, 구현형은지적내용 ( 저작 ) 과그표현형식 ( 표현형 ) 이동일한것이므로물리적인대상이다른것을구별한다. 구체적으로는원고, 도서, 연속간행물, 지도, 포스터, 녹음물, 영화, 비디오, 점자, CD, DVD 등과같은물리적인매체를수반하고있는자료를대상으로그특징을구별하며, 이용자에게어떤매체로정보원을제공할수있는가를알수있도록하는부분이다. 이와같이구현형은동일한작품에서동일한표현형식에맞춘것을물리적인형식의차이에따라구별할수있도록한다. Ernest Hemingway의저작 For Whom the Bell Tolls에대한저작과표현형, 구현형의구체적인사례는 < 그림 3> 과같다. - 13 -
저작 : Ernest Hemingway 의 For Whom the Bell Tolls > 표현형1: 저자의영문원본 >> 구현형1: For whom the bell tolls / Ernest Hemingway (New York : Scribner, 1940) >> 구현형2: For whom the bell tolls / by Ernest Hemingway ; with an introduction by Sinclair Lewis ; illustrated with lithographs by Lynd Ward (Princeton : Princeton University Press, 1942) >> 구현형3: For whom the bell tolls / by Ernest Hemingway (New York : Overseas Editions, 1944) >> 구현형4: For whom the bell tolls / Ernest Hemingway (Moskva : Voennoe izd-vo, 1973) >> 구현형5: For whom the bell tolls / Ernest Hemingway (New York : Collier Books, 1987) > 표현형2: Denise van Moppès의불어번역본 >> 구현형1: Pour qui sonne le glas / Ernest Hemingway ; traduit par Denise van Moppès (Paris : Le livre de poche, 1970) > 표현형 3: Paul Baudisch 의독일어번역본 >> 구현형 1: Wem die Stunde schlägt / Ernest Hemingway. aus d. Amerikan. von Paul Baudisch (Berlin : Deutsche Buch-Gemeinschaft, 1959) > 표현형 4: 大久保康雄의일본어번역본 >> 구현형 1: 誰がために鐘は鳴る / アーネスト ヘミングウェイ著 ; 大久保康雄訳 ( 東京 : 三笠書房, 1952) > 표현형 5: 鄭栱植의한국어번역본 >> 구현형 1: 누구를위하여鍾을울리나 / 어네스트헤밍웨이著 ; 鄭栱植譯 ( 서울 : 正音社, 1958) > 표현형 6: 吳國根의한국어번역본 >> 구현형 1: 누구를위하여鍾은울리나 / Ernest Hemingway 著 ; 吳國根譯 ( 서울 : 大洋出版社, 1972) > 표현형7: 김욱동의한국어번역본 >> 구현형1: 누구를위하여종은울리나 / 지은이 : 어니스트헤밍웨이 ; 옮긴이 : 김욱동 ( 서울 : 민음사, 2012 ) < 그림 3> 구현형의예시 - 14 -
(4) 개별자료개별자료는구현형의일례를나타낸다. 구현형과개별자료는물리적인형식을기술하기위한개체로서기능을한다. 즉, 어떤매체로유통되며, 어디가면그것을입수할수있는가를이용자가알수있도록도와주는개체이다. 이와같이저작과표현형은한개의저작에복수의표현형이관계되어있으며, 표현형과구현형간에는서로복수의개체를관련시킬수가있다. 구현형과개별자료간은한개의구현형에복수의개별자료가관련될수있도록되어있다. 즉, 다양한저작의유형을하나의레코드에집중시켜이들간에서로관계를지워줌으로써서지레코드의관계성을높일수가있고, 기존의서지레코드보다훨씬이용자지향으로발전될수있다. 개별자료의구체적인예시는앞서소개한구현형의사례들이각도서관의서가나개인이소장하고있는장서들이다. 2. RDA 1) 발달과정 1997년토론토에서개최된 AACR의원칙과미래의발전에관한국제회의 (International Conference on the Principles and Future Development of AACR) 에서많은사람들이 AACR 에대한문제점을제기함에따라 AACR 개정위원회 (Joint Steering Committee for revision of AACR) 는기존의 AACR2R과는다른접근법으로새로운목록규칙을개발하기로하였고, 2007년까지새로운판인 AACR3 : Resource Description & Access란서명으로발행하기로하였다. 6) 2008년 JSC(Joint Steering Committee for Development of RDA) 에서는 2008년 RDA (Resource Description and Access) 초안을발표한후, 2010년 AACR을전면개정하여새로운규칙이라고할수있는 RDA를책자형과함께온라인형태의 RDA-Toolkit을발간하였다. 7) 이는전통적인도서관목록이아니라웹기반환경에서사용할수있으며, 모든매체에대한서지기술과접근점을제공하기위한다국적내용의표준을지향하고있다. 초판을발행한이후에도많은논의와수정을거듭하여 2012, 2013, 2014년도에각각온라인업데이트판을발표하여오늘에이르고있으며, 2008년의초안에비하면상당부분의내용이수정보완되었다. 주요개정내용을요약하면 < 표 1> 과같다. 6) Joint Steering Committee for Revision of AACR. 2004 Annual Report, 5JSC/Annual report/2004, 30 March 2005, p.3 <http://www.rda-jsc.org/docs/annrep04.pdf> [cited 2014. 10. 15]. 7) Joint Steering Committee for Development of RDA. RDA : Resource Description & Access(Chicago : American Library Association, 2010). - 15 -
< 표 1> RDA 개정내용 초안 (October 21, 2008) 초판 (2010) 채택된접근점 (preferred access point) 6.27.1.4( 여러개인이나가족, 단체에의한저작의편집물 ) 에서 compiler( 편집자 ) 를창작자로간주하고채택된접근점 (preferred access point) 을작성 전거형전근점 (authorized access point) 으로용어변경 6.27.1.4에서편집자대신에 편집물의채택표제를사용하여저작을나타내는전거형접근점을작성 으로변경. 따라서아래와같은예시는모두편집자대신에채택표제를전거형접근점으로함예 ) textes choisis et présentés par Jean Rousset compiled by Carsten Lien edited by Allan W. Atlas Librettos for Bellini operas by various librettists compiled by N.J. Rengger with John Campbell 6.6( 저작의원어 ) 6.6 이삭제되어 6.6-6.21 의항목번호가바뀜 6.21( 법률저작의기타식별특성 ) 신설 이외에도약 150 곳의항목이수정됨 초판 (2010) 2012 April Update 9.15( 개인의활동영역 ) 핵심요소 에서 비핵심요소 로변경 11.6( 회차등 ) 신설 0.5, 2.20, 3.22, 6.2.1.7, 6.4, 6.15.1.4, 6.20, 6.29.1.21, 9.2.2.25, 11.2.2.8 등의항목이개정 되었음 2.7.2.3, 2.8.2.3, 2.9.2.3, 2.10.2.3, 6.15.1.3, 6.15.1.9, 7.23.1.1, 7.29, 19.2.1.1.1, 19.2.1.3 등 의항목에일부내용이추가됨 이외에도 75 곳의항목이수정됨 - 16 -
2012 April Update 2013 July Update 3.11.2(Layout of cartographic images) 3.11.3(Layout of tactile musical notation) 3.11.4(Layout of tactile text) 6.12.1.4(Selected parts or excerpts) 6.25.1.5(Excerpts from the Bible) 11.2.2.14(Subordinate and related bodies ) 11.2.2.15(Direct or indirect subdivision) 11.2.2.27(Delegations to international and ) 11.2.2.30(Subordinate religious bodies) 3.11.2, 3.11.3, 3.11.4 등이삭제됨 6.12.1.4, 6.25.1.5, 11.2.2.14, 11.2.2.15, 11.2.2.27, 11.2.2.30 등이전반전으로많이수정됨 용어정의에서삭제 Layout of Tactile Musical Notation; Layout of Tactile Text; Transmission Speed 용어정의에추가 Cover; Encoded Bitrate; Leaf; Libretto; Lyrics; Page; Text 이외에도약 230 곳의항목이수정됨 2013 July Update 2014 April Update 6.22( 조약의서명인등 ) 삭제되고새로운지침으로대체 6.22( 조약의참여자 ) 는핵심요소임 11.4.5( 단체의활동시기 ) 신설 11.7( 단체와연관된기타표시 ) 수정 새로운사용법추가 2.21, 2.21.1, 6.14.2.5.1, 6.15.1.5.3, 6.28.1.9.1, 6.29.30, 9.19.2, 10.8.1, 11.4.5.1 11.4.5.3 용어정의에서삭제 Item-Specific Carrier Characteristic of Early Printed Resource; Note on Manifestation or Item; Protocols, Etc.; Signatory to a Treaty, Etc. 용어정의수정 Date Associated with the Corporate Body; Date Associated with the Family; Date Associated with the Person; Date of a Treaty 이외에도 510 곳의항목이수정됨 RDA-Toolkit에는 < 그림 4> 에서와같이 RDA의전문이수록되어있으며, 메뉴의하단에는 RDA Update History 가나타나있다. 즉, 2012년 4월, 2013년 7월, 2014년 4월의각갱신내용을확인할수있다. 현재프랑스, 독일, 스페인, 중국등에서 RDA에대한번역을하였거나진행중이다. - 17 -
< 그림 4> RDA-Toolkit 의로그인직후화면 2) 구조 RDA의내용목차는구성에있어 < 표 2> 와같이 AACR2R과크게차이가있음을알수있다. 또한 RDA에서사용하고있는용어와개념, 카테고리는어디에서유래한것인지바로확인할수있는데이러한개념들은바로 FRBR과 FRAD에서사용하는것들이다. 따라서 RDA의기본철학은 FRBR과 FRAD의개념모형이다. 그리고 RDA는 FRBR과 FRAD의개념모형에근거하여여러부 (section) 로나누고, 각부는 FRBR의서지개체에따라구분하고있다. 처음 4개의부는 RDA의서지개체속성기록에관한내용이고, 나머지제5부 제10부까지는개체들사이의관계기록에관한것이다. 개체가운데주제에해당되는부분인 FRSAD는 RDA 구조에는포함되어있지만현재는대부분빠져있는상태이며, 향후개발될예정에있다. 그런데 RDA의구체적인세부항목의기술부분을살펴보면 AACR2R의전통적인목록기술부분이그대로 RDA에나타나있다. FRBR과 FRAD의개념모형에맞게 AACR2R을재구성하였다고볼수있으며, 이때문에실제로 AACR2R을바탕으로구조화된 MARC 레코드가여전히 RDA에서도유효한것이다. - 18 -
< 표 2> AACR2R 과 RDA 의목차구성 AACR2R 기술 (description) 제 1 장기술의일반총칙제 2 장단행본, 소책자제 3 장지도자료 제 12 장계속자료 표목, 통일표제, 참조 (headings, uniform title, references) 제 21 장표목선정 제 22 장개인표목 제 23 장지역명 제 24 장단체표목 제 25 장통일표목 제 26 장참조 속성 (attributes) RDA 제 1 부구현형과개별자료의속성기록 제 2 부저작과표현형의속성기록 제 3 부개인, 가족, 단체의속성기록 제 4 부개념, 대상, 사건, 장소의속성기록 관계 (relationships) 제 5 부저작, 표현형, 구현형, 개별자료간의주요관계기록제 6 부자원과관련된개인, 가족, 단체와의관계기록제 7 부개념, 대상, 사건, 장소와의관계기록제 8 부저작, 표현형, 구현형, 개별자료간의관계기록제 9 부개인, 가족, 단체간의관계기록제 10 부개념, 대상, 사건, 장소간의관계기록 3) 특성 (1) FRBR 및 FRAD를기반으로함 RDA의이론적배경이되고있는개념모형은앞서언급한 FRBR과 FRAD이다. 즉, RDA 의자원을기술하는데이터요소는 FRBR에서정의한저작, 표현형, 구현형, 개별자료라는개체와관련된속성및관계를반영하고있으며, RDA의자원관련개체를기술하는데이터요소는 FRAD에서정의된개인, 가족, 단체, 장소라는개체와관련된속성및관계를반영하고있다. 여기에는저작, 표현형, 구현형, 개별자료및개인, 가족, 단체, 장소각각의정의가나타나있다. RDA의목적은자원발견을지원하기위해데이터기록에관한일련의지침과사용법을제시하는것이라고하면서, 8) 자원발견의지원 을기본목표로설정하고있으며, 이를위한구체적인구체적인목표로이용자과업 (user tasks) 을설정하고있다. RDA를사용하여기술된데이터는이용자과업을지원하기위한것이며, 탐색 (find)-식별 (identify)-선정(select)-확보(obtain) 라는과정을통해서과업이달성된다. RDA에서의미하는이용자과업이란국가서지나도서관목록을탐색하거나이용할때이용자에의해행해지는일반적인일즉, 정보탐색및확보과정에일어나는일련의행위를의미한다. 또한 RDA는개인, 가족, 단체, 개념등의개체에대해이들의관계를기술함으로써이용자들이탐색 (find)-식별(identify)-확인(clarify)-이해(understand) 라는과정을통해서과업을 8) RDA 0.0-19 -
달성하게된다. 특히자원과관련된개체의기술을통해이용자과업을지원한다는의미는 FRAD에기초하여개인이나가족, 단체등의개체에대해전거제어를통해이용자과업을지원한다는내용이다. 결국 RDA에서지원하고자하는이용자과업은서지기술을통한이용자의정보탐색지원과서지정보의제어를통한탐색지원이라고할수있다. (2) 자원의물리적측면과내용적측면을구분 RDA의특징가운데하나가자원유형을전반적으로자료의물리적측면과내용적측면으로구분하여기술하고있다. 앞서 < 표 2> 에서와같이 AACR2R과 RDA의목차를비교해보면 AACR2R에서는자원유형별로장이구성되어있지만, RDA에서는기술요소별로되어있다. 그리고 RDA의자원유형구분기준은아래와같다. 매체유형 (audio, computer, microform, video 등 ) 수록매체유형 (audio disc, audio reel, audio tape 등 ) 내용유형 (text, spoken word, still image 등 ) 발행유형 (multipart monograph, serial, integrating resource) (3) 기술과접근을분리하지않음 AACR2R에서는자료의식별을위한 기술부 와자료검색의수단또는문헌집중을위한 표목부 ( 접근점 ) 라는구조로규칙이구성되어있었지만 RDA에서는목록기능에있어기술과접근을분리하지않고있다. RDA 구조의근간이되고있는 FRBR은서지레코드가완수해야할기능과데이터요소를이용자요구와연결시켜정의하여구조화하고있다. AACR2R 기술부와표목부 ( 접근점 ) 로구성 RDA 기술과접근을분리하지않음개체간의관계를기술하여이용자목록이나서지데이터베이스의내비게이트를향상 (4) 접근점이라는용어사용과기본기입개념의유지 RDA에서는종래의통일표목에해당하는 전거형접근점 (authorized assess point) 과참조에해당하는 이형접근점 (variant access point) 에의해기본기입의개념이유지되고있다. 예를들면, 제2부제6장에규정되어있는 저작을나타내는전거형접근점의작성 에서는먼저 저작을나타내는전거형접근점 의작성에대해규정하고있으며, 개인저작에대해서는 개인을나타내는전거형접근점 ( 즉, 통일저자표목 ) 과 저작을나타내는전거형접근점 ( 즉, 통일표제 ) 과의조합으로아래예시와같이저작의전거형접근점을작성할수있다. - 20 -
예 ) Hemingway, Ernest, 1899-1961. Sun also rises Cassalt, Mary, 1844-1926. Children plating on the beach 이와같이통일표제나저자명의통일표목을전거형접근점으로기술하여저작의집중을가능하게하고있으며, 부출기입은다른자원과의관계를기술함으로써구체화하고있다. 여기서는종래의목록규칙에있어기본기입의표목선택과표목형식의복잡성을배제하여저작의속성과관계를적절하게기록함으로써저작의집중및자원식별과발견이라는이용자과업을지원할수있게의도하고있다. 목록의기능을어떻게파악하여, 어떻게실현하느냐의명제는 FRBR을기반으로하고있는 RDA에있어서도기술대상의파악과함께중요한과제이다. AACR2R 기본기입 (main entry), 부출기입, 참조, 통일표제 RDA 전거형접근점 (authorized assess point) 이형접근점 (variant access point) 저작의채택표제 (preferred title for the work) (5) 의미적측면과구문적측면의분리 AACR2R을비롯한지금까지의목록규칙은 구분기호법 으로대표되는구문적측면 (syntax) 의규칙을의미적측면 (semantics) 의규칙과함께다루어왔다. 그런데 RDA에는 AACR2R이지니고있던구문적측면을규칙에서배제하고의미적측면으로특화하여설계하였다. ISBD의구분기호나요소배열은규칙자체에는나타나있지않으며, 부록에서 ISBD나 MARC 21 형식과의매핑을통해나타내고있을뿐이다. 그렇지만이는기계가독성이나상호운용성의측면에서바람직하다고볼수있다. DC(Dublin Core) 등최근의메타데이터규칙에는의미적측면만을지닌범주로요소를정의하고, 구문적측면은별도의표준 ( 복수의구문형식도허용함 ) 에맡기는것이일반적이다. 이것은기계가독성이라는관점에서반드시필요한요건은아니지만상호운용성을위한유연성을생각하면바람직한방향이라고할수있다. (6) 기존의규칙에비해식별요소의대폭증가기존의 AACR2R에비해기록요소가크게늘어났다. 예를들면, 제3장 수록매체의기술 은종래의 형태사항 에해당하지만수량 (3.4), 크기 (3.5) 뿐만아니라기본재질 (3.6), 응용재질 (3.7), 마운트 (3.8), 제작방법 (3.9) 등 20여개에가까운요소가정의되어있다. 이렇게요소가늘어난것은종래의목록규칙에서는주기나기타형태적세목에서기록되던것이며, RDA에서독립적인요소로정의함으로써이러한요소를명확하게식별할수있게되었다. 또한제9장개인식별을위한요소에서도개인명 (9.2) 을비롯하여출생일자 (9.3.2), 개인의 - 21 -
직함 (9.4), 성별 (9.7), 개인의활동분야 (9.15), 직업 (9.16) 등 20 여개요소가정의되어있어 기존의전거레코드보다식별요소가대폭증가하였다. (7) 요소별기록데이터의제시로선택입력이가능식별요소마다기록할데이터의용어를대부분범주화하여리스트로제공함으로써선택입력이가능하도록하였다. 개체간의관계에대해서는 관계지시어 를설정하여상세한관계의종류를관리하고있으며, 대부분의관계지시어를범주화하여부록으로제시하고있다. 즉, 부록 I에는자원과개인, 가족, 단체간의관계에대한 120여개의관계지시어, 부록 J에는저작, 표현형, 구현형, 개별자료간의관계에대한 340여개의관계지시어, 부록 K에는개인, 가족, 단체간의관계에대해 20여개의관계지시어를범주화하여제시하고있다. 3. MARC 1) 발달과정 1960년대이후기존의목록형태를바탕으로컴퓨터가인식할수있도록코드화한것이 MARC 형식이며, 인터넷의확산을비롯하여목록환경의많은변화와함께 RDA라는새로운개념의목록규칙이제정되었지만여전히 MARC 체계는유효하다고볼수있다. RDA를구조화하기위한수단으로미국의회도서관을비롯한대부분의도서관에서여전히 MARC을사용하여레코드를작성하고있으며, 보다나은대체시스템이개발되지않는한이러한현상은상당기간지속될수밖에없다고생각된다. 미국의회도서관과캐나다국립도서관은 1999년공동으로인터넷환경과네트워크자원의서지기술에대한다양한요구를수용하기위해 USMARC을개정하여오늘날의 MARC 21을제정하게되었다. MARC 21은단행본, 문서및사본자료, 전자자료, 지도, 악보, 시각자료, 계속자료등에관한서지적인정보를종합적으로표현할수있도록설계되어있다. MARC 21은 1999년판을발간된후 2012년 10월현재 15차례의개정작업이이루어졌으며, 여기에는 RDA in MARC 등을비롯하여최근발간된 RDA의내용을수용할수있는내용도포함되어있다. 9) KORMARC 형식은한국목록규칙을실질적으로코드화했다고볼수있으며, 대한민국국가서지작성을위한근간이되고있다. KORMARC 형식은국립중앙도서관에서 2005년자료유형별로각각발행되었던것을통합서지용으로발행한이후, 새로운목록규칙이라고할수있는 RDA가제정되었다. 2013년부터세계여러나라도서관에서 RDA 규칙을도입한후이를적 9) Library of Congress. MARC 21 Format for Bibliographic Data: 1999 Edition Update No.1(October 2001) through Update No.18(April 2014), <http://www.loc.gov/marc/ bibliographic/ecbdhome.html> [cited 2014. 10. 15]. - 22 -
용한해외 MARC 데이터들이생성되고있어이러한변화에대처하고향후새로운규칙적용에대비하여 KORMARC에서도 RDA 관련 MARC 필드를수정하거나신규로추가할필요성이대두되었다. 국립중앙도서관에서는 KORMARC 통합서지용에 RDA를반영하여새로운필드를추가하는등개정작업을진행하여 2013년 7월공청회를거친후, 10) 2014년 5월개정을마무리하였다. 11) 이개정안의내용은데이터상호교환성을위해국제표준인 MARC 21과국내표준인 KORMARC의내용이대부분일치할수있도록 MARC 21 Update no.13(sep. 2011) 을기초로작성되었다. 또한 KORMARC 전거통제용에대해서도 RDA와관련하여보고서 12) 를발간하는등개정작업을진행하고있다. 2) RDA 수용을위한 KORMARC 의신규필드 아래의내용은 RDA 수용을위해 KORMARC 에새로이추가된내용을소개한것이다. 13) (1) 내용, 매체, 수록매체유형과수록매체특성을위한필드 1 내용유형 KORMARC에는이미리더 /06에내용유형을나타내고있다. 또한서지형식으로새롭게추가된 336 필드에서내용유형의기술이가능하다. RDA의내용유형정보를기록하기위한 KORMARC 부호의정보원은 부록 B. 역할어, 정보원기술부호 의 장르 / 형식정보원부호 (Genre/Form Source Codes) 를적용한다. 예 ) 336 aperformed music 2rdacontent 336 atwo-dimensional moving image btdi 2rdacontent 2 매체유형 KORMARC에는이미 007/00 필드에매체유형을나타내고있다. 또한서지형식으로새롭게추가된 337 필드에서매체유형의기술이가능하다. RDA의매체유형정보를기록하기위한 KORMARC 부호의정보원은 부록 B. 역할어, 정보원기술부호 의 장르 / 형식정보원부호 (Genre/Form Source Codes) 를적용한다. 10) 국립중앙도서관. 한국문헌자동화목록형식 (KORMARC) : 통합서지용 KS 개정공청회자료, 2013. 7. 19, 11) 국가기술표준원고시제2014-193 호, 관보, 제18260호 (2014. 5. 8). 12) 국립중앙도서관. 국제목록동향을반영한 KORMARC- 전거통제용개정 ( 안 ) 연구. 서울 : 국립중앙도서관, 2013. 13) 국립중앙도서관. 한국문헌자동화목록형식 (KORMARC) : 통합서지용 KS 개정공청회자료, 2013. 7. 19, - 23 -
예 ) 337 aaudio 2rdamedia 337 avideo bv 2rdamedia 3 수록매체유형 KORMARC에는이미 007/01 필드에수록매체유형을나타내고있다. 또한서지형식으로새롭게추가된 338 필드에서수록매체유형의기술이가능하다. RDA의수록매체유형정보를기록하기위한 KORMARC 부호의정보원은 부록 B. 역할어, 정보원기술부호 의 장르 / 형식정보원부호 (Genre/Form Source Codes) 를적용한다. 예 ) 338 aaudio disc 2rdacarrier 338 avideodisc bvd 2rdacarrier 4 수록매체특성 KORMARC은서지형식 300, 340, 5XX 필드에서본문형식으로, 서지형식 007 필드에서코드형식으로수록매체특성의기록을제공하며, RDA 수록매체특성에대한용어를기술할수있도록아래의서지형식필드가새로이추가되었다. 344 음향특성 (Sound characteristics) 345 동영상의영사특성 (Projection characteristics of moving image) 346 비디오특성 (Video characteristics) 347 디지털파일특성 (Digital file characteristic) 예 ) 344 aanalog c33 1/3 rpm gstereo 345 acinerama b24 fps 2rda 346 avhs bntsc 2rda 347 aaudio file bcd audio 2rda (2) 저작과표현형속성을위한필드이름 ( 개인이나가족, 단체 ) 및표제의속성은이름표목 ( 예 : 출생일자 ) 이나통일표제표목 ( 예 : 음악의장조 ) 에기록되어왔던, 또는이름이나표제의전거레코드에서주기에포함되었던전형적인정보이다. RDA에서는이러한정보가표목또는표목의일부분과분리되어별도로기록될수있다. 이러한속성가운데자원 ( 저작및표현형 ) 을기술할수있도록통합서지용에아래의필드가새로이설정되었으며, 이름속성을위한 KORMARC 전거통제용은개정작업중에있다. 377 관련언어 (Associated language) 380 저작의형식 (Form of work) - 24 -
381 기타저작이나표현형의식별특성 (Other distinguishing characteristics of work or expression) 382 연주매체 (Medium of performance) 383 음악저작의숫자표시 (Numeric designation of musical work) 384 장조 (Key) 예 ) 100 1 amahler, Gustav, d1860-1911. tsymphonies, nno. 2, rc minor 382 asoprano aalto amixed voices aorchestra 384 ac minor 383 ano. 2 (3) 관계 1 이름과자원 RDA 부록 I에는자원과개인이나가족, 단체간의가능한관계를제시하고있다 ( 예 : author, artist, cartographer 등 ). KORMARC은이미서지형식에있어 1XX, 6XX, 7XX, 8XX 필드에, 전거형식에있어 1XX, 4XX, 5XX 필드에역할어 ( e) 14) 나역할어부호 ( 4) 를사용하여이러한관계유형을기록하고있다. 예 ) 700 1 asmith, Elsie, d1900-1945, eillustrator. 700 1 ahecht, Ben, d1893-1964, ewriting, edirection, eproduction. 2 자원과자원 RDA 부록 J에는저작이나표현형, 구현형, 개별자료간에존재할수있는 340여개의관계지시어를제시하고있다 [ 예 : dramatized as (work), indexed in (work), sequel, digest of (expression), parody of (work) 등 ]. MARC 21은이러한관계를명시하기위해다음과같은방법을사용하고있다. 식별기호 : 예를들면, o( 기타개별자료식별기호 ), u(uri), x(issn), w( 레코드제어번호 ), 0( 전거레코드제어번호 ) 등의식별기호, 856 필드등 주기 : 서지형식의 5XX 필드, 전거형식의 6XX 필드 구조화된기술 : 서지형식의 76X-78X 필드 구조화된접근점 : 서지형식의 700-75X 필드, 전거형식의 4XX와 5XX 필드 14) MARC 에서역할표시어 (relator term) 는이름과저작간의관계 ( 예 : ed., comp., ill., tr., collector, joint author 등 ) 를기술하기위한기능표시이다. - 25 -
예 ) 245 00 aalice in Wonderland, or, What's a nice kid like you doing in a place like this? / channa-barbera Productions. 700 1 iparody of (work) acarroll, Lewis, d1832-1898. talice's adventures in Wonderland. (245 필드에기술된저작은 Lewis Carroll 의 Alice's adventures in Wonderland 를패러디한것임 ) 3 이름과이름 RDA 부록 K에는개인이나가족, 단체간에가능한관계 ( 예 : employee, sponsor, descendent family, alternate identity 등 ) 를나타내고있다. MARC 21의전거형식 4XX와 5XX 필드에추가된식별기호 i는이러한관계유형을명시하는데도이용되고있다. 예 ) 100 1 aclemens, Samuel, d 1835-1910 500 wr ialternate identity atwain, Mark, d1835-1910 (100 필드에기술된 Samuel Clemens 의필명이 Mark Twain 임 ) (4) RDA를위한기타 KORMARC의변화이외에도 007과 008 필드에다양한부가코드가추가되는등 RDA를위해 KORMARC에변화를가져왔다. 4. FRBR, RDA, MARC 의매핑 1) FRBR 및 RDA 의개체 / 속성과 KORMARC 요소의매핑 FRBR의개체관계모형이 RDA의기반이되어새로운목록규칙을지향하고있지만실제로개체관계에해당하는목록데이터를구조화하기위한수단은여전히 MARC 형식이지배적이다. LC에서작성한 MARC 21과 FRBR의각개체별속성의매핑보고서 15) 를바탕으로 FRBR 및 RDA의개체 / 속성과 KORMARC 요소의매핑을제시하면 < 표 3> 과같다. 15) Library of Congress. Displays for Multiple Versions from MARC 21 and FRBR, 2003, <http://www.loc.gov/marc/marc-functional-analysis/multiple-versions.html> [cited 2014. 10. 15] - 26 -
< 표 3> FRBR 및 RDA 의개체 / 속성과 KORMARC 요소의매핑 FRBR 및 RDA 개체 / 속성 KORMARC 요소 창작자 (RDA 19.2) 100/110/111 700/710/711 ( t, n, p, d, f, k, s, m, r, l, o, h 제외 ) 기본표목 ( 개인명, 단체명, 회의명 ) 부출표목 ( 개인명, 단체명, 회의명 ) 저작의표제 (RDA 6.2) 130 a, n, p 240/243/245 a, n, p 700/710/711/730/740 t, n, p 통일표제종합통일표제저작의표제 저작 저작관련일자 (RDA 6.4) 130 d 240/243 d 245 g 조약체결일자 저작의형식 (RDA 6.3) 130 k 240/243/245 k 형식부표목, 형식 연주매체 (RDA 6.15) 130 m 240/243 m 연주수단 장조 (RDA 6.17) 130 r 240/243 r 음악자료의장조 좌표 (RDA 7.4) 255 c 경위도표시 표현형의형식 (RDA 6.9) 리더 /06 자료유형 표현형의언어 (RDA 6.11) 130 l 240/243 l 008/35-37 저작의언어 표현형 기타식별특성 (RDA 6.12) 130 o 240 o 243 o 245 s 편곡판 (version) 악보의유형 (RDA 7.20) 축척 (RDA 7.25) 254 a 악보의표현형식 255 a 축척표시 - 27 -
FRBR 및 RDA 개체 / 속성 KORMARC 요소 구현형 구현형의표제 (RDA 2.3.2) 책임표시 (RDA 2.4.2) 판표시 (RDA 2.5.2) 권호 (RDA 2.6) 발행처 / 배포처 (RDA 2.8.4, 2.9.4) 발행일자 / 배포일자 (RDA 2.8.6, 2.9.6) 수록매체형식및수량 (RDA 3.3, 3.4) 수록매체크기 (RDA 3.5) 물리적매체, 수록방식, 재생속도, 음구의폭, 편집유형, 테이프의형태, 음향의종류, 특수재생특성, 색상, 극성, 표현형식, 파일특성 (RDA 3.6 3.21) 축소율 (RDA 3.15) 구현형식별기호 (RDA 2.15) 245 a, n, p 242 a, n, p 245 d, e 242 d, e 본표제, 권차, 권차표제 책임표시 250 a, b 판표시, 해당판의저작자표시 362 a 권 연차또는발행년표시 260 b 533 c 260 c 533 d 300 a 533 e 300 c 533 e 발행처 / 배포처복제기관 발행년 / 배포년복제일자 특정자료종별과수량복제형태사항 크기복제형태사항 300 b 기타물리적특성 340 f 533 n 단행본 : 020, 027, 074 연속간행물 : 022, 030, 074 기타자료 : 024, 028, 074 회전율 / 축소율복제에관한주기 ISBN, STRN, ISSN, CODEN, 정부간행물번호, 기타표준부호 2) FRBR 및 RDA 의개체 / 속성과 KORMARC 레코드예시 앞서살펴본 FRBR 및 RDA의개체 / 속성과 KORMARC의요소매핑을바탕으로 FRBR의저작유형가운데저작, 표현형, 구현형으로구분하여살펴보기로한다. 아래의저작예시는 1987년이상문학상수상작품인이문열의 우리들의일그러진영웅 이다. 이는한국어원작을바탕으로영어와중국어로번역되었으며, 만화라는새로운저작으로변형되고, 1992년에는영화로제작된것을기술한레코드이다. 여기서저작은이문열의 우리들의일그러진영웅 이며, 영어와중국어로번역된작품은표현형에해당한다. 그리고만화로제작되거나영화로제작된것은이문열의 우리들의일그러진영웅 에서파생된새로운저작으로간주된다. - 28 -
[ 레코드 1] 00695nam a2200217 k 4500 001KMO198803404 00520120503095745 008880719s1987 ulk 000 f kor 040 a011001 c011001 05201 a813.608 b문638ㅇ c11 056 a813.608 a813.6 23 0820 a895.734 219 24510 a우리들의일그러진英雄 / d 李文烈외저 260 a서울 : b 文學思想社, c1987 300 a364p.; c23cm 44000 a 李箱文學賞受賞作品集 ; v11 653 a우리 a일그러진 a영웅 a이상문학상수상작품집 7001 a이문열, d1948-, e외저 wkac201008289 [ 레코드 2] 00782nam a2200229 k 4500 001KJU199900411 00520120503100005 008000202s1999 ulka 000 f kor 020 a8987721094 g73810 05201 a813.6 b이312ㅇ 05231 a082.1 b38 c35 056 a813.6 24 24500 a우리들의일그러진영웅 / d이문열지음 260 a서울 : b다림, c1999 300 a157p.: b삽도 ; c22cm 44000 a한빛문고 ; v001 580 a국립중앙도서관원문정보데이터베이스 (database) 로구축됨 653 a우리 a영웅 7001 a이문열, d1948- wkac201008289 7761 a컴퓨터파일. t2007년주요자료원문정보db [ 레코드 3] 영어번역 00696nam a2200253 a 4500 001KMO200853956 00520140716154426 007ta 008080730s1988 ulk 000 f eng 0411 aeng hkor 05202 a895.734 by51ot 056 a813.6 24-29 -
08201 a895.734 221 1001 a이문열, d1948- wkac201008289 24510 aour twisted hero / dyi Munyol ; etranslated by Kevin O'Rourke 24619 a우리들의일그러진영웅 260 aseoul : bminumsa, cc1988 300 a119 p. ; c18 cm 546 atranslated from Korean. 586 ayi Sang award, 1987. 7001 ao'rourke, Kevin. [ 레코드 4] 중국어번역 00862nam a2200289 c 4500 001EJU201400011 00520140716154627 007ta 008131020s2005 cc a b 000 f chi 020 a9867291093: ccny200 0411 achi hkor 05201 a813.6 b14-2 056 a813.6 25 24500 a 我们扭曲的英雄 / d 作者 : 李文烈 ; e 繪 : 權史友 ; e 譯 : 盧鴻金 24619 a우리들의일그러진영웅 260 a 台北 : b 大塊文化出版投份有限公司, c2005[ 民 94] 300 a164 p. : b삽화 ; c20 cm 44000 atogether ; v01 500 a원저자명 : 이문열 546 a한국어원작을중국어로번역 7001 a이문열, d1948- wkac201008289 7001 a권사우, d1967-7001 a뤼홍진 7001 a노홍금 [ 레코드 5] 만화 00953nam a2200277 k 4500 001KJU200502735 00520101007155330 008050422s2004 ulka j 000 c kor 0201 a8990365813( 세트 ) 020 a8990365856(1) g77810: c\9500 020 a8990365864(2) g77810: c\9500 035 aub20040403198 05201 a813.6 b5-128 c1-2 - 30 -
056 a813.6 24 24500 a우리들의일그러진영웅. n1-2/ d이문열원작 ; e이원희그림 250 a개정판 260 a서울 : b이가서, c2004 300 a2책 : b전부색채삽화; c23cm 44000 a만화로보는한국문학대표작선 ; v001-002 500 a권말부록수록 586 a이상문학상, 제11회, 1987 653 a영웅 a만화 a한국문학대표작 a현대소설 7001 a이문열, d1948-, e원작 wkac201008289 7001 a이원희, e그림 [ 레코드 6] 영화 00823ngm a2200277 k 4500 001KVM199900181 00520001002133322 008091205s1992 ulk047 mlkor 056 a813.6 24 24500 a우리들의일그러진영웅 h[ 영화 ]/ d박종원감독 ; e이문열원작 260 a서울 : b대동흥업, c1992 300 a필름카세트 1개 (119분): b유성, 천연색 ; c35 mm 508 a제작진 : 각본, 장현수, 박종원, 노효정 511 a홍경인 ( 엄석대역 ), 고정일 ( 어린한병태역 ), 최민식 ( 김선생역 ) 586 a제103회청룡영화상감독상및최우수작품상, 1992 586 a제38회아시아태평양영화제남우조연상, 1993 7001 a박종원, e감독 7001 a이문열, d1948-, e원작 wkac201008289 < 저작 > 레코드 1의 100( 또는 700) 필드와 245 필드의 work( 저작 ) 을추출한다. 24510 a우리들의일그러진英雄 7001 a이문열, d1948- < 표현형 > 레코드 1, 2, 3, 4의리더 /06( 표현형의형식 ) 과 008/35-37( 표현형의언어 ) 을기준으로표현형을분리한다. 리더 /06 = a --> 인쇄자료 008/35-37 kor --> 한국어 리더 /06 = a --> 인쇄자료 - 31 -
008/35-37 eng --> 영어 리더 /06 = a --> 인쇄자료 008/35-37 chi --> 중국어 < 구현형 > 레코드 1, 2, 3, 4 의각각의구현형속성요소에따라구현형으로레코드가분리된다. 레코드 1에서구현형 1 24510 a우리들의일그러진英雄 / d 李文烈외저 260 a서울 : b 文學思想社, c1987 300 a364p.; c23cm 레코드 2에서구현형 2 020 a8987721094 g73810 24500 a우리들의일그러진영웅 / d이문열지음 260 a서울 : b다림, c1999 300 a157p.: b삽도 ; c22cm 레코드 3에서구현형 3 24510 aour twisted hero / dyi Munyol ; etranslated by Kevin O'Rourke 24619 a우리들의일그러진영웅 260 aseoul : bminumsa, cc1988 300 a119 p. ; c18 cm 레코드 4에서구현형 4 020 a9867291093: ccny200 24500 a 我们扭曲的英雄 / d 作者 : 李文烈 ; e 繪 : 權史友 ; e 譯 : 盧鴻金 24619 a우리들의일그러진영웅 260 a 台北 : b 大塊文化出版投份有限公司, c2005[ 民 94] 300 a164 p. : b삽화 ; c20 cm 레코드 5에서새로운저작 < 저작 > 만화우리들의일그러진영웅 24500 a우리들의일그러진영웅 7001 a이문열, d1948-, e원작 7001 a이원희, e그림 < 표현형 > 레코드 5 에서표현형 - 32 -
리더 /06 = a --> 인쇄자료 008/33 = c --> 문학형식이 만화 임 008/35-37 kor --> 한국어 < 구현형 > 레코드 5에서구현형 1 0201 a8990365813( 세트 ) 020 a8990365856(1) g77810: c\9500 020 a8990365864(2) g77810: c\9500 24500 a우리들의일그러진영웅. n1-2/ d이문열원작 ; e이원희그림 250 a개정판 260 a서울 : b이가서, c2004 300 a2책 : b전부색채삽화; c23cm 레코드 6에서새로운저작 < 저작 > 영화우리들의일그러진영웅 24500 a우리들의일그러진영웅 7001 a이문열, d1948-, e원작 7001 a박종원, e감독 < 표현형 > 레코드 6에서표현형리더 /06 = g --> 영화 008/35-37 kor --> 한국어 < 구현형 > 레코드 6에서구현형 1 24500 a우리들의일그러진영웅 h[ 영화 ]/ d박종원감독 ; e이문열원작 260 a서울 : b대동흥업, c1992 300 a필름카세트 1개 (119분): b유성, 천연색 ; c35 mm - 33 -
제 3 장 FRBR 및 RDA 의적용사례분석 FRBR 및 RDA가발표된이후여기에대한많은연구와적용이이루어지고있다. 그런데이를실제로적용하기위해서는알고리즘개발이선행되지않으면방대한서지레코드를대상으로관련저작을세트별로그룹핑하는것이거의불가능하다. FRBRization이란 MARC 등다른인코팅스키마로이미편목되어진서지레코드를 FRBR 개체로재분해하는과정이다. 즉기존의서지레코드를 FRBR 모형의관점으로분해하여저작수준으로모으고, 모아진레코드를표현형수준, 구현형수준, 개별자료수준으로구분하는것이다. 이러한 FRBRization 과정은수작업으로구현하는것은거의불가능하기때문에프로그램을통한알고리즘을통해자동화를통해이뤄진다. FRBR 모형이발표되고서지 DB에실제적으로적용하기위한과정에서 FRBRization 하기위한알고리즘에대한논의가다수진행되었다. 이절에서는자동화된알고리즘에대한논의를중심으로살펴보고자한다. 1. FRBR 알고리즘에대한논의개요 1) 국외에서의 FRBR 알고리즘논의 (1) OCLC FRBR 알고리즘논의중대표적인사례로 OCLC의 FRBR Work-Set Algorithm을들수있다. OCLC는대규모서지데이터베이스인 WorldCat에 FRBR 모형을적용하고, 그잠재력을개발하기위한상당한노력을기울여왔다. 그결과 OCLC는 2005년 FRBR Work-Set Algorithm Version 1.0 16) 을, 2009년도에는 Version 2.0 17) 을발표하였다. FRBR Work-Set Algorithm은각서지레코드에저자 / 표제키 (key) 를부여하기위한것이며, 이렇게부여된저자 / 표제키는현행서지레코드를 FRBR 모형의관점의저작그룹으로묶을수있는기준이되며, 동일한저자 / 표제키가부여된서지레코드는하나의 Work-Set( 저작-셋 ) 으로묶인다. OCLC가알고리즘의명칭을 Work-Set 이라고명명한이유는현행레코드는 저작 을확인하는것은가능하지만, 표현형 을식별하기위한정교한알고리즘개발은불가능한하다고판단하였기때문이며, 표현형수준의식별을위해서단지 언어 (008/35-37 언어부호 ) 만을사용하였다. FRBR Work-Set Algorithm의전체적인과정은먼저전거레코드로부터표목 ( 이름 / 표제 ( 혹 16) Thomas B. Hickey & Jenny Toves. FRBR Work-Set Algorithm. Version 1.0. 2005. 17) Thomas B. Hickey & Jenny Toves. FRBR Work-Set Algorithm. Version 2.0. 2009. - 34 -
은이름 ) 대표형과변형 ) 을자동생성하고, 서지레코드에서저자명과표제를추출하여, 전거레코드의표목과매칭시키고, 알고리즘에서정의한규칙에의해일치하는경우동일한 Work-Set 으로묶은후, 전거레코드에서추출한 이름 / 표제 대표형을저작의대표키로할당한다. 우선전거레코드에서표목을자동생성하는과정은두가지유형이있다. 첫번째유형은 100 필드및 400 필드 $a와 $t에이름과표제가모두있는경우로아래의과정을거친다. 100 1_$aTwain, Mark, $d 1835-1910, $t Adventures of Huckleberry Finn. $1 Spanish 400 1_$aTwain, Mark, $d 1835-1910. $t Aventuras de Huck Finn 400 1_$aTwain, Mark, $d 1835-1910, $t Aventuras de Huckleberry Finn 전거레코드에서 이름 / 표제 의대표형과변형을추출하여세트를형성한다. 100 필드의 $t 또는 130 필드의 $a에서표제를추출한다. 100 필드의 $a,$ b, $c, $d, $q를조합하여저자명을생성한다. 추출된 이름 과 표제 를조합하여 이름 / 표제 대표형을생성한다. 400 필드의 $t와 $a, $b, $c, $d, $q를조합하여 이름 / 표제 변형을생성한다. 두번째유형은 100 필드및 400 필드의 $t 가부재한경우이며, 아래와같은과정을거친다. 100 1_ $amitchell, Margaret, $d 1900-1949 400 1_ $amarsh, John Robert, $c Mrs., $d 1900-1949 400 1_ $amarsh, Margaret Mitchell, $d 1900-1949 전거레코드에서 이름 / 표제 의대표형과변형을추출하여세트를형성한다. 전거레코드에서 이름 의대표형과변형을추출하여세트를형성한다. 100 필드가없는것은그냥넘어간다. 100 필드의 $t가있는것은그냥넘어간다. 130 필드의 $a가있는것은그냥넘어간다. 100 필드의 $a, $b, $c, $d, $q를조합하여대표형을구성한다. 400 필드의 $a, $b, $c, $d, $q를조합하여변형을생성한다. 다음으로서지레코드로부터매칭시킬표제및저자명의표목을추출하는단계로아래와같은 과정을거친다. - 35 -
서지레코드 100, 110, 111 필드에서저자명을추출하고, 앞단계에서추출된 이름 대표형및변형과비교한다. 서지에서추출된저자명이앞의전거레코드 이름 추출인두번째단계에서추출된표목중하나와일치할경우, 전거에서추출한 이름 대표형으로변환한다. 서지레코드의 130 필드 $a, $n, $p, $s와 240필드 $a, $n을추출한다. 서지레코드에해당필드가부재할경우, 242, 245, 246, 247 필드순으로표제관련정보를추출하고정규화한다. NACO의정규화규칙 (htto://www.loc.gov/catdir/pcc/naco/normrule.html) 을적용한다. 위의두과정에서대표형으로전환된 이름 과 표제 를조합하여 이름 / 표제 를생성하고, 전거레코드 이름 / 표제 추출인첫번째단계에서추출된 이름 / 표제 대표형및 이름 / 표제 변형과비교한다. 일치할경우, 동일 Work Set 으로처리한다. 1XX가존재하지않는서지레코드의경우는서지레코드의 130 필드 $a, $n, $p, $s, 240필드 $a, $n에서표제를추출하여 d와같이정규화한다. 130, 240 필드가부재한경우는 242, 245, 246, 247 필드의 $a 순으로표제를추출하여역시 d와같이정규화한다. 정규화된표제와 7xx에서추출된부출저자명을조합한다. 아래와같이표제와복수개의부출저자명을조합한결과, 1,2,3,4와동일할경우, 하나의 Work Set으로클러스터하고, 5와같을경우는별도의클러스터를생성시킨다. 1 표제 / 저자부출 A 2 / 저자부출 A, B 3 / 저자부출 B, C 4 / 저자부출 C 5 / 저자부출 D, E 서지레코드 130 필드에 통일표제 가존재하는경우는위의절차를생략하고 통일표제 전 거레코드와매칭하여일치할경우, Work Set 으로묶는다. 2009년발표된 Version 2.0는 Version 1.0의내용중서지레코드를위한주요키생성을보완하기위한것이다. Version 2.0의주요내용은다음과같다. Version 1.0과 Version 2.0의주요차이는 880 추가, 간략표제와완전표제구분을명확히하였고, 저자 (1XX author) 와이름 (7XX name) 을구분하여사용하였으며, noise 표제 ( 예 : speeches ) 를삽입했다는것이다. - 36 -
1) 저자가있다면, 표제와조합하여저자 (author) + 표제 (1) 저자 -100, 110, 111($a, $b, $c, $d, $q) 과 1XX와연결된 880 (2) 간략표제 -246 a( 만약 008의언어부호가언어가아닌경우 ) -242, 245, 246, 247 $a -880 $a (3) 완전표제 -240 $amnpr -246 $abfgnp -242, 245, 246, 247 $abfgnp -740 $anp -245 $kfg -880 $amnpr -880 $abfgnp -880 $anp -880 $kfg 2) 통일표제 -130 $amnpr 3) 표제와하나혹은그이상이름 (name) 7XX(700, 710, 711) (1) 이름 -700, 710, 711($a, $b, $c, $d, $q) 과 7XX와연결된 880-720 ( 저자가없는셋을위한후처리는동일함 ) (2) 표제위와동일 4) 표제와 OCLC 번호조합 ( 각단계마다 NACO 의정규화규칙 (htto://www.loc.gov/catdir/pcc/naco/normrule.html) 을적용 ) (2) LC Library of Congress는 FRBR Display Tool Version 2.0 18) 을개발하였다. LC는 2002년 MARC 서지와소장형식을 FRBR 관점에서조사하고그결과를 Functional Analysis of the MARC 21 Bibliographic and Holdings Formats 로발표하였고 2006년까지그내용을개정하 18) Library of Congress. FRBR Display Tool. Version 2.0. 2009. - 37 -
였다 19) 여기에는 MARC21 데이터요소를 FRBR로의매핑표를제안하고있는데, 이는 FRBR Display Tool 개발에상당한영향을주었다. LC는 2009년 FRBR Display Tool Version 2.0을발표하였다. FRBR Display Tool Version 2.0의목적은검색결과화면에출력된레코드를의미있는구조로재배열함으로써이용자들이원하는자료를보다편리하게선택하는데도움을주고자하는것으로, 웹페이지에검색결과로출력된데이터셋을대상으로작동하는웹프로그램이다. LC가서지레코드를활용할수있었던이유는서지레코드의표목부가전거레코드를통해이미통제된상태의데이터를수록하고있기때문이다. FRBR Display Tool Version 2.0의작동순서는서지레코드에서 저자 + 표제 또는 표제 를추출한후이들데이터를저작을판별하기위한근거로삼은다음, 동일저작으로분류된레코드를대상으로다시 자료유형 과 언어 로나누어차하위계층인표현을구성하도록설계하였다. FRBR Display Tool Version 2.0에서저작, 표현형, 구현형의주요키생성과정을살펴보면다음과같다. 1) 저작 (1) 저작매칭 ( 저자와표제를이용함 ) 저자매칭 : 매칭 : 100$a$b$c$d(or) 110$a$b$c$d(or) 111$a$c$d$n$q 소트 : 저자의알파벳순으로 디스플레이 : 100$a$b$c$d$q (or) 110$a$b$c$d (or) 111$a$c$d$n$q 표제매칭 : 매칭 : 240$a$d$k$m$n$p$r (or) 243$a$d$m$n$p$r (or) 245$a$g$k$n$p 소트 : 첫번째문자에의한알파벳순 디스플레이 : 240$a$d$k$m$n$p$r (or) 243$a$d$m$n$p$r (or) 245$a$g$k$n$p (2) 저작매칭 ( 표제만을이용함 )(1XX 없을때 ) 매칭 : 130 $a$d$k$m$n$p$r(or) 240 $a$d$k$m$n$p$r(or) 243 $a$d$k$m$n$p$r(or) 245 $a$g$k$n$p 소트 : 표제의알파벳순으로 디스플레이 : 130$a$d$k$m$n$p$r (or) 240$a$d$k$m$n$p$r (or) 243$a$d$m$n$p$r (or) 245$a$g$k$n$p 19) Delsey, T. Functional Analysis of the MARC 21 Bibliographic and Holdings Formats. 2002. <www.loc.gov/marc/marc-functional-analysis/analysis.pdf> [cited 2014. 10. 15] - 38 -
2) 표현형 매칭 -리더/06( 레코드형식 ) -008/35-37( 언어부호 ) 소트리더 /06( 레코드형식 ) 의알파벳순으로, 다음으로 008/ 35-37( 언어부호 ) 의알파벳순 디스플레이 : 형식 (Form): 리더 /06-008/35-37 3) 구현형 매칭 : 구현형수준에서는클러스터링을수행하지않는다. 소트 : 발행년도 (008 필드의 07-10) 디스플레이 : -판사항 : 250 $a, $b -제목 : 245 $a, $b, $n, $p($b가공란이면디스플레이하지않음 ) -저작책임 : 245 $c -출판사항 : 260 $b, $c, $g -형태사항 : 300($6, $8제외 ) -ISBN : 020 $a, $c, $z -ISSN : 022 $a, $y, $z -출판사번호 : 028 $a, $b -CODEN : 030 $a, $z -Reproduction : 533($6, $7, $8 제외 ) (3) 노르웨이국립도서관 ( 노르웨이 OPAC BibSYS) 노르웨이국립도서관은 BibSYS FRBR project의일환으로 BibSYS FRBR conversion tool을개발하였다. BibSYS FRBR conversion tool은 BibSYS database에 FRBR 모형을어떻게적용할것인지, 적용시의주요변화와핵심키에대해연구하기위한것이다. BibSYS는노르웨이대학도서관, 국가도서관, 학교도서관, 몇몇연구도서관들의도서관을위한센터역할을하는곳이다. BibSYS MARC은 NORMARC에기반하고있으며, NORMARC은 USMARC의하위셋이라고할수있지만완전히동일하지는않다. 20) BibSYS FRBR conversion tool은 MARC 레코드를 MarcXchange XML format로변환한후, FRBR 속성과관계요소로확장되어각개체에따른레코드를보여준다. 그러나 BibSYS FRBR conversion tool는개발후충분한테스트를거치지않은것으로보고되고있다. BibSYS FRBR conversion tool의구체적인알고리즘은다음과같다. 21) 20) Trond Aalberg, Frank Berg Haugen, Ole Husby. A Tool for Converting from MARC to FRBR. Research and Advanced Technology for Digital Libraries, Lecture Notes in Computer Science, Vol.4172(2006), pp.453-456. 21) Knut Hegna and Eeva Murtomaa. Data mining MARC to find: FRBR?. <http://folk.uio.no/knuthe/dok/frbr/> [cited 2014. 10. 15] - 39 -
1) 저작수준저자 + 표제저자 -100 $ah -700 $ah 표제 -먼저통일표제고려 -241 (original title) -500과 505 $a(original title에대한주기 ) -248 $h 240 $a(original title/standard title) -245 $a 2) 표현형수준 -011 $a( 언어부호 ) 041 $a -991 $a( 언어부호 ), 700*1 $ah 3) 구현형수준 -260 $c -245 $a -300 $a -260 $b (4) Chinese Koha system Chinese Koha system에 FRBR 모형을적용하기위한프로젝트가진행되었다. 이프로젝트의목적은 Koha 도서관관리시스템에 CMARC/MARC21간의알고리즘매핑을통해 FRBR모델을도입하고차세대 FRBR OPAC(Online Public Access Catalog) 을개발하는것이다. 프로젝트결과 Koha에서 FRBR화된구조에서로다른유형의자료의현존하는레코드를변환하는 LibFRBR(FRBR 어플리케이션기능 ) 의개발, 실현가능한 FRBR OPAC 이용자인터페이스설계, 목록자를위한실현가능한 FRBR관리인터페이스설계등의성과를보였다. 서지레코드에서저작개체를위한기능요건을식별하기위해 UNIMARC 링크필드의사용가능성을검토하였다. 45X필드 ( 링크필드 ) 로링크된모든레코드는동일한저작으로묶인다. 테스트를위해 HAL(Hellenic Academic Libraries) 의종합목록으로부터고대그리스저자의레코드샘플을사용하였다. 테스트결과낮은재현율과링크필드추가의필요성이드러났으며이것은통일표제 (500 필드 ) 의부재와주요표제 (200 필드 ) 의큰차이점에기인한것이다. 재현율을높이기위해저작의식별을위해이전에무시되었던표제필드와같은데이터를추가로사용할계획이며, 하나의표제필드를선택하는대신서로다른표제를가지고있는모든필드를비교할것이라고 - 40 -
밝히고있다. 22) 이프로젝트에서사용된 FRBR 알고리즘은 Peponakis 와 Sfakakis, Kapidakis 의 연구에서확인할수있다. 23) 1) 저자기본기입저자필드가있는경우 700, 710, 720 사용기본기입저자필드가없는경우 701, 711, 721 사용 2) 표제 OCLC의알고리즘 (2005) 사용표제필드 : 통일표제 ( 기본 )(MARC21 130 => UNIMARC 500, 지시기호 2 값 1 통일표제 ( 기본아닌경우 )(MARC21 240 => UNIMARC 500, 지시기호 2 값 0 목록자의번역표제 (MARC21 242 => UNIMARC 541) 본표제 (UNIMARC 200 => MARC21 245) 다른이형표제 (MARC21 246 => UNIMARC 517) 이전표제 (MARC21 247 => UNIMARC 520) 동일저작의상이한표현형과구현형을구분하기위해 45X( 수평관계 ) UNIMARC 링크필드고려 ( 상이한판, 번역과복제등 ) 3) 레코드유형 레코드라벨유형키부분 (Record Label Type Key part) UCLA의 Martha Lee는그의연구에서 OCLC 와 LC에서저작을식별하기위한기준으로삼았던 저자 나 표제 이외에 분출표목 이나 주제명표목 등도식별요소가될수있음을언급하였다. 표현형의식별은기계적으로불가능하다고보았다. 통일표제를가지고있는레코드라면, 통일표제다음에나오는언어나판, 날짜등을표현형을식별하는중요한단서로활용가능하다고보았다. 24) 22) Naicheng Chang and Yuchin Tsai. FRBRisation of Koha in the Context of CMARC: a UNIMARC-derived format, In: 77th IFLA General Conference and Assembly, San Juan, Puerto Rico, 13-18 August 2011. <http://conference.ifla.org/past-wlic/2011/187-chang-en.pdf> [cited 2014. 10. 15]. 23) Manolis Peponakis, Michalis Sfakakis, and Sarantos Kapidakis. FRBRization: using UNIMARC link fields to identify Works, In: 77th IFLA General Conference and Assembly, San Juan, Puerto Rico, 13-18 August 2011. <http://eprints.rclis.org/16679/1/187-peponakis-en.pdf> [cited 2014. 10. 15]. 24) Martha M. Yee. FRBRization: a Method for Turning Online Public Finding Lists into Online Public Catalogs, Information Technology and Libraries, Vol.24, No.3(2005), <http://escholarship.org/uc/item/7gx5v7q5> [cited 2014. 10. 15]. - 41 -
2) 국내에서의 FRBR 알고리즘논의 조재인은 FRBR 응용을선두하고있는 OCLC와 LC를중심으로 FRBR 알고리즘의구성요소및기능적흐름을분석하고이를바탕으로국내기구축 KORMARC 데이터베이스의 FRBR 변환가능성을분석하고적절한대안으로저록클러스터링의기본구성및기능적흐름을다음과같이 4단계로구분하여제시하고있다. 25) 1) 이과정은매칭의기준이될서지레코드를임의로지정하고매칭필드를구성하는단계이다. 여기서추출된매칭필드가저작레벨클러스터의대표엔트리로지정되는것은아니다. 서지레코드의 1XX와 245필드의 a에서저자명과표제를추출한후, 매칭의기준이될 < 저자명 / 표제 > 세트구성 2) 이과정은클러스터링대상이되는전체서지레코드에서기준데이터와매칭시킬필드를구성하는단계이다. 이단계에서는주기와연관저록필드에서표제정보를추출하기위한정규화규칙과정교한알고리즘이포함되어야한다. 매칭의대상이될이미구축된서지레코드의저자및표제관련필드에서표목을추출하고교차조합하여복수개의 < 저자명 / 표제 > 세트구성 1XX, 7XX 등에서저자관련정보를추출하고, 245 필드의표제, 7XX의부출표제및연관저록, 5XX의주기등에서표제관련정보를추출 3) 이과정은추출된필드를매칭하여클러스터를생성하는단계인데, 이단계에서는임계치를설정하여매칭결과값에따라일치또는불일치를판정할수있는모듈이개발되어야한다. 기준이되는 < 저자명 / 표제 > 세트와매칭의대상이되는 < 저자명 / 표제 > 세트를비교하여일정기준조건이상을충족할경우동일클러스터로그룹핑 4) 이과정은생성된개별클러스터에서저작레벨의대표엔트리로활용될표목을지정하고클러스터링된개별서지레코드의상세정보를조회하여적합여부를검증하는단계이다. 이단계는전적으로전문가가육안식별방법을통하여처리해야한다. 클러스터를육안식별하여, 저작레벨의대표엔트리를재지정하며, 그룹멤버의상세서지정보를검증하여적합하지않은서지레코드를제거 또한 2006 년도의연구에서도알고리즘의적용과동시에육안식별과정을병행하는 semi-automated' 를제안하고있으며, 이를요약하면 (1) 기본표목으로서의통일표제 (130 필 드 ) 가있을경우이를저작식별요소로활용하고, (2) 통일표제가없을경우서지레코드에 제시되어있는표제 (240/245/505/730/740 필드의첫번째표제 ) 와저자명 (100/110/111/700/ 25) 조재인. FRBR 알고리즘분석및 KORMARC 데이터베이스적용방안, 한국문헌정보학회지. 제 38 권제 3 호 (2004. 9), pp.5-21. - 42 -
710/711 필드 ) 에서 저자 + 표제 데이터를추출한후전체레코드와의 1:1비교를통해동일한것으로간주될경우동일저작으로군집하되, (3) 반드시전문가가그적합여부를검증하여적합하지않은레코드를제거하도록하는것이었다. 26) 국립중앙도서관에서는국립디지털도서관운영시범사업의연구로 FRBR 모형기반온톨로지설계가진행하였다. 한국문학을대상으로 FRBR 모형기반프로토타입을개발 ( 문학작품, 저자, 장르별, 시대별구분 ) 하였다. 이연구에서는저작수준에서는 OCLC의 FRBR 변환알고리즘을활용하여, (1) 저자표목 (1XX a, 7XX 10 a) 과표제 (245 a, 74X a) 를추출하여상호비교를통해동일한것으로판명될경우동일저작으로확정하고, (2) 동일저작으로판명된레코드에대해언어정보 (008/35-37), 008/23( 자료유형 ), 041 a의異同에따라표현형으로구분한뒤, (3) 이들을다시출판사항 (260 b), 발행년 (008/07-10, 260 c), 매체유형 (leader/06-07, 245 h) 의異同에따라구현형으로, 그리고 (4) 동일구현형으로판명된레코드중에서복본표시 (049 c) 가있을경우이를개별자료로간주하는 KORMARC 변환알고리즘 을제안하였다. 27) 김현희는자료간의관련도가높은것으로알려진음악자료를대상으로통합서지용 KORMARC 데이터베이스에 FRBR 모형의적용가능성을실험적으로검증하기위하여, KORMARC에서저작과표현형을식별하고구현형들을군집시키기위한알고리즘을설계하고, 실제 KERIS의레코드 (107건) 에제안된알고리즘을적용하여그적용률을분석하고그결과물을실험시스템을통해구현하였다. 연구에서제안된구체적인알고리즘은다음과같다. 28) 1) 저작 (1) 저작매칭 ( 저자와표제를이용함 ) 저자매칭 : -100 abcd(or) 110 abcd(or) 111 acdn -700 abcd(or) 710 abcd(or) 711 acdn 표제매칭 : -240 adkmnpr(or) 243 adkmnp r(or) 245 agknp -730 admnp (2) 저작매칭 ( 표제만을이용함 ) -130 adkmnpr(or) 240 adkmnpr(or) 243 adkmnpr(or) 245 agknp 26) Jane Cho. A study on the application method of the Functional Requirements for Bibliographic Records (FRBR) to the Online Public Access Catalog(OPAC) in Korean libraries, Library Collections Acquisitions & Technical Services, Vol.30(2006), pp.202-213. 27) 국립중앙도서관. 표준메타데이터모델및시맨틱언어연구. 국립디지털도서관운영시범사업. 2007. 28) 김현희, 유영준, 박서은. FRBR 모형의 KORMARC 데이터베이스로의적용가능성에대한실험적연구 : 음악자료를중심으로, 한국도서관정보학회지, 제 38 권제 2 호 (2007), pp.185 202. - 43 -
2) 표현형 -Leader/06과 008/35-37(or) 546 a -245 h -254 a -511 a -518 a -700 adem4-710 abem4 3) 구현형 매칭 -260 bcg -300 abcefg 디스플레이 -250 ab -245 abnp -245 d -260 bcg -300 abcefg -020 acz -028 ab -033 abc -533( 3, 7, 8을제외한모든서브필드 ) 김현희의연구에서제안된알고리즘은전체적으로 LC의것을유지하되아래사항을변경하였다. 저자확인에서 111 q 연구대상은 KORMARC 에는정의되지않아사용하지않았고, KORMARC 대부분이 1XX를사용하지않으므로 7XX를추가시켰다. 243 k를포함시켰고, 음악자료의특성을반영하여표현형에많은식별기호추가하였다. 구현형수준에서 LC는매칭은하지않았지만, 이연구에서는매칭단계를언급하였고, LC의 022, 030 필드를제외하였으며, 033 필드를추가하였다. 노지현은기존의 FRBR 알고리즘을검토하고이러한알고리즘을 KORMARC 레코드에대입해보는과정을세부적으로추적하면서, 이과정에서발행할수있는실질적인문제점이나어려움을구체적인사례를통해예측해보기위해, 국립중앙도서관의서지레코드 (161건) 에 FRBR 모형을적용하기위한알고리즘을논의하고적용해보는실험을수행하였다. 29) 먼저저 29) 노지현. KORMARC 레코드에대한 FRBR 모델의적용실험 : 국립중앙도서관서지레코드를사례로하여, 한국도서관 정보 - 44 -
작개체로의군집화는 100+240, 100+245, 100+740, 700+240, 700+740, 900+245, 900+245, 900+740 필드로부터 저자 + 표제 의조합이만들어졌으며, 이들에대한상호매칭을통해동일여부를가늠하였다. 표현형에대한구분은자료유형 ( 리더 /06( 레코드형식 ), 008/23 ( 자료의유형 )) 과언어 (008/35-37( 언어부호 ), 130 l, 240 l), 이용대상자수준 (008/22( 이용대상자수준 )) 을사용하였다. 구현형은동일표현형아래에나열하는수준의작업하였다. 이미화는 FRBR 저작및표현형클러스터링알고리즘을설계하여도서관온라인목록에적용하고, 저작및표현형클러스터링정도를파악하고, 클러스터링이낮은문제점을목록의측면에서분석하였다. 이연구에서제안된알고리즘은다음과같다. 30) 1) 저작 저작대표키생성알고리즘 -130 a 통일표제를갖는자료는통일표제로색인을추출하고종료한다. -130 a가없는경우 240 a 값을체크하고이를표제의대표명으로처리한다. -저자명은 100 a, 110 a b, 111 a를추출하여표제와저자명을조합한표제 / 저자색인을생성한다. -저자기본기입이없는경우는 700 a, 710 a b, 711 a 중에서 2개까지만추출해표제 / 부출저자색인을생성한다. -240 a가없는경우에는 507 t를표제로추출하고, 507 a에서저자명을추출해색인키를작성한다. -507 a나 t가없는경우 245 a에서표제를추출하고, 100 a, 또는 110 a b, 또는 111 a를추출하여표제 / 저자색인키를생성한다. -1XX가없는경우 700 a, 710 a b, 711 a에서표제 / 부출저자색인을생성하였다. 700 a에서색인을작성할경우저자명을 2개까지추출하되표제가같고저자명이한개라도같은경우동일저작으로취급한다. 알고리즘을통해서지레코드마다저작대표키를생성하며, 추출되는내용은표제, 저자명, 해당하는서지번호로서지번호를통해 MARC레코드를참조한다. 저작세트생성서지레코드마다생성된대표색인키를하나씩모두비교하여동일저작일경우같은저작으로묶고, 다른경우는새로운저작으로처리한다. 통일표제를갖는자료는표제색인에서비교하고, 표제 / 저자명을갖는자료는표제와저자명색인에서비교한다. 둘이상의저자를갖는부출저자와표제색인의경우표제 / 저자명색인에서비교하였다. 비교결과저작대표키가동일한경우동일저작에해당하는레코드의서지번호를나열한저작세트리스트가생성된다. 학회지, 제 39 권제 2 호 (2008), pp.291-312. 30) 이미화. 정연경. 저작클러스터링분석을통한 FRBR 의목록적용에관한연구, 정보관리학회지. 제 25 권제 3 호 (2008), pp.65 82. - 45 -
2) 표현형 -008의 35-37( 언어부호 ) -041 a -250 a 숫자만추출동일저작이만들어진후표현형집중을위한색인을생성한다. 동일저작내언어와개정사항이표현형식별정보가된다. 언어를구분하기위해 008/35-37의언어코드를중신으로표현형데이터를추출하되, 해당데이터가없는경우 041 a에서데이터를추출하였다. 개정에따른표현형구분을위해서는 250 a 에서숫자만을추출하였다. 예를들어, Little Prince/Saint 라는저작내에서 3개의레코드중영어가 1개, 한국어자료가 2개이며, 한국어자료는각각 1판과 2판일경우영어1판, 한국어1판, 한국어2판으로총 3개의표현형대표키가생성된다. 표현형세트키는동일언어이면서개정일경우해당하는서지번호가생성된다. 3) 구현형 단행본, 전자도서, 비디오자료를대상으로저작당평균 1.2 개의구현형레코드를갖는것으 로조사되었다. 저작당구현형의수를계량적으로분석하였다. 이미화의알고리즘의경우구현형수가많은상위저작의순또는표현형이많은상위저작순으로나열하도록하였다. 이미화의연구에서도알고리즘만으로완벽한저작의클러스터링이어려우며전문가의점검이필요하다고언급하고있다. 특히문학의경우원서와번역서의매칭을수작업검색으로다시확인할필요있음을주장하였다. 또한연관저록분석결과양서의경우 776 필드 ( 기타형태 ) 입력건수 117회, 동서의경우 765 필드 ( 원본 ) 22회등기타연관저록입력건수는매우낮은것으로조사되었다. 2. 기존 FRBR 알고리즘비교 기존의 FRBR 알고리즘을전체적인흐름을비교하면, 크게두가지로대별된다. 우선 OCLC 의알고리즘은전체데이터베이스를대상으로 FRBR 알고리즘을적용하며, 매칭정보로는전거와서지의이름, 표제관련표목을사용하는데, 구체적으로는전거레코드로부터표목 ( 이름 + 표제 ( 혹은이름 ) 대표형과변형 ) 을자동생성하고, 서지레코드에서저자명 + 표제를추출하여, 전거레코드의표목 ( 이름 + 표제 ( 혹은이름 ) 대표형과변형 ) 전거와서지레코드의이름 + 표제관련표목을매칭한다. 매칭된서지레코드의대표엔트리로는전거레코드의이름 + 표제또는이름또는통일표제중적절한대표형을저작의대표키로할당한다. 반면 LC의알고리즘은이름또는표제로검색한결과로출력되는서지레코드를대상으로 - 46 -
FRBR 알고리즘을적용하며, 매칭정보로는서지레코드의 저자 + 표제 또는 표제 를추출한후서지레코드끼리매칭한다. 대표엔트리로는서지레코드의저자, 표제대표키를할당한다. 국내에서는국내의전거레코드구축이체계적이지못하다는이유로서지레코드를통한 FRBR 알고리즘개발에초점을두고있다. 그러나적용대상은전체데이터베이스를대상을먼저고려하고있으며, 매칭정보는 LC의알고리즘처럼서지레코드끼리비교하는방식을채택하고있다. 다음으로기존의 FRBR 알고리즘에서사용된저작수준의대표키생성과표현형, 구현형, 개별자료수준에서의식별요소를비교하면 < 표 4> 와같다. 1 O C LC 구분 Ver 1.0 Ver 2.0 2 LC Ver 2.0 < 표 4> 기존의 FRBR 알고리즘비교분석 저작수준의저자 / 표제키 대표키조합 저자키 표제키 - 표제와저자 (1XX) 조합이나통일표제 -1XX 가없다면 7XX 의이름을고려함 -1XX 가없다면후처리과정을거침 - 위의정보가없으면표제와 OCLC 번호사용 - 저자 (1XX) 가있는경우저자 + 표제 - 통일표제 - 저자 (1XX) 가없는경우 7XX(700, 710, 710, 711) 이름 + 표제 - 표제 +OCLC 번호 -1XX 있는경우저자 + 표제 -1XX 없는경우표제 - 서지레코드 100, 110, 111 $abcdq 에서저자명추출 -1XX 있는경우 100, 110, 111 $abdq 와 1XX 가연결된 880-1XX 없는경우 700, 710, 711 $abcdq 와 7XX 가연결된 880 720-1XX 있는경우 100 $abcd(or) 110 $abcd(or) 111 $acdnq - 간략표제구성 130 $amnpr 240 $amnpr 242, 245, 246, 247 (1 만약 008 의언어부호가언어가아닌경우 246 이우선되는표제필드임. 2 레코드에 110$a 는포함되어있지만 100 과 111 이저자가없는경우 $abfgnp. 3 그에경우 $a 사용 ) - 완전 (full) 표제구성 단축표제가 242, 245, 246, 247$a 만사용했다면, $abfgnp 740$anp 245$k -간략표제 246 $a( 만약 008 의언어부호가언어가아닌경우 ) 242, 245, 246, 247$a 880 $a -완전표제 240 $amnpr 246 $abfgnp 242, 245, 246, 247 $abfgnp 740 $anp 245 $kfg 880 $amnpr 880 $abfgnp 880 $anp 880 $kfg -통일표제 130 $amnpr -1XX 가있는경우 240 $adkmnpr(or) 243 $admnpr(or) 245 $agknp -1XX 가없는경우 130 $adkmnpr(or) 240 $adkmnpr(or) 243 $adkmnpr(or) 245 $agknp 표현형 -008/ 35-37 구현형 개별자료 - - - - - - 리더 /06-008/ 35-37 -250 $ab -245 $abnp -245 $c -260 $bcg -300-020 $acz -022 $ayz -028 $ab -030 $az -533 - - 47 -
3 노르웨이국립도서관 - 통일표제 - 저자 + 표제 -100 $ah -700 $ah - 241(original title) - 500 과 505$a( 원표제주기 ) - 248$h 240$a (original title/ standard title) - 245$a -011$a ( 언어부호 ) 041$a -991$a ( 언어부호 ) 700$1ah -260$c -245$a -300$a -260$b - 4 조재인 - 통일표제 - 저자 + 표제 -100/110/111 /700/710/711 - 통일표제 130 필드 - 표제 240/245/505/730/740 필드의첫번째표제 - - - 5 국립중앙도서관 - 저자 + 표제 -1XX a -7XX a -245 a -74X a -008/23-008/35-37 -041 a -250 a -260 c -260 b -300 a -052 ab -049 lc 6 김현희 -1XX 있는경우, 저자 + 표제 -1XX 없는경우, 표제 -1XX 있는경우 100 abcd(or) 110 abcd(or) 111 acdn -1XX 없는경우 700 abcd(or) 710 abcd(or) 711 acdn -1XX 있는경우 240 adkmnpr(or) 243 adkmnpr(or) 245 agknp 730 admnp -1XX 없는경우 130 adkmnpr(or) 240 adkmnpr(or) 243 adkmnpr(or) 245 agknp - 리더 /06 과 008/35-37 (or) 546 a -245 h -254 a -511 a -518 a -700 adem4-710 abem4-260 bcg -300 abcefg 7 노지현 -100/700/900-240/245/740 - 자료유형 리더 /06 008/23 - 언어 08/35-37 130 l 240 l - 이용대상자수준 008/22 - -052/ 049 8 이미화 - 통일표제 - 저자 + 표제 -1XX 있는경우 100 a, 110 ab, 111 a -1XX 없는경우 700 a, 710 ab, 711 a 중에서 2 개까지만 507 a - 통일표제 130 a - 표제 240 a 507 t 를표제 * 245 a -008 의 35-37 -041 a 와 250 a 의숫자만추출 - - - 48 -
우선저작수준의대표키생성과조합에대해서살펴보고자한다. 저작대표키조합의방법에대해선행알고리즘마다사용하는표현방법이나사용하는표시기호나식별기호, 우선순위등의차이가있지만, 저작대표키조합방법에대해요약하면다음과같다. OCLC의알고리즘에서는 1 저자 (1XX) 가있는경우, 저자 (author, 1XX)+ 표제조합, 2 통일표제사용, 3 저자 (1XX) 가없는경우, 이름 (name, 7XX)+ 표제조합, 4 표제 + 번호의기타방법등을언급하고있고, 특히저자 (1XX author) 와이름 (7XX name) 을구분하였다. LC의알고리즘에서는 1 1XX 있는경우저자 + 표제조합과 2 1XX 없는경우표제사용에대해언급하고있으며, OCLC와달리 1XX 없을때 7XX를사용하지않으며, 7XX의사용에대해아직검토중이라고밝히고있다. LC에서는이름또는표제로검색한결과로출력되는서지레코드를대상으로 FRBR 알고리즘을적용하기때문에표제만으로도저작대표키를사용하고있다. BibSYS에서는 1 통일표제사용, 2 저자 + 표제조합사용으로대별하고있다. 국내의경우대표키조합에대해서 1 통일표제사용, 2 저자 + 표제조합으로대별될수있으며, 1XX가없는경우가대부분이기때문에 7XX를이용한조합을언급하고있다. 저작대표키의한부분인저자키생성과관련하여, LC는 1XX만, 나머지선행연구에서는 7XX도포함시키고있으며, OCLC는 1XX와 7XX와연결된 880까지포함하며, 노지현은 900을포함시키고있다. 저자키생성과관련된필드의식별기호에대해서는 LC는 1XX(100 abcd(or) 110 abcd(or) 111 acdnq) 를포함시키고있고, OCLC는 1XX와 7XX의 abcd 뿐만아니라 q도포함시키고있다. 국내의경우이미화와국립중앙도서관, 김현희연구에서식별기호까지언급이있는데, 이미화와국립중앙도서관연구에서는 1XX와 7XX의 a만을, 김현희는 LC와유사하게식별기호 abcd까지언급하고있다. 저작대표키의또다른부분인표제키생성과관련하여 LC는 1 1XX가있는경우는 240 adkmnpr(or) 243 admnpr(or) 245 agknp, 2 1XX가없는경우는 130 adkmnpr(or) 240 adkmnpr(or) 243 adkmnpr(or) 245 agknp 언급하고있다. OCLC는표제를단축표제 ( 각필드의식별기호 a만사용 ) 와완전표제 ( 각필드의나머지식별기호사용 ) 로구분하여제시하고있으며, LC의 OCLC가사용하는필드이외에도 242/246/247/740/880을포함하고있다. 노르웨이국립도서관에서는 500, 505를포함하고있다. 국내의경우 240/245/740 a를포함하고있고, 조재인은 505과 730을, 이미화는 507( 분석대상이 USMARC기반인 H대학을이므로 ) 을포함시키고있고, 김현희는 LC와유사하게각필드의식별기호를포함하고있다. 통일표제에대해서는공통으로 130을언급하고있다. 동일한저작으로묶인서지레코드의표현형식별요소는 OCLC는언어 (008/35-37) 를, LC는언어에자료유형 ( 리더 /06) 을언급하고있다. 국내의경우 OCLC나 LC가언급한식별기준이외에노지현은언어에 130 l, 240 l을, 자료유형에는 008/23을추가하였고, 이용대상자수준 (008/22) 을추가하였다. 이미화는 250 a( 숫자만추출 ) 를추가하였다. 김현희는연구대상자료가음악자료임을감안하여 546 a와 245 h, 254 a, 511 a, 518 a를추가하였다. - 49 -
구현형에대해 OCLC, 조재인, 이미화의연구에서는클러스터링을수행하지않았다. LC에서도이수준에서는클러스터링을수행하지않았다. 다만구현형수준에서는발행년도 (008의 07-10) 로정렬하며, 디스플레이를위해판사항 (250 ab), 제목 (245 abnp), 저작책임 (245 c), 출판사항 (260 bcg), 형태사항 ( 300), ISBN(020 acz), ISSN(022 ayz), 출판사번호 (028 ab), CODEN(030 az), 복제 (533) 등을제안하고있다. 개별자료에대해서는국립중앙도서관과노지현의연구에서만구현형에대한복본표시와소장자료를제시하는수준의작업을수행함이언급되어있다. - 50 -
제 4 장 FRBR 및 RDA 의알고리즘설계 1. 설계원칙및방법 RDA 및 FRBR 모형의구현을위한설계내용은아래와같다. 첫째, RDA는 FRBR 모형을기반으로하고있으며, 저작의유형을크게저작, 표현형, 구현형, 개별자료의 4가지로구분하고있다. 이연구에서도저작의유형을이러한 4가지로구분하여알고리즘을개발하기로한다. 둘째, FRBR 모형의핵심은특정저작의모든관련저작을유형별로제시하는데있다. 그러기위해서는관련저작을묶을수있는연결고리가필요하며, RDA에서는전거형접근점을사용하고있다. 31) 이연구에서도 RDA에서와같이전거형접근점을작성하여관련저작을모을수있도록 저자 + 서명 과같은전거형접근점을작성할수있는알고리즘이설계될수있도록한다. 2. 실험데이터선정및분석 1) 실험데이터선정기준 RDA 및 FRBR 모형의알고리즘설계및구현을위한실험데이터의선정기준과내용은아래 와같다. (1) 개정판이있는문학개론서문학이론서의경우동일저작에판사항이다른서지레코드를다양하게제공하기위해초판과개정판등이동시에있는문학이론서 4건을실험데이터로선정하였다. (2) 한국소설문학작품의경우언어, 출판사항, 자료유형 ( 도서, 녹음자료, 시청각자료, 장애인대체자료등 ) 이다양하며, 대표성이있는것등을고려하여실험데이터를선정하였으며소설, 시, 희곡의문학장르를포함시켰다. 먼저한국소설의경우서지레코드가 100건이상이며, 자료유형과출판사항이다양하고대표성이있는것으로 8건의실험데이터를선정하였다. (3) 한국시한국시는자료유형과출판사항이다양하며대표성이있는것으로 3건의실험데이터를선정하였다. 31) RDA 6.27-51 -
(4) 번역서 외국문학을번역한번역서는서지레코드가 100 건이상이며, 언어가다양하고, 대표성이있는 것으로 6 건의실험데이터를선정하였다. (5) 무저자고전 무저자고전은저자가없는고전자료가운데 춘향전 을실험데이터로선정하였다. 2) 실험데이터선정결과 문학이론서의경우최소 3건이상의개정판이있는자료를선별하였으며번역자료도포함시켰다. 한국소설에는고대소설, 장편소설, 단편소설이골고루포함되도록하였으며, 한국시의경우서지레코드가많으면서한국어외에다른언어로된작품이포함된자료를선정하였다. 외국문학의경우희곡, 소설등문학작품의번역서를포함하였다. 마지막으로무저자고전인 춘향전 을포함하여 < 표 5> 와같이모두 20개의실험데이터를선정하였다. 선정된실험데이터는저자와서명의저작세트로구성하여 MARC 데이터를추출하여분석하였으며, 분석결과는 FRBR 알고리즘을개발하는데반영하였다. 서지적관계를파악하기위해연관저록의입력정도를분석하였다. 해당필드는 770 필드 ( 보유판및특별호저록 ), 772 필드 ( 모체레코드저록 ), 773 필드 ( 기본자료저록 ), 775 필드 ( 이판저록 ), 776 필드 ( 기타형태저록 ), 780 필드 ( 선행저록 ), 785 필드 ( 후속저록 ) 와 525 필드 ( 부록주기 ), 530 필드 ( 이용가능한다른형태자료주기 ), 533 필드 ( 복제주기 ), 534 필드 ( 원본주기 ) 이다. 3) 실험데이터분석 (1) 저작생성을위한요소분석저작은 < 표 6> 과같이 저자명 + 서명 으로구성되며먼저저자명을추출하기위해저자명전거레코드를먼저확인하여저자명을추출한다. 저자명전거레코드가입력되어있지않은경우서지레코드에서저자명을추출한다. 저자의경우 1XX를우선추출하고 1XX가없을경우 7XX를추출하며개수에상관없이모두추출한다. 아래표와같이저작세트는 100+245, 700+245 a, 700+245 b, 700+740 필드에서저작을생성하며모든저작세트가추출될때까지반복한다. 서명의경우 < 표 7> 과같이표제필드인 240, 245, 246 a를우선추출한다음, 740 a를추출하며서명필드의개수에상관없이모든서명이추출될때까지반복실행한다. - 52 -
< 표 5> FRBR 알고리즘의실험데이터리스트 번호 저자명 서명 비고 1 문학과문학교육연구소 문학의이해 문학이론서 2 김학주 중국문학사 문학이론서 3 한국문학편집위원회 한국문학개설 문학이론서 4 조동일 한국문학통사 문학이론서 5 Eagleton, Terry 문학이론입문 문학이론서 6 Ann Jefferson; David Robby Selden, Raman 현대문학이론 문학이론서 7 허균 홍길동 한국소설 8 김만중 구운몽 한국소설 9 이광수 무정 한국소설 10 김동인 감자 한국소설 11 이효석 메밀꽃필무렵 한국소설 12 황순원 소나기 한국소설 13 이문열 우리들의일그러진영웅 한국소설 14 김소월 진달래꽃 한국시 15 윤동주 하늘과바람과별과시 한국시 16 고은 만인보 한국시 17 Shakespeare, William 로미오와줄리엣 외국문학 18 Shakespeare, William 햄릿 외국문학 19 Hemingway, Ernest 노인과바다 외국문학 20 Austen, Jane 오만과편견 외국문학 21 - 춘향전 무저자고전 서명추출을위한식별기호로는 < 표 8> 과같이 a 뿐만아니라, n, p, x를모두사용한다. < 표 8> 에서 p우리들의일그러진영웅, x하늘과바람과별과詩 를모두서명으로추출한다. 합집이나선집레코드에서서명을추출할때, < 표 9> 과같이 245 필드에기술된합집서명뿐만아니라합집에포함된개별서명도추출한다. 505 필드의내용주기에개별저작을기술한경우개별저작에대한 740 필드를사용하고부출표제가없는경우내용주기에포함된 t 표제를사용한다. < 표 9> 에서 t우리들의일그러진영웅, t난장이가쏘아올린작은공 등을모두서명으로추출한다. 또한저자명의경우서명과마찬가지로 700 필드를사용하거나부출개인명이없는경우내용주기에포함된책임표시 d를저자명으로추출한다. - 53 -
< 표 6> 저작생성의사례 저작생성 100+245 a 100+246 a 700+245 a 700+740 a 700+245 b 700+245 a 700+740 a 사례 1001 a이효석, d1907-1942 wkac200108736 24510 acuando florece el alforfoń / dlee Hyo-seok ; etraduccioń de Yoon Sun-me, Lee Kang-guk 24619 a메밀꽃필무렵 24500 a한국대표단편소설 13 : b언어의아름다움과예술혼 Ⅰ / d기획 연구 : 우한용, e박인기, e정병헌, e최병우 ; e엮음: 김명환, e김영경, e신승희, e유성재, e이만기, e허창현 50500 t돈 -- t메밀꽃필무렵 -- t산 / d이효석 -- t광화사 / d김동인 -- t목넘이마을의개 -- t독짓는늙은이 -- t어둠속에찍힌판화 -- t소나기 / d황순원 70012 a이효석, d1907-1942 wkac200108736 740 2 a메밀꽃필무렵 24500 a셰익스피어비극선 : b햄릿. 맥베드. 리어왕. 오델로. 로미오와줄리엣 / d셰익스피어저 ; e이태주 [ 역 ]; e존길버트그림 7001 ashakespeare, William, d1564-1616 wkac200000024 24520 a( 신역 ) 셰익스피어전집 / d셰익스피어著 ; e 韓龍煥譯 7001 ashakespeare, William, d1564-1616 wkac200000024 740 2 a햄릿 < 표 7> 서명추출필드의사례 서명추출필드 240 a 245 a 246 a 740 a 사례 1001 aausten, Jane, d1775-1817 wkac199601201 24000 acorrespondence 24510 ajane Austen's letters/ dcollected and edited by Deirdre Le Faye 24500 a 우리들의일그러진영웅 7001 a 이문열, d1948- wkac201008289 740 a 타오르는추억 740 a 두겹의노래 740 a 과객 1001 a 이문열, d1948- wkac201008289 24510 aour twisted hero / dyi Munyol ; etranslated by Kevin O'Rourke 24619 a 우리들의일그러진영웅 24500 a 이문열문학상수상작품집 7001 a 이문열, d1948- wkac201008289 740 a 금시조 740 a 우리들의일그러진영웅 - 54 -
< 표 8> 서명추출식별기호의사례 서명추출식별기호 245 a n p 245 a x 사례 24500 a 이문열중단편전집 / d 이문열지음. n4: p 우리들의일그러진영웅외 24510 acielo, viento, estrellas y poes ia= x 하늘과바람과별과詩 / dyun Tong-Ju; eselecci on, traducci on y notas Kwon Eun-Hee y Yoon June-Sick < 표 9> 서명추출 ( 합집 ) 의사례 서명추출 505 t 사례 24500 a 중학생이꼭읽어야할소설. n4 / d 송승환엮음 50500 t 엄마의말뚝 2 / d 박완서 -- t 강 / d 서정인 -- t 장마 / d 윤흥길 -- t 우리들의일그러진영웅 / d 이문열 -- t 서편제 / d 이청준 -- t 난장이가쏘아올린작은공 / d 조세희 -- t 삼포가는길 / d 황석영 70012 a 박완서, d1931-2011 wkac201007995 70012 a 이문열, d1948- wkac201008289 저자명없이서명만있는경우 < 표 10> 에서와같이서명만으로저작을생성하여클러스터링한다. 무저자고전의경우 < 표 11> 에서와같이 130 혹은 730 필드가입력되어있는경우 저자 + 서명 의저작세트외에통일서명으로저작을생성한다. < 표 10> 서명추출 ( 무저자 ) 의사례 서명추출 사례 24500 a 심청전. a 춘향전. a 옹고집전 260 a 서울 : b 한국파스퇴르, c2002 300 a194p.: b 삽도, 도판 ; c25cm 245 a 24500 a 춘향전 250 a 영인본 260 a 서울 : b 문학아카데미, c1990 300 a340-359p.; c26cm - 55 -
< 표 11> 서명추출 ( 무저자 - 통일서명 ) 의사례 통일서명추출 130 a 730 a 130 0 a 춘향전 24500 a 寫眞春香傳 / d 朴啓周著 7001 a 박계주 사례 24500 a 열여춘향수절가. a 春香傳硏究 / d 姜慶鎬編著 7001 a 강경호, e 편저 730 0 a 춘향전 (2) 표현형식별요소분석 1 번역표현형식별을위해 < 표 12> 에서와같이 008/35-37과언어부호 041을사용하여표현형을구분한다. 아래표에서 오만과편견 은원서 Pride and prejudice에대한번역으로, 저작세트 100+245 와 700+246 은동일한저작세트 Austen, Jane+Pride and prejudice 를생성한다. < 표 12> 표현형 ( 번역 ) 의사례 표현형 ( 번역 ) 원서 100 + 245 번역서 700 + 246 사례 1001 aausten, Jane, d1775-1817 wkac199601201 24510 apride and prejudice/ djane Austen ; with a introduction by David Gilson 008830830s1983 ulk 000 f kor 0411 akor heng 24500 a오만과편견 / d제인오스틴지음 ; e이상조옮김 24619 apride and prejudice 7001 a이상조, e옮김 7001 aausten, Jane, d1775-1817 wkac199601201 2 개정 동일저작에서판사항은표현형의식별요소로사용한다. < 표 13> 에서저작 김소월 + 진달래 꽃 이개정증보판, 신판, 2 판으로판사항이각각다르며, 이는표현형의개정으로사용한다. 3 비평 문학작품에대한비평서를식별하기위해 < 표 14> 에서와같이 008/33 문학형식에 u( 평론 ) 가입력되어있는것은비평으로사용한다. - 56 -
< 표 13> 표현형 ( 개정역 ) 의사례 표현형 ( 개정 ) 250 a 24500 a 진달래꽃 / d 김소월지음 250 a 개정증보판 260 a 서울 : b 民音社, c1994 24500 a 진달래꽃 / d 김소월지음 250 a 신판 260 a 서울 : b 미래사, c2001 사례 24500 a 진달래꽃 : b 김소월시집 / d 김소월 [ 지음 ]; e 김수복엮음 250 a2 판 260 a 서울 : b 청개구리, c2006 < 표 14> 표현형 ( 비평 ) 의사례 표현형 ( 비평 ) 008/33 u 사례 008050909s2005 ulkc 000 u kor 24500 a 우리소설어떻게읽을것인가. n1-4/ d 김병욱 ; e 김춘섭 ; e 정덕준 [ 공 ] 엮음및해설 7001 a 김동인, d1900-1951 wkac201011448 740 a 감자 4 모체-부록모체레코드와보유판및특별호의관계를연결하기위해 < 표 15> 에서와같이 770 필드와 772 필드를사용한다. 모체와보유판의연결은아래표에서처럼 zisbn이나제어번호로연결한다. < 표 15> 표현형 ( 모체 - 부록 ) 의사례 표현형 ( 모체 - 부록 ) 770 t 772 t 사례 001 KMO201144767 020 a9788920006289 g93810: c\12400 24500 a 고소설론과작가 / d 이상택, e 박종성공저 770 0 t 고소설론과작가 : 워크북 z9788920006777 001 KMO201144769 020 a9788920006777 g93810 24500 a 고소설론과작가 : b 워크북 / d 한국방송통신대학교국어국문학과편 77200 t 고소설론과작가 z9788920006289 5 선행 - 후속 선행저록과후속저록을연결하기위해 < 표 16> 에서와같이 780 필드와 785 필드를사용 한다. 연결을위해 ISBN 혹은제어번호를사용한다. - 57 -
< 표 16> 표현형 ( 선행 - 후속 ) 의사례 표현형 ( 선행 - 후속 ) 사례 780 t 001 KMO200852339 020 a8970633685 g03810: c\8300 24500 a 기차이야기 / d 정호승글 ; e 류준화그림 580 a" 모닥불 (2000 년 )" 의개정판임 78012 t 모닥불 z8972755044 wkmo200034946 785 t 001 KMO200034946 020 a8972755044 g03810 24500 a 모닥불 / d 정호승지음 78512 t 기차이야기 z8970633685 wkmo200852339 (3) 구현형식별요소분석 구현형은클러스터링된저작과표현형을적절한형식에맞추어디스플레이한다. 1 자료유형다양한자료유형을디스플레이하기위해 < 표 17> 에서와같이자료유형표시 h를사용한다. 자료유형표시가없는것은단행본이며자료유형표시가없는자료중 502 필드가있는것은학위논문에해당한다. 자료유형표시가있는것은아래표와같이 녹음자료, 컴퓨터파일, 비디오녹화자료 등해당자료유형을표기한다. 이와같이기존의 KORMARC 서지레코드에는자료유형표시를 245 필드의 h에기술하고있지만, 앞서제2장에서소개한바와같이 RDA에서는자료유형을보다세분하여내용유형, 매체유형, 수록매체유형의 3가지로구분하여표시하고있다. 또한 KORMARC에서도이를반영하여 336, 337, 338 필드를사용하여표시할수있도록개정되었다. 앞으로는이가운데구현형식별요소인 337과 338 필드를사용하여자료유형을디스플레이하는데사용할수있다. 2 복제원자료에대한복제를추출하기위해 < 표 18> 에서와같이 534, 580, 776 필드의유무를확인하여원자료와복제자료를연결한다. 3 재판혹은중판 250 필드에재판혹은중판으로입력된데이터로동일저작인경우 < 표 19> 에서와같이재판의관계로연결한다. 250 필드가입력되어있지않지만저자와서명, 출판사가동일한자료가운데출판연도나페이지가상이한경우쇄의개념으로취급하여구현형의다른형태로표기한다. - 58 -
< 표 17> 구현형 ( 자료유형 ) 의사례 구현형 ( 자료유형 ) 일반도서 사례 24500 a 감자 / d 김동인지음 260 a 서울 : b 신원문화사, c1998 300 a265 p. ; c23 cm 녹음자료 24520 a( 한국단편소설 ) 감자 h[ 녹음자료 ] / d[ 지은이 : 김동인 ] ; e 컨텐츠포탈 [ 편 ] 260 a 서울 : b 컨텐츠포탈 [ 공급 ], c[2012] 300 a 음반 1 매 ( 약 21 분 ) : b 디지털, 스테레오 ; c12 cm 7001 a 김동인, d1900-1951 wkac201011448 컴퓨터파일 24500 a 배따라기 ; a 감자외 h[ 컴퓨터파일 ]/ d 김동인 [ 지음 ] 260 a[ 서울 ]: b 바로북닷컴, c2002 300 a 광디스크 1 매 ; c12 cm 7001 a 김동인, d1900-1951 wkac201011448 비디오녹화자료 24510 atv 문학관 h[ 비디오녹화자료 ]. n1-4/ dkbs 제작 260 a 서울 : b 한국방송사업단, c1989 300 a 비디오카세트 4 개 ( 각 120 분 ): b 천연색 ; c12.5 mm 7001 a 김동인, d1900-1951 wkac201011448 740 a 감자 < 표 18> 구현형 ( 복제 ) 의사례 구현형 ( 복제 ) 사례 원자료 24520 a( 한국문학 ) 단편소설선집. n1/ d[ 책이있는풍경 ] 편집부엮음 260 a 서울 : b 책이있는풍경, c1993 776 a 복제자료 24520 a( 한국문학 ) 단편소설선집. n1-2/ d[ 책이있는풍경 ] 편집부엮음 260 a 서울 : b 책이있는풍경, c1993 580 a 국립중앙도서관원문정보데이터베이스 (database) 로구축됨 7761 a 컴퓨터파일. t2012 년주요자료원문정보 DB - 59 -
< 표 19> 구현형 ( 재판 ) 의사례 구현형 ( 재판 ) 사례 250 a 24500 a 감자 ; a 배따라기 : b 김동인단편집 / d 저자 : 김동인 250 a 중판 260 a 서울 : b 삼중당, c1985 24500 a 김소월전집 / d 김용직편저 250 a 재판 260 a 서울 : b 서울대학교출판부, c2001 출판연도상이 001KMO198803404 24510 a 우리들의일그러진英雄 / d 李文烈외저 260 a 서울 : b 文學思想社, c1987 300 a364p.; c23cm 001KMO199011066 24500 a 우리들의일그러진英雄 / d 李文烈지음 260 a 서울 : b 文學思想社, c1990 300 a364p.; c23cm (4) 개별자료식별요소분석개별자료의사례로는 < 표 20> 에서와같이국립중앙도서관청구기호 052 필드와등록번호및복본표시 049 필드에입력된내용으로확인한다. 052 a분류기호에 800이아닌다른기호 (3540) 가입력된데이터도발견되었으나입력된내용을그대로보여준다. < 표 20> 개별자료 ( 청구기호, 등록번호, 복본표시등 ) 의사례 개별자료 사례 052 a b 049 l c 05201 a842 b3-8 24500 a 햄릿 / d 윌리엄셰익스피어지음 ; e 김남옮김 0490 lem2850738 lem2850739 c2 05200 a3540 b52 c1 24500 a 햄릿外 / d 셰익스피어著 ; e 呂石基...[ 等譯 ] 0490 lem84284 v1 lem84285 v1 c2-60 -
3. 알고리즘설계 1) 알고리즘설계흐름도 여기서 RDA 기반 FRBR 구현을위한알고리즘설계의흐름을 FRBR 의저작, 표현형, 구현 형, 개별자료의수준별로살펴보기로한다. FRBR 구현을위한전체적인알고리즘설계의흐름 도는 < 그림 5> 와같다. < 그림 5> RDA 및 FRBR 구현알고리즘흐름도 2) 검색키 현재국립중앙도서관검색키에는전체, 제목, 제목 ( 전방 ), 제목 ( 완전 ), 저자, 발행자, 청구기 호로구성되어있으며이연구에서는전체, 서명, 저자, 발행자를검색키로선정하였다. 3) 저작클러스터링 저작의클러스터링을위해저자와서명의요소추출은 < 표 21> 을기준으로하였으며서명 에포함된특수기호 ( 온점, 중간점, 대시등 ) 는불용어처리를하였다. - 61 -
< 표 21> 저작 ( 저자와서명 ) 추출기준 저자 100, 110, 111 a d 순서상관없이전부추출 700, 710, 711 a d e 순서및개수상관없이전부추출 서명 240, 245, 246, 740 a n p x 505 t 130, 730 a 240, 245, 246, 740 필드에서각필드및필드의식별기호개수상관없이전부추출 740 a 에서명부출없이내용주기에만기술되어있을경우에만 505 에서서명추출 무저자고전의경우저자와서명을조합한저작외에통일서명으로별도의저작을클러스터링 4) 표현형요소추출 (1) 자료유형자료유형에해당하는요소를추출하기위해 < 표 22> 와같이레코드유형 ( 리더 /06) 의값을사용한다. 일반적인도서형태는 a( 문자자료 ) 로구분하며 a 가아닌전자자료, 녹음자료, 시청각자료등은아래조건에따라자료유형을구분한다. < 표 22> 표현형 ( 자료유형 ) 요소 문자자료 리더 /06 a 전자자료 리더 /06 m 녹음자료 리더 /06 ijcd 컴퓨터파일 리더 /06 a + 245 h[ 컴퓨터파일 ] 시청각자료 리더 /06 g 고서 리더 /06 w 한편기존의 KORMARC 서지레코드에는자료유형표시를 245 필드의 h에기술하고있으며, 여기에는표현형요소와구현형요소가혼재되어있다. 앞서제2장에서언급한바와같이 RDA에서는이를세분하여표현형요소인내용유형, 구현형요소인매체유형과수록매체유형으로구분하고있으며, KORMARC도이를반영하여수정되어있다. 즉, 앞으로는 RDA의내용유형을구조화한 336 필드를사용하여표현형요소를추출할수있다. (2) 이용대상자수준 이용대상자수준을구분하기위해 < 표 23> 과같이 008/22 의값을사용하며일반이용자, 청 소년, 아동, 특수계층으로범주화한다. (3) 문학형식 문학장르를표기하기위해 < 표 24> 와같이문학형식 (008/33) 의값을사용한다. 단, 평론 - 62 -
(u) 의경우비평의관계를표현하기위해사용한다. (4) 관계유형 개정, 번역, 비평, 부록, 후속, 전체 - 부분등과같은서지적관계유형은대체로표현형수준 에서식별한다. 이러한서지적관계유형을식별하기위한요소값은 < 표 25> 와같다. < 표 23> 표현형 ( 이용대상자수준 ) 요소 008/22 ( 이용대상자수준 ) b/ 일반이용자용 a 취학전아동 b 초등학생 c 중학생 d 고등학생 e 성인용 f 특수계층 j 아동용 z 미상또는세분하지않는경우 일반이용자 ( 값없음 ) 청소년 (bcd) 아동 (j) 특수계층 (f) < 표 24> 표현형 ( 자료유형 ) 요소 008/33( 문학형식 ) b/ 해당없음 c 만화 d 희곡및시나리오 e 수필 f 소설 h 풍자문학 ( 만화제외 ) i 서간문학 j 단편소설 ( 꽁트포함 ) k 추리소설 l 논픽션 ( 르뽀, 다큐멘터리소설포함 ) m 기행문, 일기문, 수기등 p 시 s 연설문, 웅변관계저작포함 t 논설문 v 문집 w 향가, 시조, 가사, 구비문학 - 63 -
< 표 25> 표현형 ( 관계유형 ) 요소 관계필드설명 개정 250 a < 저자, 서명, 출판사 > 동일하고 250 필드가있으면 개정 의관계로연결 번역 008/35-37 041 a ( 저자필드 +245) 와 ( 저자필드 +24619 a) 를대조하여같을경우번역의관계로연결번역서의경우아래와같이입력되어있어야함 008/35-37 kor 0411 akor hjpn 24500 a 이웃집토토로 24619 a となりのトトロ 비평 부록 후속 전체 - 부분 008/33( 문학형식 ) u 770 t 보유판 772 t 모체레코드 780 a( 선행저록 ) 785 a( 후속저록 ) 리더 /07( 서지수준 ) u 입력되어있는레코드를추출하여저작비교한뒤같을경우동일저작으로그룹핑하며, 비평의관계로연결 ISBN 혹은제어번호로연결 ISBN 혹은제어번호로연결 리더 /07( 서지수준 ) 로구분하여전체 - 부분의관계로연결 a 모본에서분리된단행자료성격의구성요소 b 모본에서분리된연속간행자료성격의구성요소 c 집서 (collection) d 집서의하위단위 i 갱신자료 m 단행자료 / 단일자료 s 연속간행물 5) 구현형요소추출 구현형식별을위한추출요소는아래와같이자료유형, 발행처및발행년, 관계유형등이다. (1) 자료유형 245 h 자료유형표시 자료유형표시가없는것은텍스트로표기하며자료유형표시가있는것은각괄호에입력된값을표기 기존의 KORMARC 서지레코드에는자료유형표시를 245 필드의 h 에기술하고있어이를 구현형식별요소로사용할수있지만, 앞으로는 RDA 에서제시하고있는내용유형, 매체유형, 수록매체유형의 3 가지가운데매체유형과수록매체유형을구현형식별요소로사용할수있다. - 64 -
즉, KORMARC 서지레코드에 RDA 를반영한 출할수있다. 337 과 338 필드를사용하여구현형요소를추 (2) 발행처및발행년 260 b c b( 발행처, 배포처등 ) 와 c( 발행년, 배포년등 ) 를표기 (3) 관계유형 구현형에서관계유형은 < 표 26> 의조건에따라데이터를추출하여복제와재판의관계로 연결한다. < 표 26> 구현형 ( 관계유형 ) 요소 관계필드설명 복제 534 580 776 필드있는것 - 534, 580, 776 필드가있는것을추출하여동일저작의복제관계로연결 - 장애인대체자료 를추출하기위해 ( 리더 /06 a + 776 i 시각장애인용 ) 으로입력된자료를추출하여복제관계로연결 재판 250 a 중판, 재판 으로입력된것은재판의관계로연결 - 65 -
제 5 장 FRBR 및 RDA 의알고리즘구현 1. 검색결과 1) 저작세트 ( 소나기 + 황순원 ) 의검색결과 레코드의수는 < 그림 6> 과같이 95건이추출되었으며표현형과구현형에대한결과는 < 표 27> 과같다. 표현형자료유형으로일반도서와컴퓨터파일이많았으며, 구현형의자료유형표시는텍스트가대부분이었다. 표현형개정관계는 2판, 개정판등 6건의데이터가추출되었으며구현형재판관계는중판, 재판이 4건추출되었다. 문학형식은단편소설로입력된데이터가가장많았고소설, 만화, 문집이있으며, 미입력건수가 10건에이른다. < 그림 6> 저작세트 ( 소나기 + 황순원 ) 의추출 - 66 -
< 표 27> 저작세트 ( 소나기 + 황순원 ) 의검색내용 검색키서명 소나기 + 저자명 황순원 레코드의수 표현형 구현형 자료유형 개정관계 95 건 일반도서 (60 건 ) 녹음자료 (3 건 ) 컴퓨터파일 (30 건 ) 시청각자료 (2 건 ) 6 건 이용대상자일반이용자 (50 건 ) 청소년 (17 건 ) 아동 (28 건 ) 문학형식 자료유형표시 재판관계 만화 (4 건 ) 단편소설 (56 건 ) 소설 (21 건 ) 문집 (4 건 ) 미입력 (10 건 ) 텍스트 (90 건 ) 녹음자료 (3 건 ) 비디오녹화자료 (1 건 ) videorecording(1 건 ) 4 건 2) 저작세트 ( 무정 + 이광수 ) 의검색결과 레코드의수는 < 그림 7> 과같이 88건이추출되었으며표현형과구현형결과는 < 표 28> 에제시하였다. 표현형의자료유형으로일반도서와컴퓨터파일, 전자자료, 녹음자료가있으며관계유형으로개정관계 8건, 비평관계 1건, 부록관계 1건, 전체-부분관계 2건이추출되었다. 문학형식의경우소설이 68건으로가장많았으며미입력이 10건으로나타났다. 구현형은텍스트가 85건으로가장많았고재판관계가 4건이었다. < 그림 7> 저작세트 ( 무정 + 이광수 ) 의추출 - 67 -
< 표 28> 저작세트 ( 무정 + 이광수 ) 의검색내용 검색키 서명 무정 + 저자명 이광수 레코드의수 88건 자료유형 일반도서 (59건) 컴퓨터파일 (26건) 전자자료 (2건) 녹음자료 (1건) 개정관계 8건 비평관계 1건예 > ( 바로잡은 ) 무정 / [ 이광수저 ]; 김철校註 1건부록관계예 > 빠르게읽는현대소설 : 부록. 1-2 표현형 2건 전체-부분관계 예 > 代表韓國文學全集.1-12 / 金東里 ; 趙演鉉 [ 공 ] 責任編輯 이용대상자 일반이용자 (70건) 청소년 (7건) 아동 (10건) 특수계층 (1건) 문학형식 소설 (68건) 만화 (1건) 단편소설 (5건) 문집 (1건) 미입력 (10건) 구현형 자료유형표시텍스트 (85건) 전자책 (2건) 녹음자료 (1건) 재판관계 4건 3) 저작세트 ( 노인과바다 +Hemingway, Ernest) 의검색결과 레코드의수는 < 그림 8> 과같이 117건이추출되었으며표현형과구현형에대한결과는 < 표 29> 와같다. 문학형식이입력되지않은데이터가 18건으로나타났으며, 노인과바다 는번역서임에도, 표현형번역관계가 83건에불과하며나머지 34건은원표제입력이누락된것으로나타났다. 83건가운데원저작의언어를기입한건수는 6건에불과하다. 구현형의자료유형은텍스트가가장많았으며, 오디오북과녹음자료도포함되어있다. < 그림 8> 저작세트 ( 노인과바다 +Hemingway, Ernest) 의추출 - 68 -
< 표 29> 저작세트 ( 노인과바다 +Hemingway, Ernest) 의검색내용 검색키레코드의수표현형구현형 서명 노인과 바다 + 저자명 Hemingway, Ernest 117건 자료유형 일반도서 (102건), 녹음자료 (8건), 시청각자료 (1건) 컴퓨터파일 (6건) 개정관계 13건 번역관계 83건 이용대상자 일반이용자 (83건) 청소년 (11건) 아동 (23건) 문학형식 만화 (2건) 단편소설 (4건) 소설 (91건) 문집 (2건) 미입력 (18건) 자료유형표시 텍스트 (109건) 비디오녹화자료 (1건) 전자자료 (1 건 ) 녹음자료 (2건) 오디오북 (6건) 복제관계 1건 재판관계 3건 4) 저작세트 ( 오만과편견 +Austen, Jane) 의검색결과 레코드의수는 < 그림 9> 와같이 82건이추출되었으며표현형과구현형정보를 < 표 30> 에제시하였다. 표현형자료유형에는일반도서, 컴퓨터파일, 전자자료가있다. 표현형번역관계는 61건이며, 나머지 21건은원표제입력이누락되었으며, 61건가운데원저작의언어를입력한건수는 7건에불과하다. 문학형식의경우소설로입력한 73건을제외한 9건은미입력으로나타났다. 또한원본자료를컴퓨터파일로복제한구현형복제관계가 1건포함되어있다. < 그림 9> 저작세트 ( 노인과바다 +Hemingway, Ernest) 의추출 - 69 -
< 표 30> 저작세트 ( 노인과바다 +Hemingway, Ernest) 의검색내용 검색키레코드의수표현형구현형 서명 오만과편견 + 저자명 Austen, Jane 82건 자료유형 일반도서 (77건), 전자자료 (1건) 컴퓨터파일 (4건) 개정관계 4건 번역관계 61건 이용대상자 일반이용자 (71건) 청소년 (4건) 아동 (7건) 문학형식 소설 (73건) 미입력 (9건) 자료유형표시 텍스트 (80건) 컴퓨터파일 (1건) 전자책 (1건) 복제관계 1건 재판관계 1건 5) 저작 ( 춘향전 ) 의검색결과 춘향전 의레코드수는 < 그림 10> 과같이 158건으로나타났는데, 이건수는서명필드에 춘향전 으로입력된데이터를추출한결과이다. 표현형자료유형은 < 표 31> 과같이일반도서가대부분이며컴퓨터파일과녹음자료가포함된다. 관계유형은개정 7건, 비평 1건, 전체- 부분은 4건이었다. 표현형이용대상자의경우일반이용자가가장많았지만아동용과청소년용도많은건수를보였다. 문학형식은소설, 단편소설, 희곡등의순이었고미입력된데이터도 37건에이른다. 구현형재판관계에는중판, 재판과영인본이포함되어있으며복제관계는복제주기 2건이있다. < 그림 10> 저작 ( 춘향전 ) 의추출 - 70 -
< 표 31> 저작 ( 춘향전 ) 의검색내용 검색키 서명 춘향전 레코드의수 158건 자료유형 일반도서 (112건), 컴퓨터파일 (44건), 녹음자료 (2 건 ) 개정관계 7건 비평관계 1건 표현형 전체-부분관계 4건 이용대상자 일반이용자 (80건) 청소년 (23건) 아동 (55건) 만화 (2건) 소설 (92건) 단편소설 (12건) 희곡 (7건) 문학형식 향가, 시조, 가사, 구비문학 (5건) 문집 (2건) 미입력 (37건) 텍스트 (155건) 마이크로형태자료 (1건) 녹음자료 (2 자료유형표시건 ) 구현형복제관계 2건 재판관계 10건 2. 검색및검색결과화면구성 1) 검색화면구성 검색화면에서는일반적으로이용자가원하는다양한검색요소들나타나있다. OCLC Fiction Finder에서는 < 그림 11> 과같이저자, 서명, 주제, 장소, 키워드, 등장인물, 분류번호, 자료유형, 언어를검색키로사용하고있다. 여기서는앞서알고리즘설계과정에서제시한요소들을가능하면검색키로사용할수있도록하였으며, OCLC의 Fiction Finder를바탕으로 < 그림 12> 와같이화면을구성하였다. 검색화면의구성을위해기본검색으로저자, 서명, 발행처, 주제명을검색키로하며, 고급검색에서는 4개의검색키를조합해서검색할수있도록구성하였다. 그리고검색조건으로자료유형, 이용대상자, 언어를추가하였다. < 그림 11> OCLC Fiction Finder 고급검색 - 71 -
< 그림 12> 검색화면구성 2) 검색결과화면구성 앞서언급한바와같이지금까지의검색결과를화면에디스플레이하기위해 OCLC의 Fiction Finder를근간하여화면을구성하였다. 구현시스템의핵심은저작을중심으로재편하였으며, 표현형은검색제한으로도활용하였다. < 그림 13> 에서화면의오른쪽은저작정보를나타낸것으로상단에저작건수를표기하며, 표지이미지, 서명, 저자, 요약, 판 ( 건수 ), 연도 ( 구간 ), 장르, 자료유형을표시한다. 한저작에여러판이존재하므로판의건수를표기해주고, 연도는여러저작중가장빠른연도와늦은연도를연결해서표기해준다. 화면의왼쪽은표현형정보를보여주는것으로검색제한으로도활용한다. 자료유형, 이용대상자, 장르, 언어는버튼다운형태로선택할수있도록구성하며개정판, 비평, 부록, 후속, 전체-부분은괄호에건수를표기해준다. 검색결과화면에서저작의서명을선택하면다음페이지로이동된다. < 그림 14> 는저작에대한상세정보와구현형에대한간략정보를보여준다. 저작에서서명을선택하면표지이미지와서명, 저자, 판 ( 건수 ), 연도, 자료유형, 요약, 장르, 주제, 분류기호의상세정보를제공하며이어서 판 을선택했을때구현형에대한간략한정보를보여준다. 구현형의간략정보는표지이미지, 판, 연도, 언어, 자료유형, 이용대상자를기준으로구현형정보를표기하며이가운데언어, 자료유형, 이용대상자는표현형요소에해당한다. 화면하단에는저자의다른저작표지이미지를나열하여다른저작으로바로이동할수있도록한다. 구현형의간략정보에서 서명 을선택하면 < 그림 15> 의구현형의상세정보화면으로이동한다. 구현형의상세정보에서는표지이미지와서명, 저자, 발행사항, 형태사항, ISBN, 주제명, 복제관계, 재판관계, 자료유형표시를표기해준다. - 72 -
< 그림 13> 저작및표현형검색결과 < 그림 14> 저작과구현형정보 - 73 -
< 그림 15> 구현형의상세정보 - 74 -