통합서지형 KORMARC 의도입을위한효과적인 DB 변환과시스템구축방안 서강대학교도서관의 자체변환방식 을중심으로 The Method of Effective DB Conversion and Related System Development for the Integrated KORMARC Format - Based on the Case of Sogang University Library - Ⅰ. 서론 1. 연구의목적및필요성 2. 선행연구 Ⅱ. 통합서지용 KORMARC 으로의변환방식 1. 타대학도서관의변환현황 2. 서강대학교도서관의변환방안 Ⅲ. 서강대학교도서관의서지 DB 변환사례 1. 전체적진행과정 < 목차 > 초록 이규연 (Kyu-Youn Lee) 2. 서지 DB 변환을위한매핑테이블의작성 3. 변환과정 4. 변환시 MARC 주요내용 5. 시스템의통합서지용 KORMARC 적용 Ⅳ. DB 변환시고려사항및향후과제 Ⅴ. 결론 본연구는통합서지용 KORMARC 으로의효과적인 DB 변환과시스템구축에대하여서강대학교도서관의사례를중심으로모색하는데목적이있다. 통합서지용 KORMARC 표준이제정된이래많은도서관에서새로운표준에맞추어서지 DB 를변환하고있다. 서강대학교로욜라도서관은 KERIS 변환기와같은공공기관의변환기를통하여변환하지않고시스템벤더를별도선정, 자체변환을시도하였다. 자체변환은자관서지 DB 의오류수정이나데이터보완기능을변환기에상당부분수용할수있으므로수작업데이터보정의인력적여력이없는기관에유리하다. 아울러전체 DB 를여러번변환하지않고샘플링변환을반복함으로써변환의안전성과시간적단축을도모할수있다. 키워드 : 통합서지용 KORMARC 형식, KORMARC 레코드변환, 서지 DB 변환, 편목시스템, 목록시스템 ABSTRACT The goal of this study is to seek for the method of effective DB conversion and related system development for the integrated KORMARC Format on the basis of the case of Sogang University Library. Since the integrated KORMARC bibliographic format was established, libraries have been converting bibliographic DB according to the new format. Loyola Library of Sogang University internally proceeded DB conversion using bibliographic DB convertor, which was developed and customized with a system vendor for Sogang University Library. The internal conversion enabled to correct or supplement bibliographic data errors. Besides, it enhanced stability of conversion and shortened the project time by adopting sampling conversion method. It was effective to reduce the additional work for DB quality maintenance, so this kind of conversion is recommendable to the library that has limited manpower for manual data correction. Keywords: Integrated KORMARC bibliographic format, KORMARC records conversion, Bibliographic DB conversion, Cataloging system - 93 -
2 한국도서관 정보학회지 ( 제 45 권제 3 호 ) Ⅰ. 서론 1. 연구의목적및필요성 http://unicat.riss.kr/notice_view.jsp?seq_no=130&field=subject&field_value=&page=3>[ 인용 2011. 6. 13]. - 94 -
통합서지형 KORMARC 의도입을위한효과적인 DB 변환과시스템구축방안 3-95 -
4 한국도서관 정보학회지 ( 제 45 권제 3 호 ) 2. 선행연구 - 96 -
통합서지형 KORMARC 의도입을위한효과적인 DB 변환과시스템구축방안 5 Ⅱ. 통합서지용 KORMARC 으로의변환방식 1. 타대학도서관의변환현황 대학명 DB 변환방식 통합서지용 KORMARC 적용범위 변환시기 중앙대 2009.3 연세대 2009.7 이화여대 KERIS 변환기 2010.1 고려대 사용 전체서지 DB * 2010.8 한국예술종합학교 2010.11 서울대 2010.12 서강대자체변환 2010.8 조선대한국외대제주대 < 표 1> 대학도서관통합서지용 KORMARC 적용현황 (2011. 4. 당시 ) 신규데이터만통합서지용 KORMARC 적용 ** 신규 DB 조선대 - KERIS 샘플변환확인, 2009 * KORMARC DB 전량 ** 1 차적으로신규 DB 에만통합서지용 KORMARC 을적용하여서지 DB 를구축하다가이후단계적으로소급 DB 에도통합서지용 KORMARC 포맷을적용하여변환하는기관도있다. - 97 -
6 한국도서관 정보학회지 ( 제 45 권제 3 호 ) 2. 서강대학교도서관의변환방안가. 자체변환선택 - 98 -
통합서지형 KORMARC 의도입을위한효과적인 DB 변환과시스템구축방안 7 나. 자체변환의의의 - 99 -
8 한국도서관 정보학회지 ( 제 45 권제 3 호 ) Ⅲ. 서강대학교도서관의서지 DB 변환사례 1. 전체적진행과정 - 100 -
통합서지형 KORMARC 의도입을위한효과적인 DB 변환과시스템구축방안 9 < 그림 1> 서강대학교도서관통합서지용 KORMARC 변환사업의전체적진행 - 101 -
10 한국도서관 정보학회지 ( 제 45 권제 3 호 ) < 그림 2> 서지 DB 변환과정 2. 서지 DB 변환을위한매핑테이블의작성 10) 국립중앙도서관, 통합서지용 KORMARC 매핑표 <http://www.nl.go.kr/kormarc/c6/page1.jsp> [ 인용 2010. 4]. 11) 한국교육학술정보원, 통합서지용 KORMARC 반영 KERIS 종합목록입력지침 <http://unicat.riss.kr/ulist_guideline/main.jsp> [ 인용 2010. 5]. - 102 -
통합서지형 KORMARC 의도입을위한효과적인 DB 변환과시스템구축방안 11 3. 변환과정가. 변환기간단축을위한합리적변환방법채택 < 표 2> DB 변환결과 1 차샘플링변환결과 2 차샘플링변환결과전체실 DB 변환결과 자료유형건수성공실패자료유형건수성공실패자료유형건수성공실패 단행본 16,025 16,025 - 단행본 1차분 16,025 16,025 - 단행본 1 70,000 70,000 - 학위논문 1,153 1,153 - 단행본 2차분 10,429 10,429 - 단행본 2 70,000 70,000 - 연간물 1,146 1,146 - 학위논문 14,654 14,654 - 단행본 3 70,000 70,000 - 고서 1,039 1,039 - 연간물 4,454 4,454 - 단행본 4 76,474 76,450 24 비도서 2,752 2,752 - 고서 1,041 1,041 - 연간물 4,454 4,454 - 파일럿데이터 28 28 - 비도서 2,722 2,722 - 고서 1,041 1,041 - 합계 22,143 22,143 - 합계 49,325 49,325 - 비도서 2,724 2,724 - * 이후, 파일럿데이터는각자료유형에포함 합계 294,693 294,669 24 * 학위논문은단행본에포함 - 103 -
12 한국도서관 정보학회지 ( 제 45 권제 3 호 ) 나. 파일럿데이터의작성 다. 종단점정리프로그램구축 4. 변환시 MARC 주요내용가. 최초의체크리스트 (Checklist) - 104 -
통합서지형 KORMARC 의도입을위한효과적인 DB 변환과시스템구축방안 13 리더 & 제어필드 < 표 3> 매핑테이블및최초의체크리스트일부 ( 예시 ) 필드기존 MARC 통합 MARC 체크포인트해당형식확인사항 007 마이크로자료 007 평면비영사자료 007/12 안전도 a 안전규격 b 비규격안전도 007/02 원본상태 f 재생 o 원본 r 복제 u 미상 12 필름의기본재료 z 기타 007 단행본미정의 ta ( 일반인쇄자료 ) 008 도서 008/24-25 내용형식 x - 만화집 y - 연감 단행본 / 연속간행물 MARC 에서 a, b z 단행본 / 연간물 미정의블랭크비도서ㅇ x, y 삭제 리더06 레코드유형 : a 리더07 서지수준 : m 인서지 007 : ta 로일괄생성ㆍx 블랭크 ( 선행작업 : 008/33 "c" 삽입 ) ㆍy 블랭크 단행본 단행본 ㅇ 단행본은 007 이없는경우 007 : ta 생성 008 계속자료 008/20 ISSN센터부호미정의블랭크연속간행물 0,1,8,z 를블랭크로변환 008/24-25 내용형식 c 블랭크 008 고서 (006/07-08) c 삭제고서ㅇ ( 선행작업 : 008/ 33 "v" 추가 ) c - 문집 ( 文集 ) 그외 필드기존 MARC 통합 MARC 체크포인트해당형식확인사항 020 국제표준도서번호 082 듀이십진분류기호 100 식별기호 (600, 700 도동일하게해당 ) 300 식별기호 500 식별기호 ( 서명관련태그의 ( ) 처리는자동으로 ( ) 를넣고빼고모두색인처리한다는전제하의변환 ) 제 1 지시기호블랭크미정의 제 1,2 지시기호블랭크 f 역조 g 한국및중국의世系 a 면장수, 권책수 b 삽도 d 장정 b 관제 제1지시기호블랭크낱권번호 1 세트번호제1지시기호 0 완전판 1 요약판제2지시기호 4 LC 및국립중앙도서관이외의기관에서부여 c 기존 f, g 를포함한이름관련정보포괄 f 저작연도 g 기타연도 a 특정자료종별과수량 b 기타물리적특성 삭제 제 1 지시기호변경 020 1 a ISBN ( 세트 ),( 셋트 ),(set),(set),( 전 ) 지시기호를 "04" 로모두바꿔줄것 f c g c f g 모두있는경우 f + 1 space + g 의내용을 c 에기록 d 장정 삭제 e 딸림자료반복시두번째 e 부터는식별기호제외하고 + 만반복 (1 space "+" 1 space 내용 246 0b i 관제 : a 740 bb a " 관제 + 1 space + 245 a"(740 에 full title 로부출 ) 단행본 / 연간물 / 비도서 / 고서 단행본 / 연간물 / 비도서 / 고서 단행본 / 연간물 / 비도서 / 고서 단행본 / 연간물 / 비도서 / 고서 단행본 / 연간물 / 비도서 f 판권기서명삭제 246 1b i 판권기표제 : a ㅇ ㅇ ㅇ 일괄 04 로처리 ㅇ ㅇ ㅇ - 105 -
14 한국도서관 정보학회지 ( 제 45 권제 3 호 ) 507 식별기호 a 원저자명 t 원서명 500 필드로이동 246 필드로이동 507 00 a 500 bb a 507 10 a (1) "," 가있을시 700 1b a 로 (2) "," 가없을시별도 list( 제어번호 ) 로추출해줄것.( 직접 eye checking 후부출처리할예정 ) 246 19 a 기존 ( 관사 ) 를살릴것. 양쪽모두검색가능하도록할것. 단행본 / 연간물 / 비도서 / 고서 507 00 a 500 a 원저자명 : 507 01 a 500 a 원저자명 : 507 10 a 700 1_ a 507 11 a 700 1_ a 507 20 a 700 1_ a 507 21 a 700 1_ a 507 00 t 246 09 a 507 01 t 246 09 a 507 10 t 246 19 a 507 11 t 246 19 a 507 20 t 246 19 a 507 21 t 246 19 a x, z는삭제 852 지시기호 지시기호 1 2 단행본 / 연간 1-KDC 2-DDC 지시기호 2 1 물 / 비도서 / 지시기호일괄 21로처리 1-제1차권호순 1-제1차권호순 ( 지시기호를일괄 21로넣어줄고서것 ) 890태그가두개이상으로반 복사용되었을때, 두번째이하 내용 ( h) 은모두첫번째 890 h 내용뒤에이어서나오도 890 [ 반복 ][ 해당시필수 ] 록옮길것 ( 태그가반복불가로 [ 반복불가 ][ 해당시필수 ] 바뀌었기때문 ) ( 예 ) 890 bb h 245 준 890 bb h 500 한 890 bb h 245 준 h 500 한 단행본 / 연간물 / 비도서 / 고서 ㅇ 나. 1차변환이후의체크리스트 - 106 -
통합서지형 KORMARC 의도입을위한효과적인 DB 변환과시스템구축방안 15 < 표 4> 1 차변환이후의체크리스트일부 ( 예시 ) 단행본기존 MARC 필드 참고제어번호 오류내용 고정장 235570 목록규칙 85315 일괄 K로입력 ( 모든자료유형에적용요망 ) 복수의딸림자료처리시띄어쓰기문제 ("+" 의앞뒤로 2번씩띄어쓰기가됨 ) 300 267143 507 a 648090 X00 관련 기존 MARC 300 a 386 p. : b 삽도 + e 1 computer disk(3 1/2 in.) + e 1 CD-ROM(4 3/4 in.) 변환 MARC 300 a 386 p. : b 삽도 + e 1 computer disk(3 1/2 in.) + 1 CD-ROM(4 3/4 in.) + 앞쪽스페이스는여전히 2칸 507 a 저자명에컴마 (,) 가없을경우별로 list로출력해줄것 ( 이요구사항이계속누락되고있음 ) 전거 KORMARC의 100은그대로 f, g 서브필드가있으므로, 전거데이터의서지링크시, 통합서지용 KORMARC 서지데이터 X00 입력규칙과불일치할수있으므로전거 DB에서 f, g 를사용한데이터는별도의리스트로제공할것. 연속간행물 기존 MARC 필드 참고제어번호 오류내용 246 247 648184 648185 266419 266026 266026 263827 제 2 지시기호가 5,6,7 로되어있는것은 3 으로변환 ( 기존연간물 MARC 에는단행본과달리 246 과 247 이있으며, 특히 246 에는제 2 지시기호에있어통합 MARC 에서쓰지않는 5,6,7 이라는옵션이있었음 ) 확인못함 ( 파일럿데이터수정으로다음차변환시확인예정 ) 제 2 지시기호가 0 으로되어있는데도웹상세정보에서 diplay 되지않음 여전히 display 가안되고있음 ( 변경전표제 ) 비도서기존 MARC 필드 참고제어번호 오류내용 지시기호처리문제 505 648142 280600 359453 지시기호 "0b" 로변환 ( 기본형 ) 505 a v.1. 양국의문화 -- v.2. 민족의원형 -- v.3. 현재와미래. 505 a v.1, 1992.3.31-9.11. - v.2, 1992.9.12-12.31. - v.3, 1993.1.1-4.2. 지시기호 "00" 으로변환 ( 확장형 ) 505 0 n v.1, t 삼국사기 / d 김부식 ( 전 50 권 ), t 삼국유사 / d 일연 ( 전 5 권 ) g 역주본, 원문텍스트, 원문이미지전문. - n v.2, t 운영프로그램 g 유니코드폰트포함. 체크리스트 " 확인사항 " 아래와같이정정 ( 고서 / 비도서 ) a 가존재 0b / a 없고, i, n, t, g, d, e 중하나가존재하면 00 고서기존 MARC 필드 참고제어번호 오류내용 501 서브필드 648187 기존막지시기호 0 합철, 1 합각, 2 합인 a 합철 :, a 합각 :, a 합인 (1) a로시작할때지시기호에따라문구를넣는변환은정상적으로처리되었음 (2) 501 c로시작할경우 : ( a로시작될경우가아닌 ) 정상적으로변환되지않았음 501 bb c 고서의합각표제 / d 합각저자명 (X) 501 bb a 합각 : ( 이전지시기호에따라 ) c 고서의합각표제 / d 합각저자명 (O) 다. 종단점정리프로그램체크리스트 - 107 -
16 한국도서관 정보학회지 ( 제 45 권제 3 호 ) < 표 5> 종단점정리프로그램체크리스트의주요내용 ( 예시 ) 기존 MARC 필드참고제어번호오류내용 100/600/700 100/600/700 100/600/700 100/700 637506 637152 183411 634978 488887 86498 180638 396561 478077 472963 554462 62942 58649 174188 246 527633 250 판사항 300 c ( 주로비도서 ) 180036 506059 370618 알파벳 ( 이름줄임 ) 약자 (M. J..) 로끝나는경우 매우많음 Dr. / Jr. 647358 in. / ft. A.D. / B.C. 주의 : A. D. / B. C. ( 띄어쓰기 ) ed. / tr. / ill. / photo. ( 역할어 ) 주의 : Ed. ( 이하포함 ) ed. (246 19 로원서명이오면서, 원서판사항이같이있을경우 ) ed. / aufl. / ver. 300 e ( 부록 ) 412210 suppl. / supp. 500 ( 주로고서 ) 535551 648186 508 363754 Ltd. 600 etc. 630 355189 etc. 650 651 710 332000 78086 111430 482467 178457 638359 445288 와같이태그끝에점 (.) 이 3 개이상인경우는종단점이아니라문장줄임표시이므로점들을그대로두어야함 etc. A.D. / B.C. Inc. / Bros. / Ltd. 삭제해야하는데삭제가안된경우 ( 종단점이그대로남아있는경우 ) 기존 MARC 필드 참고제어번호 오류내용 전거링크가있는경우 w AUTH ( 전거링크필드 ) 앞의종단점들은모두삭제가안됐음. 600/610/700/710 648090 648184 648186 65511 600 07 a 세조 = h 世祖, c 조선제 7 대왕, d 1417-1468. 2 SLSH. w AUTH17077 700 1 a 이원승 = h 李元勝, e 역. w AUTH145036 700 1 a 김소월 = h 金素月, d 1902-1934. w AUTH898 710 2 a 동아일보사. b 조사부. t 신문의마이크로화. w AUTH121599 700 1 a 임유정 = h 林惟正. w AUTH97432 300 전체적으로종단점삭제처리가안된서지들 324151 285452 285450 285437 332000 331996 331986 331977 331830 이종단점을삭제하면서링크필드 ( w) 가훼손되지않도록주의할것종단점삭제안됨 300 a 1 Cassette tape. 300 a 12 video tapes. 300 a 25 video tapes.(50분 ). 300 a 1 video tape. 300 a 로끝날경우점을삭제하지않다보니이런현상이나옴. 비도서의경우임. 타자료유형은 a 로끝나면. 을지우지않지만, 비도서는지워야하는케이스. 서지전체적으로종단점삭제안됨 종단점은모든자료유형에해당하므로빠뜨리는유형이없이적용되어야함 - 108 -
통합서지형 KORMARC 의도입을위한효과적인 DB 변환과시스템구축방안 17 5. 시스템의통합서지용 KORMARC 적용 가. 목록시스템 < 그림 3> 환경설정매뉴얼을통한점검 ( 예시 ) - 109 -
18 한국도서관 정보학회지 ( 제 45 권제 3 호 ) < 그림 4> 시스템테스트시나리오의일부 나. 검색을위한색인설정작업 - 110 -
통합서지형 KORMARC 의도입을위한효과적인 DB 변환과시스템구축방안 19 < 그림 5> 통합서지용 KORMARC 색인설정 ( 일부 ) 예시 다. 도서관홈페이지서지상세정보설정 < 그림 6> 웹설정일부 ( 예시 ) - 111 -
20 한국도서관 정보학회지 ( 제 45 권제 3 호 ) Ⅳ. DB 변환시고려사항및향후과제 - 112 -
통합서지형 KORMARC 의도입을위한효과적인 DB 변환과시스템구축방안 21 http://www.loc.gov/marc/authority/ecadhome.html> [cited 2014. 7], <http://www.loc.gov/marc/holdings/echdhome.html> [cited 2014. 7], - 113 -
22 한국도서관 정보학회지 ( 제 45 권제 3 호 ) V. 결론 - 114 -
통합서지형 KORMARC 의도입을위한효과적인 DB 변환과시스템구축방안 23 참고문헌 - 115 -
24 한국도서관 정보학회지 ( 제 45 권제 3 호 ) 국한문참고문헌의영문표기 (English translation / Romanization of reference originally written in Korean) - 116 -
통합서지형 KORMARC 의도입을위한효과적인 DB 변환과시스템구축방안 25-117 -