1. 기록관리 환경의 변화 전자기록물은 인터넷이 급속하게 변화하는 현대사 회에서 빠르게 확산되어 민간뿐만 아니라 공공기관까 지 거의 모든 영역에 그 영향력을 미치게 되었다. 또 한 모바일 기기가 진화하여 모바일 2.0 시대가 되면 서 사용자가 만든 콘텐츠를 모바일 기기



Similar documents
안 산 시 보 차 례 훈 령 안산시 훈령 제 485 호 [안산시 구 사무 전결처리 규정 일부개정 규정] 안산시 훈령 제 486 호 [안산시 동 주민센터 전결사항 규정 일부개정 규

회원번호 대표자 공동자 KR000****1 권 * 영 KR000****1 박 * 순 KR000****1 박 * 애 이 * 홍 KR000****2 김 * 근 하 * 희 KR000****2 박 * 순 KR000****3 최 * 정 KR000****4 박 * 희 조 * 제

<B5F0C1F6C5D0C8ADC1F6C4A72E687770>

- 2 -

이도경, 최덕재 Dokyeong Lee, Deokjai Choi 1. 서론

SIGIL 완벽입문

소식지수정본-1

01

04 Çмú_±â¼ú±â»ç

untitled

56 심층분석 행정정보시스템데이터세트의이해와기록관리고려사항 글. 이규철 ( 충남대학교컴퓨터공학과교수 ) 1 서론각급행정기관에서는전자정부법에의거행정업무의전자적처리원칙에따라행정핵심기반의주요업무를전자적으로생산 관리하기위해다양한행정정보시스템을구축하여운영하고있다. 이러한행정정보

<B1DDC0B6B1E2B0FCB0FAC0CEC5CDB3DDB0B3C0CEC1A4BAB82E687770>

wtu05_ÃÖÁ¾


....pdf..

XXXXXXXXXXXXX XXXXXXX




Web Scraper in 30 Minutes 강철

피해자식별PDF용 0502

**09콘텐츠산업백서_1 2

<C0CCBCF8BFE42DB1B3C1A4BFCFB7E12DB1E8B9CCBCB12DC0DBBCBAC0DAB0CBC1F5BFCFB7E12DB8D3B8AEB8BBB3BBBACEC0DAB0CBC1F52E687770>

Special Theme _ e-publishing 전자책이 자체적으로 생산되기는 힘들다. 따라서 많은 전자책 사업자들은 기존 종이책 시장을 통해 질적 검증 이 완료된 저작물을 전자책화하는 것을 선호하고 있다. 기존 종이책을 전자책으로 변환하는 기술은 크게 2 가지 과


디지털도서관강의자료, 학기 - 전공 부산대학교문헌정보학과 이수상교수 1 NIS


<5BB0EDB3ADB5B55D B3E2B4EBBAF12DB0ED312D312DC1DFB0A32DC0B6C7D5B0FAC7D02D28312E BAF2B9F0B0FA20BFF8C0DAC0C720C7FCBCBA2D D3135B9AEC7D72E687770>

PowerPoint Template

춤추는시민을기록하다_최종본 웹용

트렌드29호가제본용.hwp

( 제 20-1 호 ) '15 ( 제 20-2 호 ) ''16 '15 년국제개발협력자체평가결과 ( 안 ) 16 년국제개발협력통합평가계획 ( 안 ) 자체평가결과반영계획이행점검결과 ( 제 20-3 호 ) 자체평가결과 국제개발협력평가소위원회

exp

ㅇ ㅇ

제 31회 전국 고교생 문예백일장 산문 부문 심사평.hwp

01¸é

01

IBM blue-and-white template

41호-소비자문제연구(최종추가수정0507).hwp

2ÀåÀÛ¾÷

<C1DF29B1E2BCFAA1A4B0A1C1A420A8E85FB1B3BBE7BFEB20C1F6B5B5BCAD2E706466>

UNIST_교원 홈페이지 관리자_Manual_V1.0

5월전체 :7 PM 페이지14 NO.3 Acrobat PDFWriter 제 40회 발명의날 기념식 격려사 존경하는 발명인 여러분! 연구개발의 효율성을 높이고 중복투자도 방지할 것입니다. 우리는 지금 거센 도전에 직면해 있습니다. 뿐만 아니라 전국 26

Google_1±³

성능 감성 감성요구곡선 평균사용자가만족하는수준 성능요구곡선 성능보다감성가치에대한니즈가증대 시간 - 1 -

2009방송통신산업동향.hwp

National Archives of Korea 기록인 2018 SPRING + Vol 머리말 최근국가기록원에서주요한연구과제로추진되었던 차세대기록관리모델재설계 에서는신유형전자기록보존포맷기술, 생산포맷, 보존포맷, 장기보존포맷구분및현행 NEO 패키지의비효율성

I. 회사의 개요 1. 회사의 개요 1) 회사의 법적, 상업적 명칭 당사의 명칭은 "주식회사 한글과컴퓨터"라고 표기합니다. 또한 영문으로는 "HANCOM INC." 라 표기합니다. 단, 약식으로 표기할 경우에는 (주)한글과컴퓨터라 고 표기합니다. 2) 설립일자 및 존속

Contents 읽고 싶은 기사를 클릭하시면 바로 연결됩니다. 이달의 이슈 출판산업 콘퍼런스 -통계 발표 및 결산과 전망- 출판 뉴스 32 한국출판문화산업진흥원 소식 33 경기문화재단, 문화소외지역에 책 1만여 권 선물 33 마크애니DRM, 랜덤하우스 콘

歯MW-1000AP_Manual_Kor_HJS.PDF

CSG_keynote_KO copy.key

MySQL-.. 1

스키 점프의 생체역학적 연구

선진사례집(0529)

문화재이야기part2

현장에서 만난 문화재 이야기 2

³»Áö_10-6

<312E20C0AFC0CFC4B3B5E55F C0FCC0DAB1E2C6C720B1B8B8C5BBE7BEE7BCAD2E687770>

목 차 1. 출장개요 03 가. 출장계획 03 나. 출장자별분장 05 다. 방문기관정보 06 라. 면담및견학일정 07 마. 면담자기념품 출장일정 09 가. 요약 09 나. 상세 출장보고 16 가. Vancouver Public Library, Ce

ICT À¶ÇÕÃÖÁ¾

열거형 교차형 전개형 상승형 외주형 회전형 도해패턴 계층형 구분형 확산형 합류형 대비형 상관형 (C) 2010, BENESO All Rights Reserved 2

< B1B9B8B3C1DFBED3B5B5BCADB0FC20BFACBAB C3D6C1BEBABB292E687770>

¼Òâ¹Ý¹®Áý¿ø°í.hwp

2015

IT & Future Strategy 보고서 는 21세기 한국사회의 주요 패러다임 변화를 분석하고 이를 토대로 미래 초연결 사회의 주요 이슈를 전망, IT를 통한 해결 방안을 모색하기 위해 한국정보화진흥원 (NIA) 에서 기획, 발간하는 보고서입니 다. NIA 의 승인

국어 순화의 역사와 전망

DWCOM15/17_manual

¾Ë±â½¬¿îÀ±¸®°æ¿µc03ÖÁ¾š

#³óÃÌ°æÁ¦ 64È£-Ä®¶ó¸é

¾Èµ¿±³È¸º¸ÃÖÁ¾

#편집인협회보379호

PowerPoint 프레젠테이션

대표이사등의확인서명( ) I. 회사의 개요 1. 회사의 개요 1. 연결대상 종속회사 개황(연결재무제표를 작성하는 주권상장법인이 사업보고서, 분기ㆍ 반기보고서를 제출하는 경우에 한함) (단위 : 백만원) 상호 설립일 주소 주요사업 직전사업연도말 자산총액 지배

PowerPoint 프레젠테이션

第 1 節 組 織 11 第 1 章 檢 察 의 組 織 人 事 制 度 등 第 1 項 大 檢 察 廳 第 1 節 組 대검찰청은 대법원에 대응하여 수도인 서울에 위치 한다(검찰청법 제2조,제3조,대검찰청의 위치와 각급 검찰청의명칭및위치에관한규정 제2조). 대검찰청에 검찰총장,대

¿¡À̽º ÃÖÁ¾¿ø°í

한국의 양심적 병역거부


Microsoft PowerPoint - 권장 사양

(......).hwp

KCCS :V2.1(N01) 디지털수량산출정보교환표준 ( 안 ) Digital QDB(Quantity DataBase) in Construction V2.1 제정일 : 2011 년 4 월 개정일 : 2016 년 6 월

목 차 Ⅰ. 조사개요 1 Ⅱ. 용어해설 13 Ⅲ. 조사결과 과학기술인력 양성 및 활용에 관한 거시통계 분석 결과 9 1 가. 과학기술인의 양성 현황 19 나. 과학기술인의 취업 현황 24 다. 과학기술인의 경제활동 현황 27 라. 과학기술인의 고용 현황 28

목차

4-Ç×°ø¿ìÁÖÀ̾߱â¨ç(30-39)


Red Dot Award: Communication Design 에 참 하기 결정해 주셔서 기쁩니다. "성공을 위한 안내서"는 등 절 에 대해 안내 니다. 지체 말고 언 든지 연 해 주 오. Red Dot 은 등 절 또는 등 후 절 를 기꺼 와드 겠습니다. 01 Int

개정자 : 행정안전부국가기록원장 제정일 : 2008년 12월 23일 ( 행정안전부고시제 호 ) 1차개정일 : 2013년 12월 30일 ( 안전행정부고시제 호 ) 2차개정일 : 2017년 12월 29일 ( 국가기록원고시제2017-7호 ) 심의 : 국

A G E N D A 2015년형 전시공간 넷 no mountain high enough 2 Suitable Forms Bachelor Party LESS


歯튜토리얼-이헌중.PDF

TTA Journal No.157_서체변경.indd

< E5FBBEABEF7C1DFBAD0B7F9BAB02C5FC1B6C1F7C7FCC5C25FB9D75FB5BFBAB05FBBE7BEF7C3BCBCF65FA1A4C1BEBBE7C0DABCF62E786C73>

0. 들어가기 전

View Licenses and Services (customer)

hwp

멀티미디어 콘텐츠 접속을 위한 사용자인증 시스템_교열(박세환, ).hwp

PathEye 공식 블로그 다운로드 받으세요!! 지속적으로 업그래이드 됩니다. 여러분의 의견을 주시면 개발에 반영하겠 습니다.


H3250_Wi-Fi_E.book

<C3E6B3B2B1B3C0B C8A32DC5BEC0E7BFEB28C0DBB0D4292D332E706466>

Transcription:

웹기록물, 데이터세트, SNS 등 기록관리 환경변화와 아카이빙 기술 충남대학교 이 규 철 교수

1. 기록관리 환경의 변화 전자기록물은 인터넷이 급속하게 변화하는 현대사 회에서 빠르게 확산되어 민간뿐만 아니라 공공기관까 지 거의 모든 영역에 그 영향력을 미치게 되었다. 또 한 모바일 기기가 진화하여 모바일 2.0 시대가 되면 서 사용자가 만든 콘텐츠를 모바일 기기에서 활용할 수 있는 환경이 빠르게 확산되어가고 있다. 이에 따 라 많은 다양한 전자기록물들이 생성되어 유통되고 있다. 전자기록물의 종류로는 일반 전자기록물, 웹기록 물, 데이터세트, SNS(Social Network Service), e-book, CAD/CAM 전자도면류 등이 있다. 종이문서, 전자문서의 본문 및 첨부파일과 같은 일 반 전자기록물은 [그림 1]과 같은 관리 체계를 가진다. 국가의 중요자원인 웹기록물은 정보의 활용성 측 면에서 그 가치가 매우 높아지고 있으나 웹이라는 짧 은 생명 주기 및 수집, 보존, 활용에 대한 방안이 없 어 소멸되고 있는 실정이다. 웹기록물은 웹크롤러에 의해 수집가능한 표면웹(Surface Web)과 데이터베 이스에 저장된 심층웹(Deep Web)이 있다. 데이터세트는 컴퓨터가 처리하거나 분석할 수 있 는 형태로 존재하는 관련 정보의 집합체로써, 컴퓨터 가 분석할 수 있도록 형식을 갖춘 연관성 있는 정보 들의 집합으로 데이터파일 혹은 데이터베이스와 유사 한 개념이다. 즉, 데이터세트는 행정정보시스템에서 생산.관리되는 행정정보 중 전자문서가 첨부되지 않 고, 테이블 형식의 구조화된 데이터의 특징을 가진 집합이다. [그림 1] 일반전자기록물 관리체계 우리나라 정부부처 및 공공기관 대부분에서는 페이 스북(Facebook), 트위터(Twitter), 미투데이(M2Day) 를 이용해서 국민과의 대화 창구로 활용하고 있다. [그 림 2]는 폴리씨 페이스북에서 제공하는 정부부처 SNS 지도이다. 청와대를 비롯해서 대부분의 정부부처가 SNS 서비스를 제공하고 있는 실정이다. 정부부처의 SNS 사용 목적은 각 정부부처의 정책을 알리고 해당 정책에 대한 국민들의 의견을 수렴하기 위해서이다. e-book 역시 우리나라 정부부처 및 공공기관에서 각 기관의 정책을 홍보하고 국민들에게 관련지식을 전달하기 위해 사용된다. e-book을 지원하는 정부 부처는 고용노동부, 교육과학기술부, 국토해양부, 문 화체육관광부, 법무부, 외교통산부 등이 있다. 이들 은 각기 상이한 e-book 소프트웨어를 사용하고 있 었으며, 그로 인해 상이한 포맷으로 e-book을 생성 하고 보급하고 있었다. 또한 공식적인 납본 절차가 없으며, 이들을 영구보존하기 위한 보존 포맷도 없는 상황이어서 많은 중요한 기록들이 보존되지 못하고 있다. 106 제5차 기록보존기술 공동학술세미나

of Drawing Information in Construction)을 따라 보관기관이 한국건설기술연구원으로 이관되고 있다. 항만 CAD 도면은 AutoCAD 파일 포맷(.dwg)로 한 국건설기술연구원으로 이관되고 있으며, 다른 기관이 관리하는 CAD 도면들은 보관이 되고 있지 않은 실 정이다. 단지 필요기관에서 요청시에만 도면을 인쇄 하여 전달하고 있었다. 한국건설기술연구원으로 이관 되고 있는 CAD 도면류는 한해 30~40건으로 건당 수백개의 도면이 포함되어 있다. [그림 2] 정부부처 SNS 서비스 현황 [표 4] e-book을 지원하는 정부부처 [그림 3] CAD 도면류 생애주기 2. 전자기록물별 보존 전략 CAD 도면류 생애주기 [그림 3]과 같다. 각 시공 업체나 건설업체는 설계시점 또는 준공시점마다 자신 들이 설계한 CAD 도면류를 발주처인 각 기관에 보 내게 된다. 그 사업내용에 따라 일반국도나 지방하천 의 경우 지방국토관리청이 CAD 도면을 관리하게 되 며, 항만에 관한 CAD 도면은 한국항만공사가 관리 하고, 한국수자원공사는 하천을, 한국철도공사, 지하 철공사, 한국공항공사, 한국도로공사는 각각 철도, 지하철, 공항, 고속국도와 관련된 CAD 도면을 관리 한다. 각 관리기관으로 이관된 CAD 도면 중 지방국토관 리청에서 관리하는 CAD 도면만이 우리나라 건설분 야 도면정보 교환표준인 KOSDIC(Korean Standard 전자기록물은 크게 수집대상과 이관대상으로 분류 하여 각 대상에 적합한 보존 전략을 수립할 수 있다. 이관대상 전자기록물에는 일반 전자기록물, 심층 웹기록물, 데이터세트, CAD/CAM 도면류와 e-book 이 있다. 이들은 [그림 4]와 같은 생애주기를 갖는 다. 생산기관에서 생성된 전자기록물은 기록관으로 전달되어 활용되다가(또는 이 단계는 생략) 보존 기 관으로 이관되어 영구 보존되게 된다. 이러한 생애주 기를 갖는 이관대상 전자기록물은 생산 활용 보존 단 계별 메타데이터가 다르며, 보존 기관에 이관할 때 보존 메타데이터가 생성되게 된다. 따라서, 이관대상 전자기록물은 활용기관에서 보존 포맷으로 변환하여 이관하고, 이관 시 보존 메타데이터도 함께 생성하여 이관하는 형태가 바람직할 것이다. 웹기록물, 데이터세트, SNS 등 기록관리 환경변화와 아카이빙 기술 107

용자는 자신이 필요한 정보에 접근할 수 있다. [그림 4] 이관대상 전자기록물 생애주기 [그림 5]과 같은 생애주기를 갖는 수집대상 전자기 록물의 메타데이터 특성은 생산 활용 메타데이터가 같지만 보존 메타데이터는 상이하다는 데 있다. 즉, 보존 기관이 보존에 필요한 메타데이터를 기록물 수 집 시 생성해야 한다. 수집대상 전자기록물의 경우에 는 보존 기관에서 수집된 전자기록물을 적당한 보존 포맷으로 변환하고, 필요한 보존 메타데이터를 추출 하는 보존 전략이 필요하다. 수집대상 전자기록물에 는 SNS와 HTML로 구축된 표면웹 기록물이 해당된 다. [그림 6] 이관대상 전자기록물 보존 워크플로우 수집대상 전자기록물들을 선별, 수집, 보존, 전달 하는 보존 워크플로우는 [그림 7]과 같다. [그림 5] 수집대상 전자기록물 생애주기 이와 같은 생애주기를 바탕으로 OAIS 기반으로 이관대상 및 수집대상 전자기록물별 보존 워크플로우 를 정의하면 다음과 같다. 이관대상 전자기록물 보존 워크플로우는 [그림 6] 과 같다. 이관대상 전자기록물 워크플로우는 총 여섯 단계로 이루어진다. 생산기관에서 생산된 전자기록물 은 SIP 형태로 입수 단계에 전달된다. 입수 단계에 서는 영구보존에 필요한 정보들을 추출하고 이관된 전자기록물을 AIP 형태로 변환한다. AIP는 아카이브 저장소로 전달되며, 관리자에 필요한 데이터베이스 관리 단계를 거치게 된다. 이러한 보존 프로세스는 보존 정책을 따르게 되며, 후에 접근 단계를 통해 사 [그림 7] 수집대상 전자기록물 보존 워크플로우 선별위원회에서 적절하게 정해진 선별 정책에 의 해 선별된 기록물은 정해진 수집방법을 통해 수집된 다. 수집 시 품질보증을 위해 전후로 사전수집, 사후 수집 테스트를 시행한다. 이와 같은 품질보증 및 목 록에 의해 진본성을 유지하며, 일정한 매체에 저장되 어 장기간 보존된다. 저장되고 보존된 아카이빙은 전 달 시스템을 통해 사용자가 아카이빙시의 모습 그대 로를 확인할 수 있도록 제공한다. 108 제5차 기록보존기술 공동학술세미나

3. 전자기록물별 아카이빙 기술 전자기록물별 아카이빙 기술 개발은 [그림 4]에서 보여 지는 바와 같이 2004년부터 현재까지 국가기록 원에서 꾸준히 진행하여 왔다. [그림 9]와 같이 기록물 철, 건 구조를 웹기록물에 도 적용하여, 기록물철과 기록물 건 단위의 개별적인 장기보존 포맷 객체로 관리하며, 문서보존포맷으로는 표면 웹기록물의 경우에는 WARC를 사용하고, 심층 웹기록물은 ZIP 파일 형식으로 아카이빙 한다. 기록 물 건은 각각의 웹기록물에 따른 기록물건을 생성하 며, 기록물철은 일정한 기록물건들의 집합을 의미한 다. 표면과 심층 웹기록물은 그 수집 방법이 상이한 데 이는 [그림 10]과 [그림 11]에 나타내었다. [그림 8] 전자기록물별 아카이빙 기술 개발 경과 이와 같은 기술개발을 통해 구축된 각 기록물별 아카이빙 기술의 개략적 내용은 다음과 같다. [그림 10] 표면 웹기록물 수집방법 웹기록물 아카이빙 기술 웹기록물 아카이빙을 위해 OAIS에 따라 웹기록물 의 수집/장기보존/서비스 과정을 정의하고 그 정의에 따라 웹기록물의 수집포맷, 장기보존포맷, 서비스 포 맷을 정의하였다. [그림 11] 심층 웹기록물 추출 및 변환도구 데이터세트 아카이빙 기술 [그림 9] 웹기록물 철, 건 구조 데이터세트는 기존의 전자기록의 철,건 구조와 상 이한 특성을 가지는 새로운 디지털 기록이다. 따라서 기존의 기록관리시스템, 영구기록관리시스템으로 이 관되는 체계가 아닌 디지털 아카이브로 직접 이관되 웹기록물, 데이터세트, SNS 등 기록관리 환경변화와 아카이빙 기술 109

도록 설계하여 데이터세트 구조에 맞는 보존이 이루 어질 수 있도록 한다. 데이터세트는 구조화된 데이터 인 테이블로 구성되어 전자문서와는 다르게 다양한 검색방법이 제공되어야 한다. 또한, 데이터세트는 그 맥락을 파악하는데 시스템 다큐멘테이션이 필요하며 따라서 시스템 다큐멘테이션의 기록관리 절차 및 방 법론이 설계되어야 한다. [그림 13] 데이터세트 이관절차 [그림 12] 데이터세트 아카이빙 구조 데이터세트 아카이빙 구조는 [그림 12]와 같다. 데 이터세트 계층은 시리즈-데이터세트-테이블로 구분 하고 시스템 다큐멘테이션(System Documentation) 은 동일 시리즈하에서 따로 관리한다. 필요한 경우 시리즈 아래에 서브시리즈를 둘 수 있다. 시리즈 계 층에는 각 기관이 소유한 행정정보시스템을 두고, 이 관년도별로 서브 시리즈를 구성하며 그 하위 단위에 는 하나이상의 데이터세트와 하나이상의 테이블이 있 다. 이렇게 구조화된 데이터세트는 각 기관별로 관리 된다. 데이터세트의 이관대상은 데이터세트와 그 메타데 이터, 시스템 다큐멘테이션과 그 메타데이터로서, 데 이터세트를 이해하기 위해 필요한 맥락정보를 위해 시스템 다큐멘테이션까지 이관범위가 확대되었다. [그림 14] 데이터세스 장기보존포맷 데이터세트 보존포맷은 크게 패키지정보, 실질적인 데이터 내용이 담긴 내용정보, 그리고 보존메타데이 터로 구분된다. 패키지정보는 패키지 식별자, 버전, XML영역의 크기 등 정보 패키지의 전체 구조를 지 시하는 정보로 구성된다. 내용정보는 하나이상의 테 이블정보와 데이터세트 메타데이터가 모여 형성된 데 이터세트로 구성되며, 보존정보는 데이터세트의 진본 성, 신뢰성, 무결성, 이용 가능성을 위해 필요한 정 보로 구성된다. 이는 보존 및 배포의 물리적 단위가 된다. 110 제5차 기록보존기술 공동학술세미나

SNS 아카이빙 기술 아카이빙 대상이 되는 SNS는 우리나라 행정기관 페이스북 페이지와 트위터이다. 페이스북 기록물 수집 프로세스는 다음과 같다. 1. 대상 기관의 PAGE ID를 구하고 PAGE 테이블 정보를 가져옴 2. 특정 기관, 특정 기간 동안의 STREAM 테이블과 POST 관련 테이블(COMMENT, ALBUM, EVENT, EVENT_MEMBER, PLACE, PHOTO_TAG, VIDEO_TAG, LIKE, QUESTION_OPTION, QUESTION_OPTION_VOTES)을 각각의 테이블별 로 데이터를 추출하여 테이블별 XML 파일 생성 [그림 16] 페이스북 기록물 수집포맷 트위터 기록물 수집 프로세스는 다음 [그림 17]과 같다. 3. Post 관련 정보를 얻어 온 후 각 포스트의 댓글 (Comment) 정보와 좋아요(Like) 정보 및 사진 태 그와 비디오 태그 정보를 가져옴 페이스북 기록물 수집 포맷은 XML로 표현하는데, 수집대상이 되는 총 12개의 테이블에 대한 질의 결 과를 각각의 XML로 표현한다. [그림 17] 트위터 기록물 수집 프로세스 [표 5] 트위터 기록물 수집포맷: DB 테이블 [그림 15] 페이스북 기록물 수집 프로세스 트위터 기록물은 일자 구분이 어려우므로 데이터 베이스에 매일 매일 트위터 기록물을 수집해 와서 저 장하는 방법을 사용한다. 웹기록물, 데이터세트, SNS 등 기록관리 환경변화와 아카이빙 기술 111

페이스북과 트위터 기록물에 대한 장기보존포맷은 다음과 같다. 페이스북 기록물[그림 18]은 포스터 단 위로 문서보존포맷을 정의하며, 트위터는 트윗 단위 로 문서보존포맷[그림 19]을 정의한다. 유지함으로써 모든 전자기록물을 CAMS에서 통합하 여 관리할 수 있도록 하는 것이다. 모든 전자기록물을 포괄하는 메타데이터 프레임워크 모든 전자기록물을 포괄하는 메타데이터 프레임워 크 개발을 위해 기존 우리나라에서 생산 활용되는 전자기록물들의 메타데이터를 분석하였으며, 해외의 메타데이터 프레임워크를 조사 분석하였다. [그림 18] 페이스북 기록물 장기보존포맷 [그림 19] 트위터 기록물 장기보존포맷 4. 전자기록물 아카이빙의 해결 이슈 전자기록물별 아카이빙 기술은 상이하지만 모든 전자기록물을 통합하여 관리하기 위해서는 해결해야 할 두 가지 이슈가 있다. 첫 번째는 모든 전자기록물 을 포괄하는 메타데이터 프레임워크를 만들어 전자기 록물의 종류와 상관없이 사용자가 관리 및 활용할 수 있도록 하는 것이며, 둘째는 일관된 장기보존포맷을 NAK/S 8:2007(v1.0) 기록관리 메타데이터 표준, 웹기록물 메타데이터, 행정정보시스템 데이터세트 메 타데이터를 조사 분석하였다[표 3]. 웹기록물 메타데이터는 Deep 웹기록물을 아카이빙 할 때 웹기록물에 대한 분류, 보존 자료의 무결성 검 토, 관련 기술자료 검토, 검색 등을 지원하기 위해 설명 자료를 저장하는 메타데이터의 항목 요소를 포 함해야 한다. 메타데이터 항목은 총 28가지의 항목 으로 구성되며, 특성에 따라 장기보존포맷의 기록물 건에 저장될 수 있는 기본적인 기록물건 메타데이 터, Deep 웹기록물의 특성을 가지고 있는 Deep 웹기록물 메타데이터, 저장 복원시 필요한 Deep 웹 기록물 특징인 기술 메타데이터 로 구성된다. 행정정보시스템 데이터세트 메타데이터는 데이터세 트의 장기보존을 위한 과정을 기술하는 구조적 정보 로서 데이터세트 기록으로의 접근과 보존을 지원한 다. XML포맷으로 패키징 된 데이터세트 보존메타데 이터는 크게 패키지정보, 내용정보, 보존정보로 구분 된다. 보존정보패키지 전반에 대한 정보를 담고 있는 패키지 정보는 패키지 식별자, 패키지 제목, 버전, 인계자, 인수자, 생산일시, 패키지 내용, 테이블 수, 뷰테이블 수, XML 영역 해쉬 값, XML 영역 해쉬 알고리즘으로 구성된다. 실질적인 기록 정보를 담고 있는 내용정보는 데이터세트 관련 정보와 테이블 관 112 제5차 기록보존기술 공동학술세미나

[표 6] 메타데이터 비교 번호 일반 전자기록물 메타데이터 웹기록물 메타데이터 행정정보시스템 데이터세트 메타데이터 1 생산행위자->기안자 Creator content_info->org->system->org_name content_info->org->system->orgcode 2 생산행위자->수신자 package->receiver 3 생산행위자->발신자 package->sender 4 기록식별자 Identifier package->id 5 기록물명 Title package->title 6 기술 Description package->description 7 주제 Keywords 8 유형 RecordType 9 저장매체 Format 10 날짜->생산일자 CreationDateTime package->production_date 11 날짜->종료일자 package->end_date 12 날짜->등록일자 package->registration_date 13 생산관리->생산근거 Laws content_info->org->system->law_type content_info->org->system->law_name content_info->org->system->law_pre 14 권한->접근 AccessLevel 15 이용이력 UsingHistory 16 보존이력->보존처리일시 ArchivingDateTime 17 보존이력->보존행위자 Archiver 18 관계 Relation 19 언어 Language 련정보로 나뉘며, 그 세부적인 메타데이터는 앞에서 제시한 분류기술 기술요소 와 동일하다. 메타데이터 프레임워크 설계를 위해 앞에서 분석 한 세 종류의 메타데이터를 비교 분석하여 공통된 항목을 추출하였다[표 3]. 이 공통된 항목은 메타데 이터 프레임워크에 표현되어야 할 주요한 메타데이터 항목이 될 수 있다. 해외에서 전자도서관 및 전자 기록물을 위한 메타 데이터 프레임워크로 METS(Metadata Encoding and Transmission Standards)가 있다. METS는 시스템 간의 복잡한 디지털 객체의 전송 및 아카이빙 을 위해 디지털 자원에 대한 중간매개 문서의 인코딩 규칙을 규정하는 XML 스키마 기반의 표준이다. 전 자도서관연합(Digital Library Federation)의 지원 하세 진행된 MOA2 프로젝트 결과물로서, 미의회도 서관(U.S. Library of Congress)에서 2001년에 개 발. METS 1.0이 2001년에 개발된 후, 2005년 1.4 버전이 발표되었으며 현재, 2010년에 발표된 버전 1.6이 사용되고 있다. METS는 디지털 객체를 표현 하는 디지털 정보의 식별과 정보의 위치를 기술할 수 있으며, 디지털 콘텐츠와 관련된 각종 메타데이터를 연결할 수 있다. 또한 디지털 콘텐츠와 프로그램 코드를 링크시키 거나 관련된 서술 관리 메타데이터를 연결할 수 있 으며, 디지털 콘텐츠 및 관련된 서술 관리 메타데이 터를 XML 또는 이진데이터(binary data)로 함께 패 웹기록물, 데이터세트, SNS 등 기록관리 환경변화와 아카이빙 기술 113

키징 할 수 있다. 시스템 간 디지털 객체의 인코딩 교환을 위한 메타데이터 정보를 표준화된 XML 포맷 으로 제공하는 범용 메타데이터 프레임워크로서 디지 털 객체의 전송, 교환, 보존에 대한 표준으로 사용되 며, METS로 기술된 메타데이터는 자원에 대한 기술 용, 관리용, 구조용 메타데이터를 캡슐화 할 수 있기 때문에, OAIS의 SIP 와 같은 용도로 사용 가능하다. 이와 같은 METS를 이용하여 일반 전자기록물 메 타데이터 표준, 웹 아카이빙 메타데이터, 행정정보시 스템 데이터세트 메타데이터를 포괄할 수 있는 메타 데이터 프레임워크(안)을 [표 4]에서 제시한다. [표 7] METS로 표현한 메타데이터 프레임워크 [그림 20] 페이스북/트위터 기록물 보존메타데이터 일관된 장기보존포맷 유지 일관된 장기보존포맷을 유지함으로써 모든 전자기 록물을 CAMS에서 통합하여 관리할 수 있도록 하기 위해서 기존 전자기록물 장기보존 포맷인 일반 전자 기록물 장기보존포맷, 웹기록물 장기보존포맷, 행정 정보 데이터세트 장기보존포맷을 분석하여 페이스북/ 트위터 장기보존 포맷을 설계하였다. SNS의 장기보존포맷은 장기보존 메타데이터, 문서보 존 포맷으로 구성하고, 문서보존포맷은 문서보존 메타데 이터, 페이스북/트위터 기록물로 구성하였다[그림 21]. 페이스북과 트위터 기록물에 대한 보존 메타데이 터는 [그림 20]과 같이 일반 전자기록물 메터데이터 를 확장하여 설계하였다. 현재까지 개발된 장기보존포맷 중 약간 상이한 것은 DAMS에서 사용하는 행정정보 데이터세트 장기보존포 맷인데, 이 포맷도 다른 전자기록물 장기보존포맷과 같 이 일관성을 가지도록 변환을 해야 될 필요가 있다. [그림 21] SNS 기록물 장기보존 포맷 114 제5차 기록보존기술 공동학술세미나

5. 향후 연구과제 및 결언 l 향후 연구과제 향후 과제로는 크게 e-book 장기보존연구와 CAD/CAM 도면류 장기보존연구가 있다. e-book은 전자 형태로 출판된 도서로 관련 표준은 IDPF (International Digital Publishing Forum)에 서 진행하는 EPUB (Electronic PUBlication)이 있 다. 이는 Open ebook Publication Structure Specification Version 1.2의 다음 버전이다. EPUB 는 개방형 표준으로 자동공간조정과 글자크기 변환, XML, HTML5, CSS2, SVG, 이미지 등을 지원하며 메타데이터를 포함한다. EH한 같은 파일에 대해 렌더 링을 지원한다. EPUB 표준은 다음과 같은 구성을 가진다. EPUB 3 Overview: Proposed Specification (2011. 5. 23) EPUB Publications 3.0: Proposed Specification (2011. 5. 23) 출판 단계의 의미를 정의하고, EPUB 출판에 필요한 주요한 요구사항 EPUB Content Documents 3.0: Proposed Specification (2011. 5. 23) XHTML, SVG, CSS를 이용하여 EPUB 출판 물의 컨텍스트를 사용 EPUB Open Container Format(OCF) 3.0: Proposed Specification (2011. 5. 23) EPUB 출판물과 관계된 리소스들을 캡슐화하 여 Zip 파일 형태로 제공 EPUB Media Overlays 3.0: Proposed Specification (2011. 5. 23) 텍스트와 오디오 동기화에 필요한 포맷과 프 로세싱 모델을 정의 CAD(Computer Aided Design)/CAM(Computer Aided Manufacturing)은 설계에서 제품제도에 이르 는 모든 공정을 컴퓨터로 관리하는 기술로, 근래에는 3차원 시스템이 개발되어 도면의 입체영상을 재현시 킬 수 있다. 하지만 보존의 방안이 없기 때문에 현재 는 그냥 도면을 스캐닝하여 저장하기 때문에 구성하 고 있는 데이터베이스 및 조립/생산 등의 정보들이 유실된 채 저장된다. CAD 관련 표준으로는 AEC(Architecture Engineering and Construction), MCAD(Mechanical CAD), KOSDIC(Korea Standard of Drawing Information in Construction), PDF/E(PDF for Engineering), CAD 데이터 교환 표준이 있다. AEC CAD는 건설분야에서 사용되는 CAD 표준이 며, MCAD 표준은 제품의 형상을 3D로 정확하게 모델링하는데 목 적을 가진 PMI (Product M a n u factu rin g In form a tio n ) 정 의 와 G D & T (G eom etric D im en sion ing an d Tolerancing)에 대한 3D 확장에 대한 산업 표준이다. 이 표준은 ASME Y14-41-2003 PDD(Product Data Definition)과 3D 모델을 표현하기 위한 명세서인 ISO 1101을 포함한다. KOSDIC은 우리나라 건설분야 도면정보 교환표준 으로 국내 건설분야 CAD 도면정보의 전자적인 교환, 납품, 보관을 위해 개발된 국제표준 ISO 10303: STEP(Standard for the Exchange of Protocol model data) 기반의 2차원 CAD 데이터 표준포맷이 다. 이 표준은 현재 건설교통부 훈령 '건설기술개발 및관리등에관한운영규정' 제57조 제4항에 의하여 공 고된 건설분야 도면정보 교환표준(건설CALS/EC 단체표준 공고 2004-3호('04.08.25))으로 지정되 어 있다. 웹기록물, 데이터세트, SNS 등 기록관리 환경변화와 아카이빙 기술 115

ISO 10303: STEP은 국제표준화기구(ISO)가 산업 분야별 정보교환 및 공유를 위해 개발한 객체 지향형 제품모델 데이터 교환 표준이다. 2007년 6월 ISO에서 개방형 표준으로 승인한 PDF/E(ISO 24517-1:2008)는 엔지니어링 워크플로우에서 사용 되는 문서의 작성, 열람 및 인쇄를 위한 사양을 제시 한다. 건축가, 엔지니어, 건설 전문가 및 제조 팀은 Acrobat X를 사용하여 공급망의 다른 직원과 문서 및 도면을 간편하게 교환하고 문서 검토 및 마크 업을 간소화할 수 있다. PDF/E는 Interactive 3D(Universal 3D 포맷)를 지원하지만, 보존 포맷으 로 고안된 것은 아니다. STEP은 ISO에서 제정 중에 있는 새로운 국제표준으로, 제조업체에서 제품을 개 발하고 생산할 때, 서로 다른 자동화 시스템 간에 제 품정보를 교환하는데 사용하는 공통의 언어 역할을 하는 인터페이스 기술이다. 형상모델(geometric model)과 제품모델(product model)의 차이점은, 형상모델이 순수한 수학적인 표현에 바탕을 둔 것이 라면, 제품모델은 형상모델을 포함하면서 추가로 가 공과 생산을 위한 정보를 포함하는 확대된 개념이다. CAD 영구보존과 관련한 연구로는 LOTAR(LOng Term Archiving and Retrieval) 프로젝트가 있다. LOTAR 국제 프로젝트의 목적은 3D CAD나 PDM 같은 디지털 데이터를 영구보존하기 위한 표준 개발에 있다. 이 프로젝트는 OEM이 주도하고, ASD-STAN, AIA, PDES Inc. ProSTEP ivip Association 같은 항공우주방제 산업체의 지원을 받 아 진행된다. Phase 1: EN/NAS 표준 문서 및 실제 상황에 서 3D CAD 데이터의 개념, 프로세스 고려사 항을 생성 Phase 2: EN/NAS 표준 문서 및 3D CAD, PMI, PDM, 3D CAD 조합 등 장기보존을 위 한 고려사항을 생성 Phase 3: EN/NAS 표준 문서 및 시스템 설계 시뮬레이션 등을 위한 고려사항 생성 [그림 22] LOTAR 프로젝트 범위 결언 마지막으로 전자기록물 R&D 추진계획을 제안하면 다음 [그림 23]과 같다. [그림 22]에 나타난 것처럼 LOTAR 프로젝트는 3D CAD 영구보존을 목적으로 하였으나, 처음에는 수치 데이터를 제외한 CAD 데이터만 영구보존 하였 다. 그러나, 최종 목표는 수치 데이터(PMI)까지 모두 포함한 CAD 데이터를 영구보존 하는데 있다. LOTAR 프로젝트는 다음과 같은 3단계 프로세스 를 갖는다. [그림 23] 향후 전자기록물 R&D 추진계획 제안 116 제5차 기록보존기술 공동학술세미나

2013년에는 e-book 이관 법제도 및 표준정비와 e-book의 보존포맷과 변환도구 및 메타데이터 연구 개발을 진행할 것을 제안한다. 2014년에는 CAD/CAM 2D에 대한 보존방안을 위 해 이관 법제도 및 표준 정비와 보존포맷, 변환도구 및 메타데이터 연구 개발이 진행되는 것이 필요하며, 또한 2015년에는 현재 스마트폰의 보급으로 한창 각 광을 받고 있는 하이브리드 앱의 기록물을 보존하기 위해 HTML5/CSS3의 차세대 웹의 보존연구가 필요 할 것이다. 2016년에는 SmartTV의 보존 연구, 2017년도에 는 CAD/CAM 3D에 관한 보존방안에 관한 연구가 진행되어야 할 것으로 예측되어 진다. 웹기록물, 데이터세트, SNS 등 기록관리 환경변화와 아카이빙 기술 117

118 제5차 기록보존기술 공동학술세미나

웹기록물, 데이터세트, SNS 등 기록관리 환경변화와 아카이빙 기술 119

120 제5차 기록보존기술 공동학술세미나

웹기록물, 데이터세트, SNS 등 기록관리 환경변화와 아카이빙 기술 121

122 제5차 기록보존기술 공동학술세미나

웹기록물, 데이터세트, SNS 등 기록관리 환경변화와 아카이빙 기술 123

124 제5차 기록보존기술 공동학술세미나

웹기록물, 데이터세트, SNS 등 기록관리 환경변화와 아카이빙 기술 125

126 제5차 기록보존기술 공동학술세미나

웹기록물, 데이터세트, SNS 등 기록관리 환경변화와 아카이빙 기술 127

128 제5차 기록보존기술 공동학술세미나

웹기록물, 데이터세트, SNS 등 기록관리 환경변화와 아카이빙 기술 129

130 제5차 기록보존기술 공동학술세미나

웹기록물, 데이터세트, SNS 등 기록관리 환경변화와 아카이빙 기술 131

132 제5차 기록보존기술 공동학술세미나

웹기록물, 데이터세트, SNS 등 기록관리 환경변화와 아카이빙 기술 133

134 제5차 기록보존기술 공동학술세미나

웹기록물, 데이터세트, SNS 등 기록관리 환경변화와 아카이빙 기술 135

136 제5차 기록보존기술 공동학술세미나

웹기록물, 데이터세트, SNS 등 기록관리 환경변화와 아카이빙 기술 137

138 제5차 기록보존기술 공동학술세미나

웹기록물, 데이터세트, SNS 등 기록관리 환경변화와 아카이빙 기술 139

140 제5차 기록보존기술 공동학술세미나

웹기록물, 데이터세트, SNS 등 기록관리 환경변화와 아카이빙 기술 141

142 제5차 기록보존기술 공동학술세미나

웹기록물, 데이터세트, SNS 등 기록관리 환경변화와 아카이빙 기술 143

144 제5차 기록보존기술 공동학술세미나