PowerPoint Template

Similar documents
Windows 8에서 BioStar 1 설치하기

CONTENTS Volume 테마 즐겨찾기 빅데이터의 현주소 진일보하는 공개 기술, 빅데이터 새 시대를 열다 12 테마 활동 빅데이터 플랫폼 기술의 현황 빅데이터, 하둡 품고 병렬처리 가속화 16 테마 더하기 국내 빅데이터 산 학 연 관

Cover Story Oracle Big Data Vision 01_Big Data의 배경 02_Big Data의 정의 03_Big Data의 활용 방안 04_Big Data의 가치

클라우드컴퓨팅확산에따른국내경제시사점 클라우드컴퓨팅확산에따른국내경제시사점 * 1) IT,,,, Salesforce.com SaaS (, ), PaaS ( ), IaaS (, IT ), IT, SW ICT, ICT IT ICT,, ICT, *, (TEL)

SANsymphony-V

Ubiqutious Pubilc Access Reference Model

歯MW-1000AP_Manual_Kor_HJS.PDF


경우 1) 80GB( 원본 ) => 2TB( 복사본 ), 원본 80GB 는 MBR 로디스크초기화하고 NTFS 로포맷한경우 복사본 HDD 도 MBR 로디스크초기화되고 80GB 만큼포맷되고나머지영역 (80GB~ 나머지부분 ) 은할당되지않음 으로나온다. A. Window P

PowerPoint 프레젠테이션

슬라이드 1

Microsoft PowerPoint - chap01-C언어개요.pptx

第 1 節 組 織 11 第 1 章 檢 察 의 組 織 人 事 制 度 등 第 1 項 大 檢 察 廳 第 1 節 組 대검찰청은 대법원에 대응하여 수도인 서울에 위치 한다(검찰청법 제2조,제3조,대검찰청의 위치와 각급 검찰청의명칭및위치에관한규정 제2조). 대검찰청에 검찰총장,대


Microsoft Word - windows server 2003 수동설치_non pro support_.doc

DB진흥원 BIG DATA 전문가로 가는 길 발표자료.pptx

Straight Through Communication

아이콘의 정의 본 사용자 설명서에서는 다음 아이콘을 사용합니다. 참고 참고는 발생할 수 있는 상황에 대처하는 방법을 알려 주거나 다른 기능과 함께 작동하는 방법에 대한 요령을 제공합니다. 상표 Brother 로고는 Brother Industries, Ltd.의 등록 상

박 성 배 국가기록원 공업연구사 첨단서고 건립의 필요성 중앙행정기관을 비롯한 각급 공공기관의 의사결정 과 정과 정책시행에 관련된 국가의 주요 기록을 온전히 후세에 전승하기 위한 기록물 보존공간의 확보는 매우 중요한 요소 중 하나이다. 1999년 제정되어 2000년 발효

2/21

untitled

슬라이드 1

초보자를 위한 분산 캐시 활용 전략

Tablespace On-Offline 테이블스페이스 온라인/오프라인

KARAAUTO_4¿ù.qxd-ÀÌÆå.ps, page Normalize

SIGIL 완벽입문

1. 파일 명명규칙

들어가는글 2012년 IT 분야에서최고의관심사는아마도빅데이터일것이다. 관계형데이터진영을대표하는오라클은 2011년 10월개최된 오라클오픈월드 2011 에서오라클빅데이터어플라이언스 (Oracle Big Data Appliance, 이하 BDA) 를출시한다고발표하였다. 이와

Cloud Friendly System Architecture

DBMS & SQL Server Installation Database Laboratory

출원국 권 리 구 분 상 태 권리번호 KR 특허 등록

<464B4949B8AEC6F7C6AE2DC0AFBAF1C4F5C5CDBDBABBEABEF7C8AD28C3D6C1BE5FBCD5BFACB1B8BFF8BCF6C1A4292E687770>

aws

<4D F736F F F696E74202D203137C0E55FBFACBDC0B9AEC1A6BCD6B7E7BCC72E707074>

Windows 10 General Announcement v1.0-KO

MySQL-.. 1

Monitoring Report _SSD 시장동향.hwp

슬라이드 1

Cover Story 빅데이터플랫폼 Big Data 시대의엔터프라이즈인프라스트럭처 ORACLE KOREA MAGAZINE Spring 개요빅데이터를처리하는기술의가장중심기술은아파치하둡기술일것이다. 하둡기술은데이터를취득하고이를구조화시키고분석을하는일련의과정에

Open Cloud Engine Open Source Big Data Platform Flamingo Project Open Cloud Engine Flamingo Project Leader 김병곤

소규모 비즈니스를 위한 플레이북 여기서 다룰 내용은 다음과 같습니다. 1. YouTube 소개 2. YouTube에서 비즈니스를 위한 채널 만들기 3. 눈길을 끄는 동영상 만들기 4. 고객의 액션 유도하기 5. 비즈니스에 중요한 잠재고객에게 더 많이 도달하기

160322_ADOP 상품 소개서_1.0

ThinkVantage Fingerprint Software

untitled

Global Bigdata 사용 현황 및 향후 활용 전망 빅데이터 미도입 이유 필요성 못느낌, 분석 가치 판단 불가 향후 투자를 집중할 분야는 보안 모니터링 분야 와 자동화 시스템 분야 빅데이터의 핵심 가치 - 트랜드 예측 과 제품 개선 도움 빅데이터 운영 애로 사항

RHEV 2.2 인증서 만료 확인 및 갱신

consulting

*2008년1월호진짜

wtu05_ÃÖÁ¾

슬라이드 1

항목

<C3E6B3B2B1B3C0B C8A32DC5BEC0E7BFEB28C0DBB0D4292D332E706466>

<B1DDC0B6C1A4BAB8C8ADC1D6BFE4B5BFC7E C8A3292E687770>

경제관련 주요 법률 제,개정의 쟁점 분석.doc


이도경, 최덕재 Dokyeong Lee, Deokjai Choi 1. 서론

목 차 1. 출장개요 03 가. 출장계획 03 나. 출장자별분장 05 다. 방문기관정보 06 라. 면담및견학일정 07 마. 면담자기념품 출장일정 09 가. 요약 09 나. 상세 출장보고 16 가. Vancouver Public Library, Ce

졸업작품중간보고서 - 구글 MapReduce 를이용한클라우드컴퓨팅 조중연 서종덕 지도교수님진현욱교수님 ( 인 )

Microsoft PowerPoint - 3장-MS SQL Server.ppt [호환 모드]

<C0CCBCF8BFE42DB1B3C1A4BFCFB7E12DB1E8B9CCBCB12DC0DBBCBAC0DAB0CBC1F5BFCFB7E12DB8D3B8AEB8BBB3BBBACEC0DAB0CBC1F52E687770>

춤추는시민을기록하다_최종본 웹용

- 2 -

[Brochure] KOR_TunA

Basic Template

Office 365, FastTrack 4 FastTrack. Tony Striefel FastTrack FastTrack

슬라이드 제목 없음

ActFax 4.31 Local Privilege Escalation Exploit

SQL Developer Connect to TimesTen 유니원아이앤씨 DB 기술지원팀 2010 년 07 월 28 일 문서정보 프로젝트명 SQL Developer Connect to TimesTen 서브시스템명 버전 1.0 문서명 작성일 작성자

Slide 1

ICT EXPERT INTERVIEW ITS/ ICT? 차량과 인프라 간 통신(V2I) Nomadic 단말 통신(V2P) 차량 간 통신(V2V) IVN IVN [ 1] ITS/ ICT TTA Journal Vol.160 l 9

IPAK 윤리강령 나는 _ 한국IT전문가협회 회원으로서 긍지와 보람을 느끼며 정보시스템 활용하 자. 나는 _동료, 단체 및 국가 나아가 인류사회에 대하여 철저한 책임 의식을 가진 다. 나는 _ 활용자에 대하여 그 편익을 증진시키는데 최선을 다한다. 나는 _ 동료에 대해


56 심층분석 행정정보시스템데이터세트의이해와기록관리고려사항 글. 이규철 ( 충남대학교컴퓨터공학과교수 ) 1 서론각급행정기관에서는전자정부법에의거행정업무의전자적처리원칙에따라행정핵심기반의주요업무를전자적으로생산 관리하기위해다양한행정정보시스템을구축하여운영하고있다. 이러한행정정보

Microsoft Word - src.doc

<B5F0C1F6C5D0C8ADC1F6C4A72E687770>

공개 SW 기술지원센터

À©µµ¿ì7 Ãâ½Ã, ±×·¡ÇÈÄ«µå¿Í SSD ±¸¸Å ºÕÀ¸·Î À̾îÁö³ª?<iframe src= w


H3250_Wi-Fi_E.book

<49534F C0CEC1F520BBE7C8C4BDC9BBE720C4C1BCB3C6C320B9D D20BDC3BDBAC5DB20B0EDB5B5C8AD20C1A6BEC8BFE4C3BBBCAD2E687770>

U.Tu System Application DW Service AGENDA 1. 개요 4. 솔루션 모음 1.1. 제안의 배경 및 목적 4.1. 고객정의 DW구축에 필요한 메타정보 생성 1.2. 제품 개요 4.2. 사전 변경 관리 1.3. 제품 특장점 4.3. 부품화형

Microsoft PowerPoint - chap11-포인터의활용.pptx

Spotlight on Oracle V10.x 트라이얼프로그램설치가이드 DELL SOFTWARE KOREA

연구노트

Microsoft Word - 조병호


1,000 AP 20,000 ZoneDirector IT 5, WLAN. ZoneFlex AP ZoneDirector. WLAN. WLAN AP,,,,,,., Wi-Fi. AP. PSK PC. VLAN WLAN.. ZoneDirector 5000 WLAN L

목차 목차 시스템요구사항... 3 하드웨어최저사양... 4 운영체제및플랫폼 릴리스정보 의새로운기능 변경사항 패키지 다운로드... 14

PowerPoint Presentation

Microsoft Word - Korean_뷰어 메뉴얼_공용_ADVR&SWi_.doc

비식별화 기술 활용 안내서-최종수정.indd

<4D F736F F D C3DFB0E820BFECBCF6B9DFC7A5B3EDB9AE2920C4C4C7BBC6C3C0C720BDC7C1A620B9D720B7B9C5CD2D496E2D53746F F E67C0BB20C0A7C7D BCD2C7C1C6AEBFFEBEEE20C7C3B7A7C6FB20BDC3B9C4B7B

(72) 발명자 최종무 경기도 용인시 수지구 죽전동 단국대학교 컴퓨터학 과 김은삼 서울시 마포구 상수동 72-1 홍익대학교 컴퓨터공학 과 T동708호 현철승 서울시 동대문구 전농동 90 서울시립대학교 공과대 학 컴퓨터과학부 오용석 경기도 과천시 과천동

5월전체 :7 PM 페이지14 NO.3 Acrobat PDFWriter 제 40회 발명의날 기념식 격려사 존경하는 발명인 여러분! 연구개발의 효율성을 높이고 중복투자도 방지할 것입니다. 우리는 지금 거센 도전에 직면해 있습니다. 뿐만 아니라 전국 26

PowerPoint 프레젠테이션

소프트웨어 정의 스토리지

2002 KT

<4D F736F F F696E74202D E DB0FCB0E820BBE7BBF3BFA120C0C7C7D120B0FCB0E820B5A5C0CCC5CDBAA3C0CCBDBA20BCB3B0E8>

Microsoft PowerPoint - 02_Linux_Fedora_Core_8_Vmware_Installation [호환 모드]

3 장. 데이터와경영정보시스템

Transcription:

대량기록물의 효율적인 처리를 위한 Database 관리방안 연구 2011.10.08 서강대학교 컴퓨터공학과 이대욱

목 차 1. 연구범위 및 내용 2. 대량기록물의 효율적인 처리를 위한 Database 구조연구 기록관리 서브시스템별 특징,기능 및 DBMS 역할 입수단 / 보존단 / 제공단 3. 인프라 변화에 대응한 Database 관리 방안 연구 대용량데이터처리기술 / 분산보존기술 / 클라우드컴퓨팅 / 저장매체 기술 4. 국산 DBMS의 벤치마크 Page 2

1. 연구범위 및 내용 대량기록물의 효율적 처리를 위한 Database 구조연구 관리대상 기록물 현황조사 중앙기록물관리시스템(CAMS)의 데이터베이스 현황 분석 대량데이터 처리를 위한 데이터베이스 사례분석 대량기록물 처리를 위한 데이터베이스 구조 분석 대량기록물 처리를 위한 기능요건 분석 데이터베이스 구조요건 및 관련기술 종합정리 인프라 변화에 대응한 Database 관리방안 연구 대용량 처리 기술 최신동향 조사 및 분석 분산 보존기술 최신동향 조사 및 분석 클라우드 최신동향 조사 및 분석 저장매체기술 최신동향 조사 및 분석 분석결과 종합 및 시사점 도출 기록물 생애주기 관리 자동화 처리를 위한 데이터베이스 스키마 개발 기록물 생애주기 정의와 관리단계 분석 생애주기에 따른 관리 자동화 대상 선정 및 데이터 베이스 요건 도출 데이터베이스 스키마 개발 대상 및 범위 선정 스키마 개발계획 수립 입수단, 보존단, 제공단 데이터베이스 스키마 개발 국산 DBMS의 벤치마크 기록관리시스템에서의 DBMS 현황조사 기록관리시스템의 서브시스템별 구성요소 및 DBMS의 역할과 특징 DBMS 기술종속성 문제의 검토 주요 DBMS의 조사 및 분석 국산 DBMS 채택의 장단점 검토 Page 3

2. 대량기록물의 효율적 처리를 위한 Database 구조연구 기록관리 서브시스템별 특징,기능 및 DBMS 역할 입수단 다양한 기록의 출처시스템이 연동될 수 있음 다양한 포맷의 SIP가 입수될 수 있 음.(NEO포맷, 생산 당시 전자문서) 다종다양한 상태의 메타데이터 종류와 분류정보 이기종 데이터베이스 관리시스템과 쉬 운 연동 입수 기록물 검정을 위한 임시 데이터 베이스 생성의 용이성 이관 시점에 대량의 기록물을 단시간 에 처리 능력 기록물 검정 규칙에 따른 속도감 있는 검증 수행능력(트리거) 단위 처리시간(response time)도 중요 하지만 높은 자료처리량(throughput) 이 요구됨 한번씩 몰리는(bursty) 데이터를 효율 적으로 처리할 수 있어야 보존단 안정적으로 보존하는 것이 가장 중요 한 기능 대용량의 기록물에 대한 저장과 보존 조치가 가능해야 함 백업 및 복구기능 장기보존에 대한 신뢰성 장기보존의 특성에 따른 DBMS에 대 한 지속적인 기술지원 가능성 및 대안 백업 및 복구와 관련된 DMBS에 대한 기술지원 가능성 및 대안 기록정보가 저장된 데이터베이스의 포 맷이 모두 공개되거나 최소한 기록물 관리기관에 포맷이 등록되어 있어야 함 Large Object관리 기능 및 XML 처리 기능 제공단 다양한 기록물의 서비스 모듈과 연동 될 수 있음(기록포탈, 홈페이지, 정보 공개시스템 등) 기록물 사용자 집단이 탐색에 필요로 하는 메타데이터를 유지하되 보존단 메타데이터와 동기화 필요(NEO 포맷 그대로 or 발췌사본) 기록물의 유형(텍스트, 이미지, 비디오, 오디오 등)별로 DIP작성을 원활하게 수행할 수 있어야 함 검색 결과나 발췌 사본인 DIP를 저장 할 수 있는 별도의 저장소 필요 동시 접속자 수가 많은 상황에서 빠른 처리 성능 빠른 처리시간(response time) 보존단으로부터 데이터 이관작업 중에 도 빠른 검색 처리 성능 별도 검색엔진 도입에 대한 고려 Page 4

2. 대량기록물의 효율적 처리를 위한 Database 구조연구 대용량기록물 처리 단계별 데이터베이스 구조 입수단 데이터베이스 구조 단일 서버로 구성하고 여러 입수처리시스템에서 동시 접속 데이터베이스 관리 스토리지 크기(테이블스페이스 크기) 추산 : 하루평균 입수 메타데이터 수 * 입수데이터의 평 균 유지기간(일) * 메타데이터 레코드의 평균크기 입수단 데이터베이스는 메타데이터가 일괄 저장 및 삭 제되는 특성이 있음. 따라서 데이터베이스 시스템의 물 리적인 블록크기를 크게 설정하여 데이터처리 효율을 높이는 것이 바람직함. 입수처리 시스템별로 메타데이터 저장을 위한 테이블 생성 - 각 입수처리 시스템별로 생성된 메타데이터 테이블들 을 하나의 통합뷰로 묶음. - 다른 시스템 처리 레코드에 영향을 주지 않고 입수처 리 시스템별로 독립적으로 관리할 수 있음. 또한 보존 단 이관 후 메타데이터 정리가 쉬움 입수처리 완료하여 보존단 이관 후 데이터베이스 저장 소(테이블스페이스) 및 전자파일 저장 스토리지에 대한 정리 필요(다음 입수처리에서 재사용) - 관리자의 수작업 혹은 자동화 처리 입수단 이관XML 입수파일저장 각급 국가기관 Online/Offline 보존단 보존단 이관 메타데이터 NEO 포맷 NEO 추출 데이터베이스 시스템 메타데이터 품질검사(포맷검사,MD검증) 품질검사 결과에 따라 NEO 재생성 가능 디지털컴퍼넌트 격리검사 격리검사 완료 Page 5

2. 대량기록물의 효율적 처리를 위한 Database 구조연구 대용량기록물 처리 단계별 데이터베이스 구조 보존단 데이터베이스 구조 분산데이터베이스 구축 - 하나의 메인 데이터베이스 시스템+다수의 기록물 유 형별 데이터베이스 시스템(전자문서,시청각,데이터셋, 웹기록 등) - 메인 데이터베이스 시스템은 기록물 유형에 상관없는 공통의 메타데이터 관리 - 기록물 유형별 상이한 메타데이터는 각 유형별 데이 터베이스 시스템에서 관리 - 영구보존 특성에 의한 대용량 메타데이터를 기록물 유형별로 나누어 분산화함으로써 처리의 효율성 - 일반적으로 기록물 유형별로 이루어지는 각종 업무들 에 유연한 대처가 가능 미러링 및 복본저장을 통한 재난,재해 등에 대비한 백업 시스템 구축 1단계 : 기존 상용 RDBMS가 지원하는 방식 이용(일반 적으로 dblink 방식) 2단계 : 전문 분산데이터베이스 이용(기술성숙도, 안정 성 등의 면에서 현재로서는 국가기록원에서 사용하기 적합하지 않음, 향후 클라우드 구축과 연계가능) 국산 DBMS 채택 고려 입수단 AIP 이관 입수단 시스템 Mirroring 성남분원 보존단 분산 데이터베이스 구성 대전본원 대전본원 성남 부산 복본저장소 기록물 유형별 서브시스템 - 전자문서 서브시스템 - 시청각 기록물 서브시스템 - 웹 기록물 서브시스템 - 데이터셋 서브시스템 Page 6

2. 대량기록물의 효율적 처리를 위한 Database 구조연구 대용량기록물 처리 단계별 데이터베이스 구조 제공단 데이터베이스 구조 보존단 제공단 메인메모리 DBMS에 대한 고려 - 최근 많은 DBMS들이 MMDBMS를 지원/지원 예정, 특히 국산 DBMS 알티베이스는 MMDBMS를 주요 특징으로 하고 있음. - 사용자 검색결과에 따라 관련 데이터를 미리 디스크 에서 메인메모리로 이동시키는 방식 고려할 수 있음. 스토리지용 디스크로 SSD 채택 필요 - 기존 하드디스크 대비 빠른 접근 속도 및 안정성 - 검색 및 블라우징 등 읽기 접근이 많은 특성에 유리 검색엔진 사용에 대한 고려 - 대량의 도서정보 메타데이터를 저장한 후 검색,대출 등의 서비스를 하고 있는 전자도서관 패키지에서 활 발하게 도입되어 사용 중 - 기존 데이터베이스 시스템에 부하를 주지 않으면서 전문 검색엔진의 도입으로 서비스 검색 속도 향상 DIP 이관 데이터저장소 DI저장소 DIP 저장소 검색엔진 웹 서버 인터넷 웹 서버 사용자 Page 7

3. 인프라 변화에 대응한 Database 관리 방안 연구 대용량 데이터 처리 기술 대용량 데이터 (Big data 혹은 Large-scale data) 일반적인 데이터베이스 관리 기술로는 허용할 수 있 는 시간 내에 다루고 처리하기 어려울 만큼 그 크기 가 큰 데이터 대용량 데이터 처리 기술이란 대용량 데이터들을 효 과적으로 다룰 수 있게 해주는 방법론 MapReduce의 등장 Google에서 정보 검색을 위한 데이터 가공(인덱스 추출, 정렬 및 역 인덱스 생성 등)을 목적으로 개발 된 분산 환경에서의 병렬 데이터 처리 기법 데이터 분산, 병렬화, 로드 밸런싱, 내결함성(Fault tolerance) 등을 처리해주는 MapReduce 라이브러 리로 구성 기존 RDBMS의 변화 기존의 강점인 수 십 년간 축적된 관계형 데이터베 이스 관리 기술로 RDBMS의 한계를 극복 RDBMS도 병렬, 분산 구조의 시스템으로의 전환 하이브리드형 DB 시스템 : 정렬, Join 연산이 필요한 부분만 메타데이터로 만들어서 처리, 다른 것들은 MapReduce 방식의 key-value DB 엔진으로 처리 주요연구분야 대형 병렬 처리(MPP : Massively Parallel Processing) 데이터 마이닝(Data Mining) 분산 파일 시스템(Distributed File System) 분산 데이터베이스(Distributed Database) 클라우드 컴퓨팅(Cloud Computing) 적용방안 검토 대용량 처리기술의 적용 대상이 되는 국가기록원 업무 - 입수단의 대규모 입수처리 업무 - 서브시스템간 대규모 이관작업 - 보존단에서의 주기적인 대규모 포맷컨버젼, 마이 그레이션 업무 동일/비슷한 업무의 대량처리 작업시 유리한 MapReduce 방식의 적용에 대한 검토 - 상단 국가기록원 업무의 특성과 유사 - 기술 성숙성 측면에서 아직 적용하기 힘듬. 지속 적인 기술변화 추이의 관찰이 필요 병렬/분산 데이터베이스에 대한 적용이 우선 필요 Page 8

3. 인프라 변화에 대응한 Database 관리 방안 연구 분산보존 기술 기술개요 대용량의 데이터를 일반적인 데이터베이스 시스템 으로 구축할 경우 확장성을 보장 받기 어려움 시스템의 구성이 복잡하여 구축 및 유지보수 비용이 증가 대용량의 데이터를 처리하기 위한 분산보존 기술에 대한 연구가 활발하게 진행 적용방안 검토 입수단의 경우 메타데이터 및 전자파일들이 단기간 에 대용량으로 입수됨으로 데이터베이스 및 스토리 지를 여러시스템으로 분할하여 병렬처리하는 방식 을 고려해야 됨. 보존단의 경우 메타데이터 및 전자파일들이 삭제되 지 않고 영구 보존되면서 지속적으로 증가됨으로 메 타데이터의 분산저장을 위한 분산데이터베이스, 전 자파일의 분산 저장을 위한 분산파일시스템의 적용 이 필요함. 주요연구분야 분산 파일 시스템(Distributed File System) 분산 데이터베이스(Distributed Database) 분산 데이터베이스 데이터가 여러 DBMS에 의해서 관리되는 다양한 데 이터베이스에 분산 다양한 종류의 기기 또는 운영체제에서 지원 네트워크에 의해 함께 연결되어 있음 모든 데이터가 마치 하나의 데이터베이스 관리 시스 템에 의해 관리되는 것처럼 운용되는 시스템 구글 Bigtable, 아파치 HBase, Hypertable 등 분산 파일 처리 기술 물리적으로 서로 다른 컴퓨터 혹은 시스템에 네트워 크로 연결이 되어 분산되어 저장되어 있는 파일들을 사용자가 쉽게 사용하고 관리할 수 있게 필요한 기 능들을 제공하는 시스템 Google File System(GFS), Hadoop Distributed File System(HDFS), Amazon S3 File System 등 Page 9

3. 인프라 변화에 대응한 Database 관리 방안 연구 클라우드 컴퓨팅 기술 기술개요 그리드 컴퓨팅 및 유틸리티 컴퓨팅 기술개념을 포괄 하면서 진화 인터넷을 활용하여 IT 자원을 서비스의 형태로 제공 서비스 제공자와의 최소한의 상호작용과 관리만을 가지고 자원의 할당이나 반환이 가능한 On- Demand 네트워크 엑세스를 위한 서비스 환경 핵심 기술 가상화 기술 대규모 분산 처리기술 서비스 프로비저닝 기술 오픈 인터페이스 기술 보안 및 개인정보 관리 기술 자원 유틸리티 기술 등 국내외 시장 및 기술동향 인터넷 기업과 이동통신 사업자를 중심으로 형성되 고 있음(NHN, 다음, KT, LG U+,, 삼성,LG 등) 주로 온라인 스토리지 및 동기화 기능이나 N스크린 과 같은 서비스 영역을 중심으로 하는 개인 클라우 드 서비스에 집중되고 있음. 적용방안 검토 현재 기술 초기단계로 표준화도 아직 이루어지지 않 은 상태임. 국가기록원은 정부기관으로 보안 문제로 외부 클라 우드 서비스의 이용은 불가함. 향후 국가기록원이 운영하고 여러 국가기관들이 이 용자가 되는 내부 클라우드에 대해 고려해 볼 만함. 국가기록원에서 구축 운영중인 많은 개별 시스템들 을 통합하는 방안으로 고려할 수 있음(2020년 대비) Page 10

3. 인프라 변화에 대응한 Database 관리 방안 연구 저장매체 기술 기술개요 지속적으로 증가하는 대용량 데이터의 저장/관리를 위해 저장매체의 선택이 중요 저장매체는 기존기술도 하루가 다르게 발전하고 새 로운 기술도 끊임없이 생겨나고 있어 그 추세에 따 른 적용이 필수적임. 주요 저장매체 기술 하드디스크 기반 스토리지 기술 플래시 메모리 기반 스토리지 기술(최근 SSD의 기 반기술) 상변화 메모리 기반 스토리지 기술 분산 파일 처리 기술 물리적으로 서로 다른 컴퓨터 혹은 시스템에 네트워 크로 연결이 되어 분산되어 저장되어 있는 파일들을 사용자가 쉽게 사용하고 관리할 수 있게 필요한 기 능들을 제공하는 시스템 Google File System(GFS), Hadoop Distributed File System(HDFS), Amazon S3 File System 등 기술 검토 내용 대용량 데이터의 처리 단계별로 볼 때 보존단, 제공 단은 데이터의 쓰기연산 대비 읽기 연산이 많으며 이는 상대적으로 쓰기대비 읽기 성능이 뛰어난 SSD 의 특성과 일치함. 현재 HDD 대비 SSD의 가격이 높으나 변화추세로 보면 가까운 미래에 SSD가 HDD를 대체할 것으로 예상됨. 상변화 메모리 기반 스토리지 등 SSD 이후의 저장 매체 기술에 대해 지속적인 기술 검토가 필요함. Page 11

4. 국산 DBMS 벤치 마크 DBMS 기술종속성의 문제성 검토 기술개요 기록관리에 있어서 기술적인 문제를 DBMS 제품에 의존하는 문제 대두 장기보존의 특징으로 인해 미래에 꾸준한 기술지원 가능성에 대한 고려필요 외산 DBMS에 대비 국산DBMS의 기술성 검토 주요 DBMS 외산DBMS: 오라클, MS SQL, IBM DB2 국산DBMS: 알티베이스, 큐브리드, 티베로 주요 비교대상 포인트 데이터타입별 인코딩 방식 차이 조사 DB Block 등 저장구조 차이 조사 백업 및 복구 방식의 차이 조사 국산DBMS의 벤치마크 조사 및 분석 국내외 DBMS의 기능/특징 비교 시사점 도출 국산DBMS 채택을 고려해 볼 가치가 있음 O 국가기록원에서 필요한 국산DBMS의 성능적 측면 O 국가기록원 요구사항에 맞는 DBMS 개발가능성 O 단순 유지보수 이상의 기술협력, 기술이전 가능성 O 외산 DBMS에 대한 기술 종속성 탈피 Page 12