56 연구동향 2017 년기록관리연구개발사업자체연구결과 디지털포렌식기반시청각기록포맷변환절차및장기보존포맷연구 Trend of Research 2 성기범 국가기록원공업연구사 0100110000111011010101 0100110000111011010101
National Archives of Korea 기록인 2018 SPRING + Vol. 42 57 머리말 최근국가기록원에서주요한연구과제로추진되었던 차세대기록관리모델재설계 에서는신유형전자기록보존포맷기술, 생산포맷, 보존포맷, 장기보존포맷구분및현행 NEO 패키지의비효율성해결방안을모색해야함을언급하였다. 이와함께차세대장기보존포맷필요성을제기하였다. 그동안장기보존포맷관련하여국가기록원은각각의기록물유형 ( 데이터세트, 웹데이터등 ) 에대한장기보존패키징관련연구를진행한바있다. 이와관련된연구로서본고는 디지털포렌식기반디지털시청각기록물포맷변환절차및장기보존포맷연구 에서연구된내용을기반으로디지털시청각기록물에대한장기보존포맷을중점적으로소개하고자한다. 현행 NEO 구조의장기보존포맷은구조적인특성상대용량속성을가진디지털시청각기록물적용에한계가있음을부인할수없다. 이번연구를통해대용량시청각기록물의장기보존포맷을재설계하였고, 또한디지털포렌식기법을반영하여현재시청각기록물 ( 영화필름, 비디오테이프등 ) 의수집및디지털화과정에서제기되는신뢰성및원본과보존본의진본성에대한논란소지를줄이고자하였다. 그림 1 디지털포렌식 (Digital Forensic) 이란? 현재디지털포렌식에대한용어정의가하나의명확한개념으로일원화되어있지는않다. 보통학계에서는 컴퓨터, 또는기타디지털저장매체에남아있는디지털증거를법적증거력을갖도록논리적이며표준화된절차와방법을통해수집, 보관, 분석및보고하는과정 으로설명하고있고, 대검찰청디지털증거수집및분석규정 은 디지털증거를수집 분석또는보관하거나현출하는데필요한기술또는절차 로정의하는등디지털포렌식을활용하는주체에따라약간의개념차가있다. 전통적인포렌식 ( 유전자감식, 법생물학등 ) 에서컴퓨터분야로파생된법 과학 (Forensic Science) 의한종류로서, 현재범죄수사와관련된조직뿐만아니라디지털정보의신뢰성, 무결성을필요로하는다양한조직에서응용 활용되고있다. 이미지출처다음백과 (http://100. daum.net/encyclopedia/view/ 47XXXXXd1209)
58 연구동향 전자문서용장기보존포맷 NEO, 그럼시청각기록물은? 원본전자문서 Base64 코드변환후삽입 그림 2 NEO 포맷구조 보존포맷변환본 (PDF-A) 현재각기관에서국가기록원으로이관되는영구보존대상전자문서파일은장기보존포맷으로변환후, 이관되어보존관리된다. 필자는이전에근무하던기관에서국가기록원에보존중인전자문서 ( 장기보존포맷 ) 를분석하여수집해야하는상황이있었다. 그때처음접했던 NEO 파일에대한느낌은 다양한메타정보를 XML 형태로잘표현하고있으며, 원본과보존포맷기록물파일이심플한단일파일객체로잘패키징된구조다 라는생각이들었다. 다만전자문서만한정해서 NEO 포맷형태로반영했다는전제로써만이다. 디지털파일을다른포맷으로변환및복원수행과정에많은자원이필요하다. 디지털로생산되는대용량시청각기록물을 NEO 포맷구조의형태로변환하여보존하고운영하기에는분명한문제가존재한다. 다시말해서 base64 코드 1) 변환을통한 XML파일로단일객체화는용량이큰파일의경우변환과정때문에효율성이낮아져활용과정에서많은제약이발생한다. 따라서전자문서외의전자기록물에대해서는해당기록물의특성에부합한형태의장기보존포맷유형을새로정의할필요가있다. 물론필자는전자문서를위한 NEO포맷활용에대해서는여전히긍정적이다. 아래표를통해전자문서용장기보존포맷 NEO, 현행시청각기록물아카이빙포맷및향 후적용될시청각기록장기보존패키지포맷의특징을비교해보았다. 1) 임의의바이트스트림을화면에표시할수있는아스키 (ASCII) 문자들로바꾸는인코딩방식
날로그기록물Tape 백업아디지털기록물National Archives of Korea 기록인 2018 SPRING + Vol. 42 59 주요내용 장기보존포맷 NEO 포맷 현행시청각기록아카이빙포맷 제안된패키지포맷 아카이빙대상 전자문서 시청각기록물 시청각기록물 패키지구성방식 ( 객체 ) 단일객체 단일객체 다중객체 변환작업 base64 코드변환필요 없음 없음 메타항목 200여개이상 20여개 200개이상 기록물확인방법 별도뷰어필요 뷰어불필요 뷰어불필요 메타정보표현 XML 파일구조 TXT 파일구조 XML 파일구조 아카이빙단위 파일 파일 폴더 표 1 장기보존포맷종류별특징 전자서명공인인증서미적용해시값인증 관련규정및표준공공표준 - 표준화추진중 시청각기록물의포맷변환 시청각기록물은두가지형태로수집된다. 첫번째는영화필름, 오디오 비디오테이프, 사진필름등의아날로그매체에수록된기록물이다. 두번째는디지털로생산 (borndigital) 되어전자매체에수록되어이관되는디지털시청각기록물이다. 영화필름, 오디오 비디오테이프등의필름매체는장기간보관시산화가진행되면서기록매체로서기능을상실하는문제가발생된다. 따라서디지털변환을통해전자기록물형태로보존본 2) 을생성하여아카이빙을진행한다. 수집단계변환단계보존단계 Analog-Media 원본 보존본 Tape 백업 MKV Movie Film Photography 디지털화... 메타정보 보존본 + 메타정보 & Film 생성일자 Audio & Video tape 생성자해쉬값... Born-Digital 원본 보존본 MKV 파일 포맷변환 메타정보 원본 + 보존본 + 메타정보 생성일자 그림 3 생성자해쉬값 시청각기록물수집, 포맷변환과정... 2) 원본의보존포맷변환본 으로써보존포맷 PDF-A 에대응되는시청각기록물의장기보존용변환파일이다. 국가기록원은현재영상 -MKV, 사진 -TIFF, 음성 -FLAC 포맷으로변환하여아카이빙하고있다.
60 연구동향 위 < 그림 3> 은수집된원본종류에따른기록물의디지털화및포맷변환과아카이빙과 정을보여주고있다. 이런과정에서생성되는메타정보는해당기록물의무결성을보증 하는근거자료로서중요하게취급되어야한다. 디지털포렌식기반수집절차 기록물은법정에서직접활용될수도있어서무결성을요하는중요한기록물인경우증거능력확보수준의보존 관리가필요하다. 법정증거능력확보를위해서는원본동일성, 무결성, 보관연속성, 신뢰성, 적법성을충족시켜야한다. 디지털포렌식의일반적인절차는수집, 분석, 보고서작성, 법정제출로구분되어있다. 여러절차중에서도신뢰성유지에가장중요시되는단계는수집단계이다. 수집과정에대한적법한절차를거치고, 수집된증거물은신뢰성을확보하면서각단계를진행하되, 최종법정제출까지변화가없다는것이입증되어야만한다. 디지털포렌식은최초수집당시증거물의해시값을산출하고, 인수자와인계자가산출된해시값에대해각각의본인서명으로해당증거가적법하게수집되었음을상호인증한다. 이후진행되는단계에서도현재의해시값과초기해시값을비교하여변경또는위 변조가되었는지를확인하여무결성을판단한다. 이와같이수집단계에서법정제출까지모든과정에대해위 변조가없었음이증명되고, 모든과정을기록함으로써보관의연속성 3) (Chain of Custody) 을유지해야한다. 본고는전자기록물인수 인계절차를다음과같이정의하였다. 이관대상매체확인단계본단계는이관대상인전자매체관련정보를수기로작성하는단계다. 전자기록물목록파일 ( 이하인수목록 ) 에인계하고자하는저장매체의종류와수량등을기입하고상호서명한다. 기록물인수단계 실제기록물을인수받는과정으로인수인계확인서에이관수행과정에대한행위정보, 관 3) 증거가생겨난이래그것을보관한주체들의연속적승계및관리의단절이있었음을판단하는것으로기록의진본성을판정하는중요한기준, 출처 : 위키백과
National Archives of Korea 기록인 2018 SPRING + Vol. 42 61 이관대상매체확인단계 기록물인수단계 기록물 ( 전자매체 ) 포렌식이관도구 확인서작성및서명단계 인계자 ❷ 기록물인계 인수자 ❺ 관련문서생성 인계자 인수자 ❶ ❹ 수량확인 작성 ❸ 인수 인계확인서 파일목록 ❻ 서명 서명 그림 4 디지털포렌식기반전자기록물인수 인계절차 기록물 ( 전자매체 ) CD USB 하드디스크 스토리지 기타 매체목록서 인수 인계확인서기본정보생성 - 이관대상기관 - 이관시간및장소 - 인수자정보시스템정보생성 - 운영체제정보 - 네트워크정보 - 시스템정보이미지정보생성 - 매체이미징시간 - 이미지파일해시값 - 목록파일해시값 목록정보파일 해시값 해시값 인수 인계확인서 기록물등록단계 CAMS-MAM 기록관리시스템등록 련담당자, 이관작업을수행하는시스템환경정보, 실제이관되는기록물파일목록등을 기입된인수인계확인서와, 실제이관된기록물목록파일을이관도구를통해생산한다. 목록파일은기록물에대한해시값이기록되어있어야한다. 확인서작성및서명단계 인수인계확인서에이관당사자간검증및서명을통해상호인증과정을진행한다. 디지털시청각기록물장기보존포맷 다음의 5가지사항을고려하고디지털시청각기록물특성을반영한최적화된장기보존포맷 ( 패키지 ) 설계를진행하였다. ➀ 유연성 보존처리가완료된장기보존대상의기록물에대하여추가 수정 삭제등의기록관리업무를수행함에있어용이성을확보해야한다. ➁ 효율성 장기보존을위한작업의소요시간및시스템자원활용방법등을고려해야한다. ➂ 관리편의성 - 대용량특성을갖는디지털시청각기록물의장기보존포맷변환절차와사후관리등에편의성이제공되어야한다.
62 연구동향 ➃ 보안성 인가받지않은사용자가기록물에접근하는것을방지하고, 악의적위변조를쉽게탐지할수있어야한다. ➄ 안정성 - 장기보존포맷으로변환한기록물의보존과정에서손실, 오류발생등의위험성을줄일수있어야한다. 장기보존포맷구조 설계된디지털시청각기록물장기보존포맷은폴더를이용한트리구조로설계하였다. 기록 pql o^db 물은압축, 캡슐화와같은단일객체화를이루는부가적인작업없이, 기록물자체를폴더에 저장하는논리적객체화를수행한다. < 그림 5> 의 ➀~➂ 은다음과같은내용을의미한다. ➀ 장기보존폴더포맷은기록물철에부여된고유식별값을폴더명으로생성함으로써다른객체와중복되지않는다. 최상위폴더에해당된다. ➁ 기록물철에대한메타데이터를보유한 XML 파일로, 최상위폴더바로밑에위치한다. ➂ 기록물건에대한폴더로실제기록물파일을저장한다. 기록물건에부여된고유식별값으로폴더를생성하기때문에내부에존재하는타폴더와중복되지않는다. 해당폴더는원본에해당되는이관당시의기록물, 원본으로부터생성된보존목적의보존기록물, 기록물을설명하는기록물건메타데이터로구성된다. 메타파일구조인수 인계과정정보를수용할수있는항목의추가정의뿐만아니라시청각기록물에적합한메타정보와구조를변경하였다. 즉, 이관절차에서생산되는정보를저장할수있도록기록물철의이관메타데이터를새롭게정의했다. 기록물의이관은통상적으로기록물철단위로이루어지지만, 기록물건으로이관이되는경우도발생할수있기때문에해당항목을이중으로기재하여관리한다. 기록물건에는시청각기록관리시스템메타데이터가갖고있는기록물의코덱 (Codec), 포맷 (Format), 버전 (Version) 등을저장하는기록물파일의속성정보, 보존행위에따른처리행위자, 처리일자, 처리내용, 변경사항등을저장하는이력정보, 해시값정보등이있다. 기록물파일의속성정보는영구보존을위한포맷변환혹은마이그레이션등의보존처리에반드시필요한정보로서자세하게저장될수있도록했다. 기록물의보존처리가수행됨에따라변경되는정보들과해시값은이력관리메타데이터에중복저장하여절차의연속성 (Chain of Custody) 을확보하였다. 전체메타데이터구조는 < 그림 6> 4) 과같다. 4) 전체메타데이터파일구조에대한자세한설명은 17 년국가기록원자체연구 디지털포렌식기반대용량시청각기록포맷변환절차및장기보존포맷연구 보고서참조
National Archives of Korea 기록인 2018 SPRING + Vol. 42 63 메타데이터 XML 장기보존포맷폴더 ❷ ❸ ❶ 기록물철메타데이터 기록물건폴더 원본기록물 보존본기록물 기록물건메타데이터 기록물철메타데이터 이관메타데이터 CAMS 메타데이터 이력관리메타데이터 인수인계대장 전자파일목록 기본이관정보 이관기록물건 리스토어정보 기록물건폴더 아카이브정보 ❸ 원본기록물 보존본기록물 기록물건메타데이터 기록물건메타데이터 이용이력정보관리이력정보 그림 5( 좌 ) 설계된장기보존포맷구조 CAMS 메타데이터 MAM 메타데이터 이력관리메타데이터 그림 6( 우 ) 장기보존포맷주요메타데이터구조 맺음말 리스토어정보보존이력정보아카이브정보이용이력정보관리이력정보 현재기록관리관련기관에서주요하게검토되고있는 BagIt 구조또한본지에서제시하는흐름과비슷하다. 이관과아카이빙을목적으로했을때원본전자기록물을인캡슐레이션과병합을통해하나의객체단위로변형하기보다는원본자체형태를유지하고있다. 또한단순하고쉽게활용할수있는구조로구성하고있다. 그동안전자적으로생성된기록물은전자문서만을위한 NEO 포맷으로대표되어운영이 되어왔다. 다양한유형의기록물에대한현실적인장기보존정책이시급히확정될필요가 있음을본고를통해강조하고싶다. 필자소개 숭실대학교에서컴퓨터학과석사및 IT 정책경영학과박사를졸업하였고, 대검찰청과학수사부에서디지털포렌식연구및디지털수사업무를하였다. 현재전자기록 ( 디지털시청각기록 ) 장기보존포맷및디지털포렌식관련연구를수행하고있다. 본지에서제시하고있는시청각기록물장기보존포맷과관련해서는향후 장기보존포맷프로토타입제작및적용테스트 관련추가연구를통해실용화최종검토를진행할것이다. 제시된장기보존패키징형태는디지털시청각기록물장기보존포맷표준으로제정을추진하고, 국가기록원에서운영하고있는시청각기록물관리시스템 (MAM) 에반영할예정이다.