기록물보존복원제 6 호, PP.41~63 2013 디지털시대국가기록원시청각아카이빙현황과개선에관하여 김상국 * 국가기록원이소장하고있는시청각기록은필름, 테이프매체에수록된형태로부터디지털방식으로생산된 Born-digital 형식의기록까지점차다양해지고있다. 1990년대말부터시청각기록물의전자적관리를위하여디지털변환을하고있으나, 전자문서처럼기록관리의원칙이엄격히지켜지고있다고보이지않는다. 이런배경에는정보자원 ( 시스템 ) 의부족, 당시기술의한계등여러가지이유가있었겠지만, 국가기록원에서시청각기록의전자적관리가시작된 1990년대후반부터약 15년이경과한시점에서여전히기존의형식과방법이유지되고있다는점은짚어보아야할사안이다. 본보고서에서는소장시청각기록의현황과디지털변환에따른방법과형식에어떤문제가있는지를살펴보고, 디지털시대에디지털환경하에서시청각기록관리에필요한개선방안을제시하였다. Ⅰ. 서론 시청각 (Audio-Visual) 은눈으로보고귀로들을수있는형태로활자중심의문서와는또다른표현방식을갖는기록이라할수있다. 시청각기록이라함은영상 ( 동영상이라고도함 ), 음성, 사진을의미하며문서가종이라고하는매체를통해표현되는것과달리, 시청각기록은다양한매체에수록되어표현되는특징을지니고있다. 종이위에표현된활자의역사가수천년을거슬러올라가는데비해, 사진은 1839년프랑스의다게르에의해발명된은판사진 (daguerreotype) 이효시로알려져있고, 음성 (audio) 은 1877년에디슨이만든원통형축음기에서시작되었다는것이정설이다. 영상의역사는 1895년 영화의아버지 라불리는루이뤼미에르에의해발명된시네마토그래프 (cinematograph) 로, 이는움직이는이미지의촬영과대중적상영이라는오늘날영화의개념에부합하는최초의영화였기때문이다. 이렇듯시 청각기록의역사는활자중심의문서에비해턱없이짧은기간이지만, 현대문명의기술발전에힘입어눈부신변화를보여현재로서는그끝이어디까지인가를가늠할수없을만큼진화를거듭하고있는것이현실이다. 국가기록원은 1990년후반부터본격적으로시청각기록물을수집, 관리하기시작하여 2013년현재약 31만점에해당하는영화필름, 영상테이프, 음성테이프, 사진필름, 인화사진등다양한매체에다양한시청각기록물을소장하고있다. 동시에시청각기록의활용을위하여디지털파일로변환을하고있으나, 워낙소장량이방대하여디지털변환량은전체소장량의약 41% 정도에불과하다. 매년미국라스베이거스에서는전세계전자업체들의각종첨단전자제품들이선보이는세계최대의전자제품전시회가열리는데, 2013년 1월개최된 CES(The International Consumer Electronics Show) 2013 에서는 Full HD 고해상도디스플레이보다해상도가 4배높은 800만화소의해상도를 * 국가기록원복원연구과전산사무관 southkang@korea.kr 41
구현하여실사와같은선명한화질을보여주는 85 인치 UHD TV(Ultra High Definition TV) 가국내유수의전자업체들에 의해소개된바있다. 이렇듯신기술전자기기의등장, 영화산업에서의 3D 영상제 작그리고인터넷, 모바일과같은온라인매체의활성화등시 청각기록을둘러싼환경의변화주기는빨라지는반면, 우리는 과거와현재그리고앞으로다가올최신의미래기록을보존하 고활용하여야하는복잡한현실에직면하고있다. 본보고서 에서는아카이빙기관으로서국가기록원이소장, 관리하고있 는시청각기록의현황과문제점을짚어보고, 디지털시대를대 비하는측면에서개선이필요한기술요소 (technical factor) 를 제시하고자한다. Ⅱ. 시청각현황 1. 시청각기록물소장현황 국가기록원은 1950 년대생산된영화필름에서부터최근의고 화질디지털영상파일까지약 31 만권 ( 철 ) 에해당하는시청각 기록물을소장하고있으며, 아날로그와디지털그리고유형매 체와무형매체가공존하고있는그야말로다양하고방대한기 록들로구성되어있다. 표 1. 국가기록원시청각기록물소장현황 (2013 년말기준 ) 전체영화필름비디오오디오사진필름디지털파일 309,683 22,445 22,556 22,137 239,596 2,949 소장량의단위는철 ( 권 ) 기준이며, 사진필름의경우앨범기준으로 1 권의앨범에는적게는수십장에서부터많게는수백장까지의사진 필름기록이정리되어있기때문에이들모두를통계화한다면전체소장량은수백만건으로예측됨. 를불러올수있기때문에, 약 30 만철에해당하는유형매체에 수록된기록물의장기보존대책방안은조만간해결해야할과 제이다. 표 2 는시청각기록이얼마만큼다양한매체에수록되 어있는지를보여준다. 구분 영화필름 비디오 오디오 표 2. 시청각기록물매체종류현황 매체종류 소장량 ( 철 / 권 ) 특징 Original negative 4,554 영화촬영용원본필름 Master positive 712 오리지널원본보호를위한복제필름 Dupe negative 2,933 극장상영용원본 ( 마스터를이용, 복제 ) Release print 3,461 극장상영용사본 ( 듀프를이용, 복제 ) Sound 5,565 영화음성을수록한필름 U-matic tape 183 Betamax tape 139 VHS tape 3,345 8mm tape 289 BetaCAM tape 2,140 DigiBeta tape 1,163 DVCAM tape 41 HDCAM tape 1 Cassette tape 16,037 Open Reel tape 2,430 Audio CD/DVD 3,650 DAT tape 14 1971 년출시된 3/4 ( 테이프폭 ) 아날로그테이프포맷명 : Umatic, UmaticSP 1975 년출시된 1/2 아날로그테이프포맷명 : Betamax ( 또는 Beta) 1976 년출시된 1/2 아날로그테이프포맷명 : VHS, S-VHS 1984 년출시된 8mm 아날로그테이프포맷명 : Video8, Hi8 1984 년출시된 1/2 아날로그테이프포맷명 : Betacam, BetacamSP 1993 년출시된 1/2 디지털테이프포맷명 : Digital Betacam( 또는 DigiBeta) 1995 년출시된 1/4 디지털테이프포맷명 : DVCAM 1997 년출시된 1/2 디지털테이프포맷명 : HDCAM 1960 년대, 아날로그오디오 ( 음악포함 ) 신호를저장할목적으로출시 릴 (reel) 에감겨있는테이프로, 오디오 VTR 데이터보존용으로사용 오디오전용의광디스크데이터수록방식과는차이가있음 오디오를디지털형식으로수록한테이프로 1990 년초반까지많이사용 2. 매체현황 - 시청각기록물은다양한매체에수록되어있다 문서가대부분종이매체에기록된반면, 시청각기록은다양 한형태의매체에수록되어있는것이특징이다. 보존관리측 면에서다양성은장기보존을위한관리의어려움과비용문제 표2에서보여주는종류는국가기록원이소장하고있는매체에국한된것이며, 실제존재하는매체의종류는이보다훨씬더많다. 표2에서언급되지않은사진기록의경우는주로인화사진과필름매체형태로소장되어있다. 매체의종류가다양해진배경에는한정된공간에더많은, 더긴시간의그리고더좋은품질의정보를담기위한요구 42
에따라기술의발전이뒷받침되었기때문이다. 그러나이러한매체들조차컴퓨터산업의등장으로인해점차사라져가고있는추세이다. 2012년 12월 31일, 우리나라의 TV 방송은아날로그시대를마감하고디지털방송체제로전환되었는데, 실은방송국의모든제작, 송출, 편집시스템들은이미몇년전부터테이프를사용하지않는, 소위테이프리스시스템 (Tapeless system) 을도입, 운영하기시작하였다. 테이프라는매체가등장한지불과반세기만에테이프시대의종말을고하고, 디지털이라는전혀다른무형매체의시대가시작된것이다. 기술과산업의발전에힘입어다양한매체의종류가등장하고고품질 고화질의다양한기록을수록하게된것은큰수확이나, 기록관리측면에서다양한매체의장기보존과미래활용을위해서어떻게해야하는지는큰고민거리라하겠다. 3. 재생장비현황 - 영상기록에서재생장비 ( 플레이어 ) 는매우중요하다 시청각기록물중테이프, 필름또는디스크에수록된영상및 음성기록을판독하기위해서는해당매체를재생할수있는전 용재생장비 ( 플레이어 ) 가반드시있어야한다. 특히영상분야 에서사용하는재생장비는특정매체에종속되어있을뿐아니 라, 매체에데이터 ( 기록 ) 를수록한방식 ( 이를 포맷 이라고한다 ) 에따라사용여부가달라질수도있다. 즉동일한매체일지라 도포맷이다른경우, 어떤재생장비에서는재생이불가능하다 는의미이다. 이처럼영상분야에서사용되는재생장비는장비 간호환성문제, 고가의장비가격등에도불구하고매체에수록 된기록을재생하기위해서는없어서는안될필수장비이다. 표 3. 국가기록원보유영상 음성재생장비종류 영상기록재생장비 장비명모델명보유대수도입연도재생포맷 ( 또는매체 ) 텔레시네 NOVA SCNNER 1 2008 년영화필름 BetaCAM player PVW-2650 1 1998 년 BetaCAM SP BetaCAM player PVW-2800 1 1999 년 BetaCAM SP Digital VCR(SD) DVW-M2000 1 6 2004 년 2008 년 DigiBeta, MPEG IMX, BetaCAM SX/SP Digital VCR(HD) HDW-M2000 4 2008 년 HDCAM, DigiBeta, MPEG IMX, BetaCAM/SX/SP DVD Player SV-D597HD 1 2008 년 CD, DVD, VCD VHS Player AG-DS555 1 1998 년 S-VHS, VHS U-matic Player VO-9800 1 1998 년 U-matic, SP U-matic Multi-format VCR NV-W1 1 1999 년 VHS (NTSC, PAL, SECAM 등 ) BetaCAM player UVW-1800 1 2000 년 BetaCAM SP DVCAM player DSR-1600 DSR-2000 1 2 2005 년 2008 년 DV, DVCAM, DVCPRO Video recorder SR-DVM700 3 2008 년 MiniDV, DVD, HDD 음성기록재생장비 Reel tape recorder MX-5050 2 2008 년 1/4 two-track analog recorder Audio recorder 122MKII 2 2008 년 16/24bits digital recorder LP player CS455-1 1 2008 년 Turntable DAT recorder Fostek D-10 1 2008 년 Digital master recorder MiniDisc recorder MD-350 1 2008 년 MiniDisc player/recorder Digital Archiving System DAS series 1 2008 년 DAS-ADC, DAS-4C, MTR-15DAS 43
표 3 은국가기록원이보유한영상및음성재생장비의일부 현황으로 2013 년말현재, 소장매체대부분을재생할수있 을것으로예상하고있다. 예상 이란서고에보관된기록물중 에는언급된장비만으로재생이불가능한매체가있을가능성 이있다는의미이며, 향후수집및이관될시청각기록물중에 도전혀예상치못한매체가있을수있음을부인할수없기때 문이다. 이처럼시청각기록은다양한매체에다양한포맷으로 수록된특징을갖고있어, 보존처리를담당하는부서에서는재 생장비의수급과관리에관심을기울여야한다. 어떤산업이든 지장비의구형화 (obsolescence) 는피할수없는반면, 기록이 수록된매체는그보다더오래유지될가능성이많기때문에 재생장비와매체사이에서생길수있는 시공간의불일치 현 상에대비하기위해서는장비의수명이충분히경과했다하더 라도폐기또는불용처분을해서는안된다. 그럼에도불구하고 시간의흐름은피할수없을것이다. 4. 디지털포맷현황 - 디지털시청각기록의포맷은재생장비종류만큼다양하다 지금까지대부분의시청각기록은촬영과동시에테이프또 는필름등에수록된후컴퓨터에서사용할수있는파일로변 환하는과정을거친반면, 최근에는촬영과동시에디지털파 일형태로생산, 저장되는방식을취하고있다. 소위 Borndigital 방식으로과거처럼테이프또는필름에수록하는것이 아니라컴퓨터에서사용가능한저장매체에직접디지털파일 형식으로저장되는것이다. 이때디지털파일은특정한파일포 맷구조를갖는데, 컴퓨터에서사용하는파일포맷이란정보 ( 데 이터 ) 를파일로저장할때그파일의구조를말하는것으로, 우 리가일상적으로접하는아래아한글포맷 ( 확장자 -hwp), PDF 파일포맷 ( 확장자 -pdf), 그림파일포맷 ( 확장자 -jpg, bmp, gif 등 ), 음성파일포맷 ( 확장자 -mp3, wav, AAC 등 ), 동영상파일 포맷 ( 확장자 -avi, mxf, mp4, mov 등 ) 등, 그수를헤아리기 힘들정도로다양한종류가존재한다. 표 2 의매체종류에서도포맷이언급되는데, 이는테이프에 수록되는데이터의전기적표현방식을의미하는것으로디지 털파일의포맷과는다소차이가있으나, 결론적으로데이터 를저장할때사용되는특정구조라는측면에서는유사한개념 으로이해하여도무방할것이다. 물리적매체를재생하기위하 여해당포맷을해석할수있는특정재생장비 ( 플레이어 ) 가필 요하듯이, 디지털파일에서도특정포맷으로만들어진파일을 읽기위해서는고유의응용소프트웨어가필요하다. 예를들면 hwp 라는파일포맷의전자문서를읽기위해서한글과컴퓨터 사에서만든아래아한글소프트웨어가사용되고, xls 라는확장 자를갖는파일을읽기위해서는마이크로소프트사의엑셀소 프트웨어를사용하여야한다. 그러나디지털시청각 ( 영상, 음 성, 사진 ) 파일의경우는특정응용소프트웨어가여러가지의 파일포맷을동시에지원하는경우가있기때문에전자문서와는 다른차원에서보아야하며, 특히영상이나음성의경우에는 컨테이너포맷 (container format) 과코덱 (codec) 이라고하는 개념을동시에적용하고있기때문에재생을위한응용소프트 웨어선택시에는이를고려하여야한다. 이처럼디지털환경에서만들어진디지털시청각기록의포 맷은종류가다양할뿐만아니라포맷을해석하기위한응용 소프트웨어는물론코덱과같은별도의소프트웨어를필요로 한다. Ⅲ. 디지털환경변화에따른시청각기록관리의고민 현황에서살펴본바와같이, 국가기록원은아날로그매체로 부터최근의디지털파일까지다양한종류의시청각기록물을 소장하고있으며수량또한지속적으로증가하고있다. 이가 운데매체에수록된기록물들은수선, 세척등일련의보존처 리를한후, 디지털파일로변환하여중앙영구기록물관리시스 템 (CAMS) 에저장, 관리되고있는반면최근의시청각기록물 은생산당시부터디지털파일로만들어진후디지털파일자 체로이관되는추세이다. 이렇듯모든시청각기록이서고에보 존되는원본과함께디지털환경에서관리되고있는점을감안 할때, 시청각기록의다양성을반영할수있는디지털환경의 변화에대한대비책이절실한시점이다. 본절에서는변화하는 디지털환경대비국가기록원의현실과이에따른문제점을조 명해본다. 44
1. 현재의디지털변환은과거시간에머물러있다 을알수있다. 그러나무손실압축은복원후의결과가원본과 동일하다는장점을갖고있다. 무손실압축 원본 압축 복원 손실압축 원본 압축 복원 그림 1. 디지털변환 그림 2. 손실압축과무손실압축비교 디지털변환이란그림1과같이테이프, 필름등에수록된영상, 음성, 사진기록들을컴퓨터가이해할수있는디지털파일로만드는것으로, 변환을위해서는표3에제시된재생장비를이용하여야하며, 그결과특정포맷을갖는디지털파일을얻게된다. 국가기록원은 90년대후반부터시청각기록물에대한디지털변환을추진하였는데이때사용된파일포맷과변환기준은표4와같으며, 이러한기준은 2013년현재여전히유효하다. 표4. 시청각기록물의디지털변환기준구분포맷압축사용여부해상도영상 MPEG-PS Lossy 720 x 480 (SD) 음성 MP3, WAV Lossy - 사진 JPEG/TIFF Lossy/Lossless 가변지금까지적용되고있는변환기준의가장큰문제점은손실압축 (lossy compression) 을사용한다는것과, 영상기록의경우해상도를 SD(Standard Definition) 급으로설정하였다는것이다. 1) 손실압축은원본정보의일부를유실시킨다압축 (compression) 기술을사용하는가장큰이유는디지털파일의용량을작게함으로써저장공간을경제적으로사용하고, 네트워크를통해빠른속도로전송하기위함이다. 그림2에서보는바와같이손실압축은무손실압축에비해원본의크기를더많이줄일수있는반면, 복원후원본과차이가있음 손실압축에서정보가유실된다는점은무결성 (integrity) 에위배되는것이나, 반대로정보자원인저장공간의증가및이로인한비용부담이존재한다. 그렇다면이들모두를해결할수있는방안은없는것인가? 2) 해상도가중요한문제인가? 해상도란얼마만큼선명하게보이느냐하는정도를나타내는개념으로화면의크기가커지더라도선명하게보인다면그만큼해상도가높다고보면된다. 그림3은개념적으로 SD와 HD(Full HD) 를비교한것으로화소수를기준으로할때 HD 의해상도는 SD에비해 6배가높다. 원본매체에수록된영상의해상도가 HD임에도불구하고, SD화질의디지털파일로변환한다면, 그리고어떤이유에서건원본매체를더이상사용할수없는상황이라면, 영원히원본과같은해상도의영상을재현하는것이불가능할것이다. 디지털변환된 HD화질의파일을 SD화질로낮추는것은가능하지만, SD화질의파일을해상도가더높은화질로변경하는것은현재의기술로는불가능하기때문이다. 영화에서나오는것처럼흐릿한저해상도의인물사진을또렷한고해상도의사진으로변경하는것은영화에서나가능한이야기일뿐, 현실적으로는불가능하다. 국가기록원이소장한기록물중, 영화필름은흑백또는컬러에관계없이원본자체의해상도는현재의기준으로 Full HD( 또는 2K) 급이상의화질을보유하고있다고해도과언이 45
그림 3. SD 와 HD 해상도비교 아니다. 그러나국가기록원이디지털변환작업을시작한 1990 년대후반부터 2000 년대중반까지의컴퓨터를이용한디지털 변환기술은 SD 화질이일반화된시기였고, 그당시의 HD 화질 은신기술에해당할정도로보편화되기에는앞선기술이었을 것이다. 따라서당시영상기록물의디지털변환결과가 SD 화 질인부분에대해서는누구의책임을물을수없을뿐더러, 만 약 HD 화질로변환하여저장하였더라도당시의저장공간으로 는감당하기어려울정도의큰용량이었을것이다. 2013 년현재디지털변환기술은 HD 급을넘어 HD 화질의 4 배 인 4K, 그리고 HD 화질의 16 배에해당하는 8K 기술이상용화되 기시작하였다. 이러한시점에서 HD 화질의원본을 SD 디지털 파일로보존하고있어야하는가? 시간이경과하여원본을더이 상다루기어려운시기가도래한다면어떻게할것인가? 2. 디지털변환된기록물은단지사본에불과하다 영화필름, 비디오테이프, 오디오테이프등시청각기록물이 저장되는매체의기본재질은고분자물질이주를이루고있 다. 영화필름은셀룰로오즈트리아세테이트 (cellulose triacetate) 라는베이스에빛에민감한감광유제를발라만들어지 며, 비디오테이프및오디오테이프와같은자기테이프는플리에스테르 (polyester) 라는필름테이프표면에접착제와혼합된산화철등의자성재료를발라신호를저장할수있도록한매체이다. 고분자물질은내구성이좋아오랜수명이유지된다고하나, 그림4와같이 2011년영화필름을조사한결과다양한훼손사례가있음을알수있었고, 이러한경우부분적으로수록된기록물의판독이곤란함을확인할수있었다. 훼손사례의원인은다양할것으로예측된다. 온 습도와같은보존환경의문제, 관리부주의등등, 그러나원본매체의장기보존을위해아무리세심한주의와관심을기울인다하더라도시간경과에따른매체의자연적열화 ( 劣化 ) 와경화 ( 硬化 ) 등재질의수명에관한부분은피할수없는현상이다. 기록의장기보존을매체에의존하기에는매체의수명이유한하다는부분에는이견이없을것이다. 이러한문제를해소할수있는방안으로지금까지는사용가능한타매체로의이전을고려할수있었으나, 디지털시대에접어들면서테이프, 필름과같은고전적매체산업이쇠퇴하기시작하였다는점에서이또한해결책이될수없을것으로판단된다. 시청각기록물의디지털변환이시작된시기로돌아가보면, 디지털변환의가장큰목적은컴퓨터를이용한관리, 검색및 46
가장자리파손사례 테이프오염사례 스크래치에의한훼손사례 수축변형에의한훼손사례 흰곰팡이오염사례 보존용기훼손사례 그림 4. 영화필름훼손사례 활용등이용가능성측면이우선시되었을것으로예상하며, 이때의디지털파일은단지원본외에부수적인사본정도로밖에인식되지않았을것으로예측된다. 앞서언급된바와같이디지털시대는고해상도를추구하는기술로인해디지털변환파일이보여주는시각적한계는사람의눈으로는구분이안될정도로거의원본과같은해상도에접근하고있다. 어쩌면선명도면에서는오히려원본을능가한다는착각을불러올만큼정교한품질을보여주고있다고해도큰무리는없을것이다. 여전히디지털파일은사본에불과한것인가? 원본에준하는품질과진본성, 무결성등기록관리의원칙에위배되지않는다면, 물리적매체를대체할수있는 디지털원본 으로의요건에관해논의해볼필요가있지않겠는가? 3. 포맷과코덱이시청각기록관리에미치는영향 일상적으로많이사용하는전자문서포맷의종류는손가락 에꼽을만큼한정되어있다. 그럼에도불구하고플랫폼환경, 사용 OS( 운영체계 ), 응용소프트웨어의버전등전자기록의장 기보존을위해서는많은요소들을고려하여야하며, 실제국가 기록원은 2015 년전자기록의본격적이관에대비하여많은노 력과준비를하고있다. 시청각기록의포맷종류는전자문서에비해비교할수없을 만큼다양할뿐만아니라, 영상과음성의경우에는부가적으로 어떤코덱 (codec) 을사용하느냐에따라포맷의재생여부가달 47
라질수도있다는특징을갖고있다. 이해를돕기위해영상기 록의포맷과코덱에대한개념을설명한다. 이라할지라도그안에들어가는영상및음성코덱은서로다 를수있기때문이다. 1) 디지털동영상파일의구조 3) 코덱 (codec) 파일포맷을만드는것은컴퓨터에서인식하기위함이다. 테이프, 필름등에수록된기록들은디지털변환과정을거쳐컴퓨터에서인식할수있는파일포맷형태로바꾸어야한다. 동영상파일을구조적으로살펴보면영상과음성정보가공존하는형태로되어있다. 일부음성정보가별도의파일로분리되어있는경우도있었으나지금은대부분하나의파일내에혼합된형태의구조를취하고있다. 2) 컨테이너포맷 (container format) 영상정보와음성정보로구성된동영상의파일포맷을특히, 컨테이너포맷 (container format) 또는랩퍼포맷 (wrapper format) 이라고하는데, 컨테이너포맷을도식화하면그림5와같다. 동영상에서코덱 (codec) 이란음성또는영상의아날로그신호를디지털신호로변환하는코더 (coder) 와디지털신호를음성또는영상으로변환하는디코더 (decoder) 의합성어 (co+dec) 로부호기와복호기의역할을동시에수행하는장치로도사용된다. 용량을줄여서효율적으로보관하고전송시부담을줄이기위해파일을압축하고또그파일의압축을풀때는압축프로그램이필요하듯이동영상, 음악을압축하고그것을해제하는데필요한것이코덱이다. 각자다른코덱으로압축한데이터는그에따른고유의성질을갖는데, 각각압축과복원에사용되는계산법이다르므로일반적으로서로호환되지않고특성에맞는코덱으로만압축을풀수있다. 따라서컴퓨터에서동영상을재생하려면그동영상이제작될때사용된코덱이해당컴퓨터에설치되어있어야한다. 또한영상과음성정보가하나의컨테이너포맷으로이루어져있다할지라도영상과음성의코덱은각각존재하게된다. 그림5. AVI 동영상의컨테이너포맷컨테이너포맷은단순히해당재생소프트웨어 ( 예, 곰플레이어, 윈도우미디어등 ) 가인식할수있도록형태 ( 확장자 ) 를알려주는것일뿐, 구성요소인영상과음성정보를재생하기위해서는영상과음성의코덱 (codec) 이무엇인지를알아야한다. 그림5는 AVI 동영상파일, 즉컨테이너포맷이담고있는구성요소로영상 (video) 의코덱은 x264, 음성 (audio) 의코덱은 DTS라는것을보여주고있다. 컨테이너포맷은영상과음성정보를담고있는상자 (box) 이며, 기타여러가지메타정보를포함할수있다. 따라서동영상파일을말할때는 컨테이너포맷, 영상코덱, 음성코덱 에대한모든정보를이야기하여야정확한표현이라할수있다. 동일한컨테이너포맷 코덱은종류에따라 손실압축 (lossy compression) 과 무손실압축 (lossless compression) 으로나눌수있다. 손실압축은용량을줄여저장또는전송의효율성을높일수는있으나원래의정보를되살릴수없는비가역 ( 非可逆 ) 방법이며, 무손실압축은손실압축보다상대적으로용량이적게줄어들지만원래의정보를복원할수있는가역 ( 可逆 ) 방법이다. 따라서기록관리측면에서어떤코덱을사용하였는지가기록속성 ( 무결성 ) 의원칙유지를위한중요한요소가될수있다. 그러나현실적으로동영상을생산하는대부분의장비 ( 카메라, 방송장비등 ) 는손실압축을사용하고있고, 국가기록원으로이관되는대부분의동영상기록역시손실압축코덱을사용하고있는것으로나타났다. 4) 컨테이너포맷및코덱의종류컨테이너포맷에는음성만보관하거나또는이미지전용으로사용하거나, 음성및영상을같이보관하는경우가있다. 표5에현재사용되는대표적인포맷및코덱의종류를열거하 48
였다. 그러나실제사용되는것들은이보다훨씬더많으며, 국제표준과같은비영리표준보다는상업용도및특수한목적으로개발된것들이주류를이루고있는데, 이러한배경에는영상산업이갖는규모와기술개발로이루어진결과의특허권등경제적이해관계가복잡하게얽혀있기때문에유독영상과관련된기술분야는국제표준과같은규격의제정이어려운것이현실이다. 동영상분야에서포맷과코덱의진화는압축성능과고화질동영상확보라고하는단순히기술적차원만강조되는것은아니다. 보다뛰어난성능을갖는코덱의등장은필연적으로더좋은하드웨어기반을요구하기때문에, 영상장비산업을주도하는기업입장에서는새로운제품의출시및시장확대, 즉경제논리차원에서의도적으로새로운포맷과코덱을개발하고적용시킨다고해도감히틀린말은아닐것이다. 동영상기록을생산하는주체에서보면보다좋은장비, 고품질을보장하는코덱등의사용은당연할것이다. 기록관리의편의성을위해서이러한다양성을제한하는것보다는어떻게보존하고어떤방법으로이러한문제점을극복해나가야할것인지를고민해야할것이다. 이처럼포맷과코덱의다양성은기록관리에두가지과제를남겨주었는데, 첫번째는포맷재생을위한응용소프트웨어또는코덱이언제까지존재할수있느냐의문제이다. 이는테이프또는필름매체를재생하기위한재생장비 ( 플레이어 ) 의수명이얼마인가를묻는것과마찬가지이다. 두번째는다양한모든포맷을보존하여야하는문제로, 기록관리속성중하나인이용가능성 (availability) 을유지하기위해서전자문서와같은보존포맷의필요성을언급할수있다. 표 5. 컨테이너포맷과코덱의종류 대분류중분류포맷과코덱의종류 ISO/IEC MPEG-PS, MPEG-TS, ISO base media file format, MPEG-4 Part 14, Motion JPEG 2000, MPEG-21 Part 9 컨테이너포맷 ITU-T H.222.0, T.802 기타 3GP and 3G2, AMV, ASF, AIFF, AVI, AU, Bink, DivX Media Format, DPX, EVO, Flash Video, GXF, M2TS, Matroska, MXF, Ogg, QuickTime File Format, ratdvd, RealMedia, REDCODE, RIFF, Smacker, MOD and TOD, VOB, IFO and BUP, WAV, WebM ISO/IEC MJPEG, Motion JPEG 2000, MPEG-1, MPEG-2(Part 2), MPEG-4 (Part 2/ASP, Part 10/AVC), MPEG-H Part 2/HEVC 영상코덱 ITU-T 기타 H.120, H.261, H.262, H.263, H.264, H.HEVC AVS, Bink, CineForm, Cinepak, Dirac, DV, Indeo, Microsoft Video 1, OMS Video, Pixlet, ProRes 422, RealVideo, RTVideo, SheerVideo, Smacker, Sorenson Video, Spark, Theora, Uncompressed, VC-1, VC-2, VC-3, VP3, VP6, VP7, VP8, VP9, WMV, XEB ISO/IEC MPEG-1 Layer III(MP3), MPEG-1 Layer II(Multichannel), MPEG-1 Layer I, AAC, HE-AAC, MPEG Surround, MPEG-4 ALS, MPEG-4 SLS, MPEG-4 DST, MPEG-4 HVXC, MPEG-4 CELP, USAC 음성코덱 ITU-T 기타 G.711, G.718, G.719, G.722, G.722.1, G.722.2, G.723, G.723.1, G.726, G.728, G.729, G.729.1 ACELP, AC-3, AMR, AMR-WB, AMR-WB+, ALAC, Asao, ATRAC, CELT, Codec2, DRA, DTS, EVRC, EVRC-B, FLAC, GSM-HR, GSM-FR, GSM-EFR, ilbc, isac, Monkey's Audio, TTA(True Audio), MT9, A-law, µ-law, Musepack, OptimFROG, Opus, OSQ, QCELP, RCELP, RealAudio, RTAudio, SD2, SHN, SILK, Siren, SMV, Speex, SVOPC, TwinVQ, VMR-WB, Vorbis, VSELP, WavPack, WMA 49
4. 장기보존포맷에대한고려사항 시청각기록의보존포맷조차도결정되지않은상황에서, 장기보존포맷을거론하는것이이상할수있으나향후시청각기록의장기보존포맷구조를설계할때, 이미표준으로제정된전자문서의장기보존포맷구조를벤치마킹할수있다는점을고려하여어떤문제점이있는지를살펴보고자한다. 전자문서의장기보존포맷이포함하는구성요소를살펴보면그림6과같이 4가지의구성요소로이루어진다. - 원문 ( 전자문서 ) - 보존포맷 (PDF/A-1) - 메타데이터및인증정보시청각기록의장기보존포맷을위와같은구조로만든다고가정할때, 가장큰문제점은파일용량이지나치게커진다는점이다. 최근이관되는고해상도디지털영상파일의용량은 1시간기준으로수GB~ 수십GB로, 일반적인전자문서에비해수천배 ~ 수만배에해당된다. 여기에보존포맷을추가하여하나의장기보존포맷파일로생성한다면많게는 1개의시청각기록물이 100GB를넘을수도있다는계산이나온다. 이는저장장치인스토리지등에대한많은투자를요구할뿐아니라, 최신의컴퓨터라할지라도수십GB가넘는파일들을처리하고자할때, 속도와성능문제는심각하게고려해야할사항이라예상된다. 검색기능이무엇보다도중요하다고여겨진다. 전자문서의경우, 가장간단한검색방법으로기록물파일명을대상으로하거나, 기록관리시스템처럼기록물철, 건제목및주요내용등을별도의메타데이터로가지고있는경우메타데이터데이터베이스를대상으로검색하는방법을생각해볼수있다. 이외에저장된전자문서의본문을대상으로검색하는전문검색 (full text search) 기능은매우강력한방법으로검색에소요되는시간은검색엔진의성능에따라달라지겠지만세부내용까지찾아볼수있다. 반면에영상, 음성, 사진등으로이루어진시청각기록물의경우, 파일명또는메타데이터중심의검색방법은전자문서와동일하나, 기록물의성격자체가전혀다른시청각기록물에전문검색기능을적용하기에는곤란하다. 다큐멘터리영상기록을예로들면, 하나의영상기록내에는뉴스처럼서로다른내용이수록되어있을수있고, 주요등장인물, 장소가다수일수도있으며, 특정대사가중요한키워드일수도있을것이다. 만약하나의영상에서특정인물또는대사를찾고자한다면, 가장단순한방법으로처음부터재생을하면서찾아가는방법이있겠으나, 1-2개의기록물이라면가능하지만많은수량을대상으로한다면매우비효율적방법일것이다. 디지털변환된기록물을보유하고있는것도중요하지만, 활용과관리를위해서는신속하고정확한검색기능도매우중요하다. 과연방대한자료가운데특정인물이등장하는영상기록의철또는건명그리고해당장면 ( 프레임 ) 을정확히찾아갈수있는방법은없는것인가? 6. 시청각기록관리의이원화문제 그림 6. 전자문서의보존포맷및장기보존포맷개념도 5. 시청각기록관리를위해서는디지털변환만으로는부족하다 기록물을디지털변환하여컴퓨터로관리하는것의장점중 의하나는검색을손쉽게할수있다는점이다. 특히국가기록 원과같이방대한양의자료를소장하고있는기관의경우에는 시청각기록물을디지털변환하기시작한이후, 모든디지털시청각기록은중앙영구기록물관리시스템 (CAMS) 에등록 저장, 관리되어왔다. 이후 2010. 5월 공공기록물관리에관한법률시행령 제19조 ( 시청각기록물의생산 ) 신설에따라, 국가적으로영구히보존할가치가있는시청각기록물, 방송 영화기록물, 국가의주요사업및행사등대량 대용량시청각기록물의일시이관에대비하고원활한보존처리, 저장및관리를목적으로그림7과같이가칭 대량 대용량시청각관리시 50
그림 7. 대량 대용량시청각관리시스템 (MAM) 구성도 스템 (MAM, Media Asset Management) 을도입, 운영중에있다. CAMS 대비신규도입시스템의차별화된특징은다음과같다. 대용량파일등록 저장 - 등록기록물의용량에구애받지않음 대량기록물의동시처리능력 (multi-ingest) 다양한포맷처리및저장본, 활용본포맷의동시생산 영상기록의주요장면추출을위한자동기능채택 (cataloging) 등록된영상을한눈에살펴볼수있는 Multi-View 기능채택 (browsing) 음성, 사진, 복합기록물 ( 예, 구술기록 ) 의등록 관리기능 2013년말기준, MAM에등록 저장된기록물은약 3천건으로용량은약 74TB이다. 시스템을도입한지불과약 2년만에약 15년간에걸쳐디지털변환된결과를저장하고있는 CAMS 내의시청각기록물용량대비약 2배에해당하는것으로추정하고있다. 이는최근의시청각기록물이대부분디지털방식으로생산됨과동시에 HD급이상의고해상도를추구하는 관계로과거에비해용량이대폭증가한것으로분석된다. 반면, CAMS에수록된디지털시청각기록물은디지털변환이이루어진초기부터최근까지의기록들로기술적인측면에서다음과같은특징을갖고있다. 디지털변환시압축방식적용 영상기록을저해상도에해당하는 SD급으로인코딩 비전자및전자문서관리중심의시스템을이용 CAMS가도입되기이전그리고 2007년본격적으로 CAMS 를통하여기록물을등록 관리하던시기의방송기술은 SD방식이주류를이루었고, 이어등장한 HD 방식의기술은디지털변환시용량이지나치게커진다는단점이있었다. 따라서현재 CAMS에서적용하고있는 SD 해상도의저장방식은그당시기술수준으로는최선의선택이었다고판단된다. 다만, SD 해상도로디지털변환되어 CAMS에저장 관리되는기록물중, 역사적으로가치가있는중요한기록에대해서는원본품질에준하는고해상도로재작업을할필요가있다. 왜냐하면필름, 테이프와같은물리적매체는시간의흐름에따라열화 51
가될뿐아니라, 재생을위한전문장비가구형화되어언젠가는원본을다루기가어려워질것이기때문이다. 따라서, 현행 CAMS를통한시청각기록물의관리와 MAM 간의이원화된체계를하나의시스템으로통합하는문제에대해고려해보아야한다. 을까하는예상을하지만, 과연현실성있는대안인지의구심이든다. 기록관리분야의규모가대단히커서, 해당분야의산업이충분한이익을창출할수있다면대안이될수있겠으나, 다음의예를보더라도현실은그렇지않다는것을미루어짐작할수있다. Ⅳ. 디지털시청각기록관리를위한제안 지금까지기술된내용을토대로디지털환경하에서시청각기록물의보존처리및관리를함에있어주요문제점을정리해보면다음과같다. 필름, 테이프등원본매체를대체할디지털원본개념논의 원본대비디지털변환품질의문제 디지털변환시손실압축으로인한기록관리속성 ( 무결성 ) 위배 이용가능성 (availability) 을위한시청각기록의보존 장기보존포맷 시청각기록의활용을위한검색에관한문제 시청각기록의통합관리에관한문제 1. 원본매체그리고디지털원본 생산당시부터디지털방식으로만들어진시청각기록물이국가기록원으로이관되는 Born-digital 인경우라면굳이디지털원본이라는용어를사용할필요가없을것이다. 그자체로 원본 에해당하기때문이다. 이제까지논의된적없었던 디지털원본 이라는용어를제안하는것은테이프, 필름과같은매체에수록된시청각기록물을대체하기위함이다. 앞서언급된바와같이, 필름, 테이프의재질인고분자화합물이쉽게훼손되지는않으리라예상한다. 아울러보존과학분야의전문가들이원본보존을위한모든기술력을동원하여필요한조치를할것이고, 그결과기대이상으로원본매체의수명을연장할수있으리라예상한다. 그렇다하더라도향후원본을대체할무언가를고민하여야하는데, 혹자는미래에누군가가현존하는매체를대체할또다른매체를만들어내지않 파산보호졸업코닥, 내달재상장 부활날개짓코닥은 1888년조지이스트먼이창업한이후일반인이사용하기쉬운필름과카메라를선보여 1900년대카메라시장을장악했다. 필름사업황금기였던 1981년코닥의매출은 100억달러를돌파하기도했다. 그러나역설적이게도코닥이가장먼저개발한디지털사진기술이필름시장을잠식하며몰락이시작됐고, 급기야 2012년 1월파산보호를신청했다. - 이하생략 [ 머니투데이, 2013. 11. 21] 코닥, 파산보호탈출 인쇄전문업체로 초라한새출발 코닥은디지털카메라를발명해세계사진산업을이끌었지만디지털시대의도래를감지하지못하고결국인쇄업체로전락했다. 코닥은초고속디지털인쇄기술과같은상업적상품에주력하기로결정했다. [ 뉴욕로이터, 2013. 11. 21] 국가기록원이소장하고있는원본매체도중요하지만보다중요한것은매체에수록된내용, 즉기록은어떤경우라도보존되어후손에넘겨주어야할것이다. 이를위한현실적대안으로디지털환경에적합한 디지털원본 을제안한다. 디지털원본이란, 원본매체에수록된기록 ( 영상, 음성, 사진 ) 을원본해상도에준하는품질을갖도록디지털변환하여만들어진디지털시청각기록물로정의한다. 디지털원본이갖추어야할조건은다음과같다. 원본매체에서정의된품질기준으로디지털변환을한다. 디지털변환시, 무손실압축방식을적용한다. 52
1) 디지털원본을인정하기위한디지털표현방식의한계공학적으로논란의소지가있는점은디지털표현방식이갖는한계로, 기록관점에서이를인정하느냐의여부이다. 영상및사진의경우, 현재의기술로컴퓨터에서이미지를표현하는대표적인방법으로비트맵이미지 (bitmap image) 와벡터이미지 (vector image) 가있는데비트맵이미지는픽셀 (pixel) 이라는작은정사각형에있는색상정보를컴퓨터가이해하는이진수의조합으로바꾸어주는방식으로, 하나의이미지에서픽셀수를많게하면해상도가높아지게된다. 반면에, 벡터이미지는방향성을가진선과좌표를갖는점들이모여그려지는방식으로비트맵에비해선명도가뛰어나다는장점이있으나색상표현에한계를지니고있다는단점이있다. 현재대부분의디지털변환기술에는비트맵이미지방식을적용하고있다. 비트맵이미지의한계는그림8에서보여주는바와같이, 원 본품질에준하도록디지털변환을하였더라도확대를하면정사각형의픽셀이보이는데, 현실세계에서보는실물은이러한픽셀을볼수가없을것이다. 미세하지만실물의일부정보를생략하는것으로이해하면되는데, 바로이차이가디지털표현방식의한계이며, 이러한차이를인정하여야만 디지털원본 이원본매체를대체할수있을것이다. 물론해상도를높게하면할수록차이를줄일수있으나, 원본매체가갖는해상도보다높게하는것은불가능하다. 음성의경우도이미지의경우와비슷한데, 귀로듣는음성신호를아날로그신호라하며, 이를디지털신호로변환하는원리는그림9와같이원래의아날로그신호로부터일정간격으로신호의세기를취한다음이를이진수로변화하는데, 이러한방식은수학적으로증명된결과로, 음악CD에서듣는오케스트라의정교한음질도사실은이러한원리에의하여디지털변환된결과이다. 그림 8. 비트맵이미지의표현방식 그림 9. 음성의아날로그와디지털 53
2. 디지털변환과정및디지털포맷 다음은 2013년 6월, 국가기록원초청으로방문한아 태지역세계기록유산위원장 ( 전, 호주국립도서관필름관리부서근무, 호주필름 사운드아카이브설립 ) 인 Dr. Ray Edmondson과의질의 응답중에서발췌한내용이다. 호주의경우비디오, 오디오에서장비구형화로인해문제될가능성이높은매체들을우선작업한다. 이렇게우선순위를정해서디지털화를하게되는이유는장비의활용이불가능할때디지털화작업이어렵게되기때문이다. NFSA(National Film and Sound Archive) 에서는현재 16mm 영화필름을대대적으로디지털화하고있는데이는 16mm 영화필름관련장비및기술력이조만간중단될것이예상되기때문이며, 가능한높은해상도로디지털화를권하며, 원본아날로그필름또한계속적으로보관되어야할것이다. 디지털화시물론원본매체의훼손이일어나며, 아날로그에서디지털화전환시뿐만아니라아날로그에서아날로그로전환시에도화질의저하는발생할수있다. 따라서 16mm 영화필름디지털화시개인적인의견이지만 2k 데이터로변환하는정도가충분할것으로생각된다. 여기서기억할것은디지털화시화질저하가야기될수밖에없다. 디지털화시색상정보는원본필름의색상정보를정확하게표현하기가쉽지않으며물리적인영향을받기때문에반드시디지털화후에도원본및디지털화파일을같이관리해야할것이다. 위의예에서도알수있듯이, 시청각기록물을관리함에있어원본에준하는품질로의디지털변환은원본매체의열화및재생장비구형화등에대비하여볼때중요한의미를지닌다고볼수있다. 그러나고해상도의품질을갖는디지털파일은용량이지나치게커서, 검색등의활용을위해서는다소불편한부분이없지않다. 따라서현재의모든매체를대상으로원본에준하는품질을확보하는단계및이를통한활용등에용이한가벼운디지털파일을얻는단계, 그리고장기적으로보존을위한보존포맷등을생산하는절차를제안하고, 그에따른단계별품질기준에대하여제안한다. 1) 단계별디지털변환과정원본으로부터단계별로디지털변환하는과정을그림10에소개한다. 왼쪽의원본은필름, 테이프와같은유형매체로부터 Born-digital 에해당하는디지털파일 ( 이들파일은 CD, DVD, USB 등별도의저장매체에담겨있거나, 네트워크를통해이관된모두를포함한다 ) 까지, 소장또는이관되는모든시청각기록물을의미한다. 본디지털파일및디지털화파일을보관할때, 실제파일뿐만아니라메타데이터도보존포맷으로변환하여보관하고있으며, 무손실압축파일을선택하여야한다. Edmondson박사는 16mm 영화필름의예를들어, 장비구형화및기술소멸이예상되기때문에가급적고해상도의디지털변환과함께원본필름의보존을권고하고있다. 원본보존은당연한것이고실제 16mm 필름외에모든시청각기록매체에적용되는의견이라할수있다. 그림10. 단계별디지털변환과정 단계-A 원본매체에수록된시청각기록의내용을디지털원본으로변환하는과정으로, 원본에준하는품질을얻기위한방법의적용과함께, 원본정보의손실을최소화하기위하여무손실압축방법을사용한다. 54
단계-B 디지털원본은용량이큰관계로활용에적합하지가않다. 따라서디지털원본을이용하여향후검색용및온 오프라인서비스제공용디지털파일을만드는과정이다. 활용용 : 오프라인서비스제공을위한목적으로, 해상도는디지털원본과유사하게하되, 압축기술을사용하여파일용량을최소화한파일 Proxy : 온라인서비스제공및검색등컴퓨터에서활용을위하여압축기술적용및해상도를제한한파일 단계-C 시청각기록물의보존포맷을생성하는단계로, 디지털원본에메타데이터등을추가함과동시에원본대비무결성, 이용가능성을확보하는과정 단계-D 전자문서의장기보존포맷과유사한구조를갖는시청각기록장기보존포맷을생성하는과정이다. (1) 단계-A 첫번째, 디지털원본생성을위한조건단계-A에서가장중요한점은원본매체가어느정도의품질을갖고있느냐에따라디지털원본을얻기위한품질기준이달라진다는점이다. 예를들어, 아날로그영상신호를담고있는 VHS(Video Home System, 흔히가정용비디오테이프라고함 ) 테이프의해상도를가늠할수있는규격을보면 352 480i이라고표현되어있다. i(interlaced의의미 ) 는 480개의주사선을홀 짝으로나누어표현한다는개념으로, 디지털영상의프레임개념으로보면 1개의프레임은 352 240 픽셀로구성되어있는것과마찬가지이다. 표6에서보는바와같이, 과거아날로그방식의 TV 수상기로사용되었던 CRT의해상도가 350 250(4:3) 정도이다. 이러한점을고려하여 VHS 테이프에수록할수있는품질은 CRT 모니터에서최적으로보여줄수있는정도면충분하였을것이다. 물론, VHS 테이프를플레이어 ( 재생장비 ) 를통하여직접디지털방식의 SD 또는 HD TV모니터에서볼수있으나, 디지털모니터로보는화면이상하로길게보일수도있고, 혹은원본의색감보다선명하게보일수도있다. 그러나보는이에따라과거의 CRT로보는화면이더좋다고느낄수도있다. 이는디지털모니터와아날로그모니터의기술속성차이때문이기도하지만, 제조사에 따라디지털모니터의특성이서로다른영향도있다. 표6. TV의영상해상도분류구분해상도 (Pixel) 화면비율방식 CRT 350 x 250 4:3 아날로그 SD 704 x 480 16:9 디지털 SD 640 x 480 4:3 디지털 HD 1280 x 720 16:9 디지털 Full HD 1980 x 1080 16:9 디지털 Ultra HD 3840 x 2160 16:9 디지털시청각기록의전자적관리를위해 VHS 테이프에수록된영상을디지털변환하고자한다면, 화면의크기와해상도를고려할때직관적으로 4:3 비율을갖는 SD급으로변환하는것이가장적합할것이다. HD급이상의변환이무의미한것은파일의용량만커질뿐시각적으로더좋게보이지않기때문이다. 반면, 주로방송용으로사용되는 Full HD 품질의 HDCAM SR 테이프에수록된영상을디지털변환 ( 정확하게는디지털변환이아니라디지털방식의기록을다른디지털방식으로전환하는것으로, 트랜스코딩 (transcoding) 이라고함 ) 할때, SD급의품질을적용한다면파일용량은줄어드나원본이갖고있는좋은품질을훼손하게될것이다. 따라서단계-A에서디지털원본을만들기위한첫번째원칙은원본매체가갖는고유의품질과그안에수록된내용의해상도가무엇인지를정확하게파악해야한다. 단계-A에서고려하여야할두번째사항은원본정보의손실을최소화하기위한방안으로무손실압축을사용하여야한다. 디지털영상과디지털사진의주요특징중하나는고해상도로가면갈수록파일용량이기하급수적으로늘어나기때문에디지털방송, 온라인전송등을하고자할때용량을줄이기위한방법으로손실압축을사용한다. 최근의압축기술은용량을대폭줄이면서시각적품질은원본과별반차이가없을정도로까지발전되고있다. 그러나압축기술의본질은원본정보의생략 ( 훼손 ) 을기반으로하기때문에기록관리측면에서는수용하기어려울것으로판단된다. 무손실압축에관해서는 Edmondson 박사와의질의 응답중에서도언급되고있으며, 55
ISO-OAIS 모델에근거하여개발된 Archivematica 시스템 2) 의포맷정책에서도보존포맷에관해서는무손실압축방법을 적용함을알수있다. 표7. Archivematica의포맷정책 Media type Preservation format Access format Audio WAVE(LPCM) MP3 Video FFV1/LPCM in MKV MP4 Image(raster) Uncompressed TIFF JPEG Archivematica 시스템에서는표7과같이보존포맷을만들 기위해원본정보를유지하는무손실압축방법을사용하였으 며, 검색등활용을위한활용포맷 (access format) 은적정한품질을보장하는손실압축방법을사용하였다. (2) 단계-A 두번째, 국가기록원 (NAK) 시청각기록에대한디지털원본제안시청각기록의보존포맷을만들기위한핵심요소인디지털포맷을제안하고자하는목적은다음과같다. 디지털시청각기록의무결성및품질보장 ( 원본이유형매체인경우최소한의정보손실 ) 현재와미래의이용자를적합한방식으로콘텐츠를이용할수있도록접근성유지 그림 11. 시청각기록디지털원본생성개념 2) Archivematica 는 ISO-OAIS 참조모형을준수하여기록 ( 객체 ) 의생산자로부터기록을이관받는 인수 (Ingest), 기록 ( 객체 ) 에대한 열람 (Access) 등디지털객체를처리할수있는 기록보존시스템으로, UNESCO memory, the City of Vancouver Archives, the University of Alberta Libraries, the University of British Columbia Library, the Rockefeller Archive Center, Simon Fraser University Archives and Records Management, Yale University Library 등의학교및기록관련기관이공동참여하여개발. 56
이를위해적용되는원칙은앞서언급된바와같이, 최대한원본품질의계승과무손실압축기술을기반으로하고, 적용범위는유형매체에수록된영상, 음성, 사진그리고 Borndigital 형태의디지털영상, 디지털음성, 디지털이미지파일을대상으로한다. 그림11과같이디지털원본생성을위한개념을제안한다. 제시된개념도를기반으로 13년 R&D 연구과제를통한연구 개발을완성하였다. 개발된프로토타입 (prototype) 시스템은하드웨어에의존함이없이오직소프트웨어라이브러리만으로구성이되었으며, 소프트웨어는모두무료공개소프트웨어 (FFmpeg, OpenCV, ImageMagick) 를사용했다. 이미지보존포맷으로는 TIFF 포맷 (Uncompressed TIFF codec) 을, 오디오와비디오의컨테이너로는 MKV 포맷 (FFV1 in video codec, FLAC in audio codec) 을, 오디오보존포맷으로는 FLAC 포맷 (FLAC codec) 을선정했다. 또한원본파일과보존포맷파일간의내용의무결성을증명하기위하여 SHA-2 알고리즘을채택했다. 연구를통해개발된시스템은장기적인사용관점에서하드웨어와무관하게구현되었으며, 포맷변환시간은재생시간의약 3.5배가소요되는것으로나타났다. 향후상용화시, 소요시간을단축하기위한방법으로는멀티프로세서를사용한다중처리방법과 GPU(Graphic Processing Unit) 를이용한방법을들수있다. 시청각기록물의인수또는변환전에기록물의오류를미리탐지하는기능을추가하면전체변환시간 ( 특히영상 ) 을크게줄일수있을것으로판단된다. 연구과제를통해제안하는디지털원본포맷과활용본포맷을정리하면표8과같다. 는 FLAC 코덱이현존하는모든오디오코덱중오픈표준으로인한소스지원, 53~57% 에이르는높은압축률, 엔코딩및디코딩고속처리, 보펀성등보다강점이있기때문이다. (3) 단계-B 활용본, Proxy 파일의생성활용본의가장큰목적은원본과유사한품질 ( 해상도 ) 를갖고있음과동시에적은용량으로온라인, 오프라인서비스를제공할수있기위함이다. 이를위해서는제안된디지털원본을이용하여고품질의손실압축을적용하며, 각각의포맷에대해서는표8에제시하였다. 아울러 Proxy 파일은인터넷및기록관리시스템상에서검색및활용등시스템메모리에부하를주지않기위하여낮은품질및손실압축방법을적용하는것을고려할수있다. 그러나활용본및 Proxy 파일은보존차원보다는활용에목적을두고있기때문에이에대한규격은당시기술을고려하여언제든지변경이가능하다. (4) 단계-C 보존포맷의생성전자문서의문서보존포맷이 PDF-A/1인것처럼, 시청각기록의보존포맷역시전자문서의문서보존포맷이갖는기록관리의원칙이준수되어야할것이다. 제안한시청각기록의디지털원본은이용가능성및무결성측면을고려하여설계되었다고할수있으나, 앞서언급된바와같이디지털표현방식의한계를어떻게보느냐에따라달라질수있기에기록관련관계자및전문가들의보다면밀한검토가선행되어야할것이다. 보존포맷의생성을위해서는디지털원본과함께디지털원본의생성일자, 생성자, 디지털원본에포함된기록의전, 후포맷및코덱등별도의메타데이터를추가할수있다. 표 8. 시청각기록디지털원본포맷및활용포맷 Media type Digital original format for Preservation Access format Audio FLAC MP3 Video FFV1/FLAC in MKV MP4 Image(raster) Uncompressed TIFF JPEG 제안하는포맷과표 7 의 Archivematica 시스템에적용된포 맷과의차이점은오디오포맷으로 FLAC 를사용한것이다. 이 (5) 단계-D 장기보존포맷의생성그림6에나타난바와같이, 전자문서의장기보존포맷은원문에해당하는전자문서와문서보존포맷그리고인증정보및추가메타데이터의항목으로구성되어있다. 전자문서의파일용량과문서보존포맷의파일용량을합치더라도큰문제는없을것으로예상한다. 그러나디지털시청각기록물은전자문서에비하면수천 ~ 수만배에해당할만큼용량면에서비교가되지않을정도로크다. 이부분은전자기록물의보존에필요한 57
스토리지등저장매체의사용계획에많은영향을미칠수있다. 장기보존포맷이갖는속성중하나가기록물의진본성을입증하는것이라면, 이는인증정보및메타데이터로충분할것으로판단된다. 용량을고려한다면장기보존포맷의구조를원본기록을제외하고보존포맷 ( 디지털원본 ), 인증정보, 메타데이터로구성하는것도하나의방법이될수있다. 3. 시청각기록물의기술 (Description) 시스템기반하에서전자적으로관리하는장점중의하나는검색이용이하다는점으로, 검색에필요한키워드가적절히정리되어있고전문검색 (full text search) 이가능한검색엔진이있다면더할나위없을것이다. 그러나시청각기록물은특성상전자문서의경우처럼전문검색기능을적용할수없기때문에, 일차적으로각기록물에대한내용들이충실히기술 (description) 되어야할필요가있다. 과정중의분류정리, 기본목록등록은이관기관에서제공된기록물의목록및기초내용만으로작업이이루어졌는데, 이로인해추후기록물을보존처리하는과정에서발견되었던사례를보면, 기록물의제목과달리전혀다른내용이수록된경우 기록물로등록되었고, 실물 ( 테이프등 ) 이존재함에도불구하고수록된내용이전혀없는경우 수록된기록의품질이불량한경우 ( 잡음, 화면떨림, 블랙화면등 ) 이외에도매체파손, 재생불가등다양한사례발생이러한오류가발생하는이유는시청각기록물의특성상매체, 테이프등에수록된내용파악을위해서는별도의전문장비가필요했기때문이다. 그러나장비가있다하더라도전문장비에대한운영지식그리고영상 음성신호분석등전문성이필요하기때문에기록담당자가다루기에는용이하지않을것이다. 문서의경우시스템에등록하는시점부터본문의내용을파악하여필요한내용을기술할수도있으나, 시청각기록물특히테이프또는필름에수록된경우에는전문장비가갖추어있지않다면내용을보고들을수없기때문에이관당시의내용정도를등록할수밖에없다. 중앙영구기록물관리시스템 (CAMS) 이도입된이후, 모든시청각기록물은이관당시의내용정보만등록되어있다고해도과언이아니다. 물론관련부서에서부분적으로상세내용을기술하였고, 이후주제별로상세내용을기술하기위한노력을기울여왔으나역부족이었을것으로예상한다. 따라서현재와같은속도및체계로는점차증가추세에있는시청각기록물의검색에는턱없이부족하다하겠다. 기술 (description) 이부진했던첫번째이유는현행시청각프로세스의문제를지적할수있고, 두번째는내용기술을위한기술적 (technical) 환경의미비를들수있다. 1) 시청각프로세스의변경제안현행시청각기록물의등록절차는종이문서의수집 보존프로세스와동일하게진행되고있다. 그림12의 현재 에서보는바와같이시청각기록물이인수된후서고입고전까지기록물의실질내용을확인해볼수있는단계가없다. 입고전처리 위와같은오류가발견되는시점은입고후처리단계중 실물검증및확인 을위하여일련의보존처리와디지털변환을하는과정에서확인이된다. 그러나이때는이미기록물이인수확인을거쳐기본목록등록이되어있는시점이고, 경우에따라서는기본목록등록으로부터상당한시일이경과한관계로이관기관과의확인및재이관이곤란할수도있을것이다. 이를해결하기위한방안으로, 그림12의 개선 에나타난것처럼입고전처리단계에서 가등록 기능을신설하고, 실물확인및디지털화 ( 검증 ) 기능을기본목록등록전에실시토록하여위와같은오류들이기록물의정식등록전에조치토록하는프로세스를제안한다. 이를위한전제조건으로는 실물확인및디지털화 가기록물이관과병행하여처리될수있도록환경 ( 장비, 인력등 ) 이조성되어야하고, 아울러기록담당자가별도의전문지식없이개인 PC로등록예정인시청각기록물의내용 ( 디지털변환작업을거친결과 ) 을확인하고검수할수있도록네트워크기반의뷰어 (viewer) 기능이설치되도록하는것이다. 뷰어기능의또다른장점은이관 등록시점에서수록된내용을확인할수있기때문에기술 (description) 측면에서내용을요약또는중요검색어를등록토록하여, 향후기록물검색시풍부한색인을활용할수있을것이다. 제안한내용중, 네트워크기반의뷰어기능과뷰어를통 58
현재 개선 그림 12. 시청각프로세스의현재 개선 한색인등록기능은대량 대용량시청각관리시스템 (MAM) 구축시도입된기능으로추후중앙영구기록물관리시스템 (CAMS) 의연계시활용이가능할것으로판단된다. 2) 기술적환경의준비동영상기록중에서특정인물이등장하는장면을검색한후, 해당인물이등장하는장면부터바로재생하려면어떻게해야할까? 먼저생각할수있는방법으로는대상기록물에서해당인물이들어있는장면 ( 프레임 ) 에별도의색인이되어있다면현재의검색기술로해당장면을바로재생하는것이가능하다. 이를위해서는저장되어있는동영상기록의장면을분석하여전체장면중에서화면전환이일어나는장면만을추출한후 ( 이를 카탈로깅이라고한다.), 이들장면에내용을기술하는방식을고려할수있다. 그림13은이와같은기법을사용하여기록물의내용을기술한예이다. 그림13의동영상기록은총 10여분으로, 4분 32초에 김천홍 이라는인물이등장하여 처용무 에대해설명하는내용이담겨있다. 이는검색어를 처용무 또는 김천홍 으로하면바로이기록물의 4분 32초부터재생시킬수있도록검색결과를보여줄수있다는것을의미한다. 만약 처용무 가다른기록물에도내용기술이되어있다면검색된복수의기록물건을리스트로보여주고선택된기록에대해해당장면부터재생할수있도록하는방법이다. 물론장면전환이이루어지는부분은시스템이자동으로찾아줄수있으나해당장면에내용을기술하는것은오로지사람의몫이기때문에완전한방법이라고볼수는없다. 59
그림 13. 카탈로깅및색인 이외에도, 텍스트가아닌인물사진또는음성을가지고특정장면을검색하는방법이있다. 국가기록원이 2008년부터추진해온 R&D 과제가운데인물사진과음성을기반으로검색하는연구를진행하여가능성에대한결과를확인한바있으나, 아직은기초연구단계에머물고있고이를고도화하기위해서는보다많은노력을기울일필요가있다. 방송국또는영상을다루는민간영역에서도아직은이러한검색기술이완성된바는없는것으로확인하였다. 결론적으로시청각기록의검색을위해서는부분적으로시스템의도움을받을수있으나, 주요색인어및요약내용의기술은사람에의존할수밖에없는상황이다. 그러나기술발전속도로미루어볼때, 상기의방법이전혀불가능하지않을뿐더러오히려예상치못한전혀새로운방법의등장도기대해볼수있다. 화등의시청각기록물을등록하면서관리가이원화되는상황이 발생하였다. 시청각기록관리관점에서두시스템을비교하면 표 9 와같다. 구분 표 9. 시청각기록관리관점에서본시스템비교 중앙영구기록물관리시스템 (CAMS) 대상모든기록물시청각기록물 기능 강점 약점 인수, 분류, 등록, 서고관리, RFID, 디지털변환, 기술, 검색 물리적매체위치지정 ( 서고관리 ) 인수 ~ 검색모든단계를관리 대용량파일저장에한계특정포맷만수용사용자측면보다는관리에치중 대량 대용량시청각관리시스템 (MAM) 분류, 디지털변환, 기술, 검색 대용량파일 다양한포맷수용가능시청각기록보존처리에특화멀티뷰어등사용자기능강화 종합적기록관리에는부족 4. 시청각기록물의통합관리 1) 현황 2007년 CAMS가도입된이래국가기록원이소장한모든기록물은 CAMS를통한등록 관리방식을유지해왔다. 그러나 2011년 MAM에국가의주요사업및행사, 방송프로그램, 영 디지털환경에따른시청각기록물의가장큰변화는고품질, 대용량화, 포맷의다양화를들수있다. 관리및활용차원에서는사용자의편의성을반영하기위하여시각적기능을강화하는방향으로시스템이진화되고있다. 그림14는 CAMS와대량 대용량시청각관리시스템의영상기록관리화면을비교하여보여주고있다. 60
그림14. CAMS(좌)와 대량 대용량 시청각관리시스템(우) 화면 비교 CAMS의 가장 큰 강점은 기록물의 인수부터 보존까지의 전 2) 통합관리를 위한 시스템 연계 제안 과정을 체계적으로 관리하도록 설계되어 있다. 그러나 위에서 언급한 다양한 포맷, 대용량의 시청각기록까지를 수용하기에 두 시스템의 장점만을 반영하여, 시청각기록의 통합 관리를 는 한계가 있어, 이러한 점을 보완하기 위하여 대량 대용량 위한 시스템 연계 방안을 제안하고자 한다. 연계라고는 하나 시청각관리시스템이 도입되었으나 완전한 기록관리를 위해서 그림15와 같이 CAMS의 시청각기록을 전담으로 처리하는 기능 는 CAMS와의 연계가 반드시 필요하다. 을 대량 대용량 시청각관리시스템에 위임하는 방안이다. CAMS 고유기능 MAM - 인수 / 분류 / 등록 위임 - 시청각 디지털 변환 - 서고관리 / RFID - 카탈로깅, 기술 - 전자 비전자 데이터세트 등 - 기록물 저장, 검색 그림15. CAMS - MAM 시청각기록 기능 및 데이터 연계 61
아울러, 현 CAMS를통한시청각기록물의등록및관리의문제점을개선하기위한내용도추가적으로반영하였다. 그림 15에두시스템간기능및데이터연계를위한개념을도식화하였다. 오류없는시청각기록의등록및관리를위하여기본목록등록전실물검증이가능하도록선디지털변환실시및제공 실물검증완료와동시에, 고해상도디지털파일생성 서비스등활용목적의저해상도영상파일자동생성 한다는개념에서정보를공유 분배한다는개념의클라우딩 (clouding) 컴퓨터환경으로변화될것이다. 이러한환경이현실화된다면, 지금까지그리고 2015년을대비하는전자기록관리기반조차도일대변화를모색하지않으면안될것이다. 상상이상의방대한규모를갖는정보가생산될것이고, 이러한기록들을한곳으로모아관리하고활용한다는개념은실현불가능해질것이기때문이다. 미래의요구를예상하고기술의발전속도를예측하여기록관리의정책, 제도및관리환경에대한대비책을세우는시점은지금부터라도시작해야할것이다. Ⅴ. 결론 국가기록원은 2015년전자기록이관에대비하여관련제도, 규격을검토 정비하고기록관리시스템 (RMS) 및중앙영구기록관리시스템 (CAMS) 을보완하는노력을기울이고있다. 다행스럽게도국가정책및행정집행과정의산물인전자문서는그동안기울여온노력덕분에기존의시스템을보완하고추가기능을개발하는선에서문제없이이관되어국가의중요한기록으로보존될것으로기대한다. 결론적으로, 본보고서에서기술한시청각기록에관한대안은약 15년간고수되어온형식과방법에대한개선이다. 어쩌면위에서언급한예측하기어려운가까운미래와현재까지의간극을메우는정도에불과할수도있다. 여기서의간극이란기록이기록으로서의위치를갖기위한최소한의원칙 ( 진본성, 무결성, 이용가능성, 신뢰성 ) 을의미하는것으로, 시청각기록에관한한지금까지간과되어왔던부분이다. 앞으로의기록관리는더큰변화를겪을수있는만큼, 현시점에서이부분을해소하지못한다면우리는더많은비용을지불해야할것이다. 피할수없다면받아들여야할것이다. 1990년대후반부터범국가적으로추진해온 IT기술과정보화전략을기록관리에조기적용함으로써, 방대한기록들을디지털정보자원으로관리 활용하고자했던정책적결정은시기적으로적절하고올바른판단이었다고생각된다. 그러나 IT 기술의빠른변화를읽는데소홀함으로인해웹 (web) 기록물, 개인간그리고공동체간의사소통의산물인 SNS 및트위터 (twitter) 기록물및시각적 청각적으로보다풍부해진고품질의시청각기록등변화에대한전략과대비책이다소미흡하였다는점은아쉬움으로남는다. 물론국가기록원곳곳에서는내 외부의변화에대비하여정책연구및 R&D 등을통하여현재와미래에대한결과들을도출하고있으나, 현행화를위한의사결정및유기적협조가다소부족해보이는게사실이다. 지금까지의 IT기술변화가자동차속도라면, 앞으로의기술은예상할수없을정도로더빨리진화될것으로예측된다. 이미정부와민간협업에의해추진되고있는바이지만, 다가오는미래는 PC(Personal Computer) 환경하에서정보를소유 62
참고문헌 1. 국가기록원. 2008. 시청각기록물디지털아카이빙을위한기반기술연구개발. 2. 국가기록원. 2009. 시청각기록물디지털아카이빙을위한핵심기술연구개발. 3. 국가기록원. 2010. 시청각기록물디지털아카이빙표준모델연구및모델링구현. 4. 국가기록원. 2013. 디지털시청각물보존포맷설계및변환기술연구. 5. 김상국. 2012. 영상압축기술및현황. 국가기록원. 기록물보존복원제5호. 6. Wikipedia. Multimedia compression and container formats. http://en.wikipedia.org/wiki/compression_of_video_codecs 63