중소기업기술혁신개발사업최종보고서 (AC3, MP4 오디오코덱처리소프트웨어개발 ) 2002년 5월 30일 주관기업: ( 주) 이머시스 -1-
[ 별지제4 호서식] 중소기업기술혁신개발사업최종보고서 업체명 기술개발과제명 ( 주) 이머시스 (Tel : 042-862-5031) 주소 정보통신,S/W및전자게임 AC3,MP4 오디오코덱처리소프트웨어개발 305-343 대전유성구장동 48번지 대전 S/W 지원센터 404호 대표자김풍민 과제책임자 김현석 개발기간 2001 년 4월 1 일 ~ 2002 년 3월 31일 위탁기관 계획대비목표달성도 (%) 10 20 30 40 50 60 70 80 90 개발완료시기 2002년 3월 중소기업기술혁신개발사업운용요령제21조의규정에의하여최종보고서를제출합니다. 붙임 1. 중소기업기술혁신개발사업최종보고서 8 부. 2. 개발사업비집행내역보고서 8 부. 3. 기술료납부동의서 2 부. 2002 년 5월 30일 주관기업 : ( 주) 이머시스직인 대표자 : 김풍민 ( 인) 중소기업청장귀하 -2-
제출문 중소기업청장귀하 본보고서를 "[AC3, MP4 오디오코덱처리소프트웨어개발] 에관한중소기업기 술혁신개발사업" ( 개발기간 : 2001. 4. ~2002. 3.) 과제의최종보고서로제출합니 다. 2002 년 5 월 30 일 주관기업 : ( 주) 이머시스 과제책임자 : 개발참여기업 : 위탁연구기관 : 김현석 -3-
과제명 요약서 ( 초록) AC3, MP4 오디오코덱처리소프트웨어개발 주관기업 ( 주) 이머시스총괄책임자김현석 개발기간 총개발사업비 ( 천원) 위탁연구기관개발참여기업 주요기술용어 (6~10 개) 정부출연금 53,000 기업부담금 2001. 4. 1 ~ 2002. 3. 31 (12 월) 현금 15,842 현물 22,354 총개발사업비 91,196 AC3, MP4, Audio Codec, MPEG-2, HDTV, DVD 1. 기술개발목표본기술개발의목표는 DTV, DVD 인터넷에서의오디오압축전송포맷인 AC3와 MP4(MPEG-2 AAC) 를인코딩및디코딩할수있는순수소프트웨어모듈을개발하고, AC3와 MP4 를하나의소프트웨어플랫폼에서포맷변환, 입출력, 편집, 효과처리및재생할수있도록하는것이다. 2. 기술개발의목적및중요성미국 Dolby 사의 AC3 코덱과, MP4(MPEG-2 AAC) 코덱을개발하고, 이두압축방식의오디오데이터를상호변환하거나음향효과의적용이가능한오디오편집소프트웨어를개발한다. HDTV, DVD, 인터넷용오디오컨텐츠의후- 공정, 전송을위한변환, 음향효과의첨가, 편집이순수소프트웨어로서구현되도록하여고품질/ 저비트율오디오컨텐츠의생성, 편집, 재생을보편화하고자한다. 인터넷방송, 화상통신. HDTV, 대화형멀티미디어서비스와같은분야에서영상및오디오의신호를고품질이면서압축률이높은부호화기술을이용하여전달하면, 컨텐츠를전송하는데필요한전송대역폭을적게사용함으로서시간과비용을절감할수있다. 또한앞으로음성, 음악, 음향등여러형태의오디오컨텐츠들이차지하게될시장이급성장할것으로예상되므로, 이러한오디오신호를효율적으로압축하고복원할수있는기술에대한연구는매우중요하다. -4-
요약서 ( 초록) : 계속 3. 기술개발의내용및범위 기술개발의내용 기술개발내용은크게오디오코덱기술개발과편집기개발로나누어지며, 각각 의세부기술을살펴보면, 오디오코덱기술은 MP4 오디오인코더, MP4 오디오 디코더, AC3 오디오인코더및 AC3 오디오디코더기술로나누어진다. 편집기 기술은사용자인터페이스, File 입출력, 오디오데이터편집및디스플레이, 오 디오필터기술로나누어진다. 기술개발의범위 AC3와 MP4 오디오코덱은고품질/ 저비트율로여러채널의오디오데이터를전 송할수있는오디오압축포맷으로서한국, 미국, 일본, 유럽의 HDTV용오디오 전송표준으로채택되었고, DVD, 음악압축, 인터넷오디오데이터전송등에 활용빈도가높아지고있다. 본연구에서는 AC3와 MP4 방식의오디오데이터를 디코딩및인코딩하고재생/ 변환/ 편집할수있는개인용컴퓨터기반의소프트 웨어를개발한다. 4. 기술개발결과본기술개발에서개발된제품은순수소프트웨어형태로서독립된여러음원을고품질/ 저용량의 AC3 또는 MP4 포맷의오디오데이터로변환할수있으며, 반대로 AC3/MP4 포맷의데이터를입력받아데이터를편집하고음향효과를적용하고실시간으로재생할수있으며, 데이터의보관이나전송을위하여오디오파일로저장할수있다. 5. 기대효과 AC3, MP4의인코더및디코더모듈과편집도구가개발되면일반적인 PC 환경에서 HDTV 용오디오컨텐츠를제작하고재생할수있으며, 인터넷, 가전, 오락, 통신등다양한응용분야로의산업적인파급효과는매우클것으로예상된다. -5-
목 차 제 1장기술개발목표 제 2장기술개발의목적및중요성 제제 1절개발대상기술의목적 2절개발대상기술의중요성 제 3장기술개발의내용및범위 제 1절기술개발의내용 제 4장기술개발결과 제 1절개발제품의개요및성능제 2절 AC3 인코더제 3절 AC3 디코더제 4절 AC3 인코딩성능제 5절 MP4 인코더제 6절 MP4 디코더제 7절 MP4 인코딩성능제 8절음질평가 제 5장기대효과 -6-
제 1장기술개발목표 본기술개발의목표는 DTV, DVD, 인터넷에서의오디오압축전송포맷인 AC3와 MP4(MPEG-2 AAC) 를인코딩및디코딩할수있는소프트웨어모듈을개발하고, AC3와 MP4 를하나의소프트웨어플랫폼에서포맷변환, 입출력, 편집, 음향효과처 리및재생할수있도록하는것이다. 표 1과표 2는기술개발일정과개발달성 도를나타내고있다. 표 1. 기술개발일정 -7-
표 2. 기술개발달성도 -8-
제 2장기술개발의목적및중요성 제 1절개발대상기술의목적 1. 기술동향및발전추세 고품질디지털오디오처리기술은 1982년에 Philips에의해만들어진 CD를기점으로하여 1983년 Sony의 DAT, 1980년대후반 Sony의 MD, Philips에의한 DCC(Digital Compact Cassette), Philips 와 Sony에의한 DVD(Digital Versatile Disk) 등으로이어지면서많은발전을거듭하여왔으나거의모든디지털오디오처리기술이저장매체를효율적으로이용하기위한방법에주력되었다. 그러나, 1988년이후부터는정작매체뿐만아니라전기통신에이용할수있는고품질디지털오디오처리기술이본격적으로개발되었다. 초기에는스테레오디지털오디오정보를처리하기위한기술을중심으로이루어졌으며, 1992년경에 MPEG 을비롯하여 Dolby, AT&T, Sony 등에서기술개발을완료하여표준화하였다. 이들오디오부호화표준들은고품질을추구하면서압축율이기존의방식보다높지만멀티미디어용으로사용하기에는문제점이있는것으로지적되었다. 따라서, 압축율이높으면서다앙한비트율을이용하여음성과오디오를모두수용할수있는오디오표준을제정하기로하였고, 현재다양한방식에의한멀티미디어용디지털오디오부호화방식들이연구되고있다. 새롭게연구되고있는이들방식들은다양한오디오품질과다양한압축율을가지는방식으로발전할것이고, 차세대멀티미디어용및이동통신, 위성통신등에활용될수있는지능형의오디오처리기술또는실감통신등에이용될수있는입체오디오처리기술등으로발전하여갈것이다. 참고적으로고품질디지털오디오처리기의발전추세를국제표준화동향으로살펴보면아래그림과같다. -9-
그림 1. 오디오부호화기술의발전추세 2. 채널재생시스템 고품질의오디오환경을다양한멀티미디어를통하여서비스하고자하는최근의오디오시스템의구축은현장감극대화노력과효율적인배포/ 전달방법을고려한다. 이러한요구를만족시키는미국의 Dolby 사에의해제안된 5.1채널재생시스템은 HDTV, DVD 의재생표준으로자리잡아가고있다. -10-
3. 국내외개발현황 표 3. 국내외개발현황 국내 국외 -오디오처리기술을이용한제품이나시스템의개발기술은국내의기술 수준은우수한편. - 원천기술인요소기술의개발능력이부족한문제점. - 외국의기술을도입하여제품이나시스템에활용. -ETRI의 MP4 Decoder ASIC, MP4 Decoder Emulation 등은고가의하 드웨어를필요로함. -Dolby는스테레오오디오를위해 AC-2(Audio Coder-2), 다채널오디오 를위해 AC3의부호화기술개발 -AT&T는스테레오오디오를위해 PAC(Perceptual Audio Codec), 다채 널오디오를위해 MPAC(Multi-channel PAC) 의부호화기술을개발 -유럽의 경우 Philips, IRT, CCETT, Nokia, RAI, FhG 등이 연합하여 MPEG 오디오그룹에서국제표준을주도하기위한연구개발을수행 -FhG는스테레오오디오부호화에대한 MPEG 오디오계층 III를구현 -일본의경우 Sony, NEC, Pioneer 등이디지털오디오처리기술에대한 개발을수행하고있으며, 특히, Sony는 DAT 및 MD 등의기술을개발하 여상품화 4. MP4 및 AC3 코덱 다음그림은 MP4와 AC3의 encoding Process 를보여주는그림이다. 그림 2. MP4 Encording Process -11-
그림 3. AC3 Encoding Process MP4는 MPEG 계층 Ⅲ과같은심리음향모델 II 를이용하지만, 입력샘플의길이를변화시켜시간영역과주파수영역에서의해상도를 Trade-off함으로서 Pre-echo현상이발생되는신호에대한음질을높일수있다또한, MPEG과같은 MDCT+ PQMF 필터뱅크를이용하지만, 계층 Ⅲ에서와같은균등한 32개의서브밴드가아닌, 1/3 임계대역(critical band) 의주파수해상도를갖는서브밴드코딩방식을이용한다. AC3 의비트스트림은동기프레임(SF: Synchronization Frames) 의시퀀스로구성되어있다. 동기프레임은디코딩의최소기본단위로서오디오블럭당새로운 256샘플을표현하여, 하나의동기프레임에서는 1536샘플에대한코드와압축정보가들어가게된다. 인코더는입력데이터에대하여프레임구조에따라비트스트림으로코딩하게된다. -12-
5. 개발배경 미국 Dolby 사의 AC3 코덱모듈과, MP4(MPEG-2 AAC) 코덱을개발하고, 이두 압축방식의오디오데이터를상호변환하거나효과첨가가가능한편집소프트웨어 를개발한다. HDTV, DVD, 인터넷용오디오컨텐츠의 post-production. 전송을위 한변환기, 효과첨가, 편집이순수소프트웨어상에서구현되도록하여고품질/ 저비 트율오디오컨텐츠의생성, 편집, 재생을보편화하고자한다. 인터넷방송, 화상통신, HDTV, 대화형멀티미디어서비스와같은분야에서영상과 오디오의신호를고품질이면서압축률이높은부호화기술을이용하여전달하면컨 텐츠를전송하는데필요한대역폭을적게씀으로서시간과비용을절감할수있 다. 또한앞으로문자, 음성, 음악등여러형태의오디오컨텐츠들이차지하게될 시장이크므로, 이러한오디오신호를효율적으로압축하기위한연구는매우중요 하다. MP4 기술은현재많은사용자를가지고있는 MP3보다최대 30% 더압축할수있 을뿐아니라음질도좋아앞으로이용이확산될것으로본다. AC3는현재 DVD 오디오표준으로결정된후이를지원하는앰프가많이보급되고있다. MP4와 AC3는모두 5.1채널오디오신호를압축할수있으며앞으로상용화될 HDTV 의오디오코덱표준이되었다. 미국및한국에서는 AC3 가, 유럽과일본에서 는 MP4가 HDTV의오디오코덱으로결정되어방송분야에서이들코덱의편집이앞 으로의오디오컨텐츠제작/ 관리/ 배포/ 재생에필수기반기술이될것이다. MP4 압축방식은지금까지개발된멀티채널오디오압축방식중최신기술로, 제한 된대역폭을갖는분야로부터고품질을요구하는응용분야까지적용할수있는특 징을가지고있다. 또한관련기술들이 MPEG-4 오디오의일부기술로활용되고 있으며, 48kHz샘플링주파수를갖는 5개채널오디오신호에대한 320Kbps의데 이터율에서 ITU-R 에서규정한구분할수없는 (indistinguishable) 오디오품질을 갖는다. 따라서 MP4 및 AC3 기술을활용하는응용분야가방송, 인터넷, 가전, 오락, 컴퓨 터, 통신등으로다양하기때문에이를이용한오디오컨텐츠의제작과변환에많 은수요가있을것으로예측되지만, 아직이러한요구를충족시킬수있는편집기 는고가의 H/W를필요로하기때문에대다수의영세한디지털컨텐츠제작자들에 게는순수소프트웨어적으로구현이가능한프로그램이절실히필요하다. -13-
제 2절개발대상기술의중요성 기존기술의문제점개선방안 *MP4와 AC3 는전송, 저장용도로만들어져있어편집이어려운기술적어려움이있다. *MP4 디코더는현재소프트웨어적으로가능하지만이를편집할수있는도구가없다. *AC3 는최근범용사운드카드에서지원하여재생이가능하나편집은불가능하다. *AC3를다룰수있는 DVD 용제작도구는상당히고가이다. *MP4와AC3 를동시에다룰수있는소프트웨어가없다. *PC의처리속도가빨라지므로 MP4및AC3 의인코더의속도최적화를연구한다. * 디코더를입력모듈과연결하고스트림처리기를지능화한다. * 인코더는기본적으로배치프로세스를지원한다. * 인코더의속도를향상시키기위해멀티쓰레드프로그래밍기법을활용한다. * 기축적된멀티채널오디오편집기술을활용하여편집성능을만족시키다. * 멀티채널의배분및믹싱기능을강화하여재생성능을만족시킨다. 1. 첨단성 개발될제품은기확보되어있는디지털오디오컨텐츠편집기술을활용하여 MP4, AC3 압축포맷을편집할수있는환경을제공한다. 그리고개발하고자하는소프트웨어는현재개발이되지않았기때문에이분야의시장을리드해나갈수있다. 2. 독창성 저비트율, 고품질오디오를위한 AC3, MP4의인코더및디코더모듈과이를함께편집할수있는도구를순수소프트웨어의형태로서는세계최초로제공함으로서, DVD, HDTV, 인터넷오디오전송을필요로하는제작자들의요구인디지털컨텐츠의경제적이고효율적인변환과편집, 그리고전달을모두만족시킬수있다. 3. 당위성 많은응용분야를가지고있는저비트율, 고품질오디오전송기술이현재까지하드웨어적측면에서많은연구가있었던것은계산속도의문제도있겠지만하드웨어라는 copy가불가능한물리적상품의개발이상업적으로안전하다고여겨진인식도있었을것이며, 이제 PC의연산속도가하루가다르게빨라지고있고복제에대한도덕적시각도회복되고있으므로 AC3와 MP4를편집하는순수소프트웨어의출현과이의상업적성공은시간문제이다. -14-
제 3장기술개발의내용및범위 제 1절기술개발의내용 1. 기술개발의내용 표 4. 기술개발내용 MP4. AC3 코덱기술개발코덱규격및기능설계 Sampling rates: 48 khz, 44.1 khz, 32 khz -MP4(MPEG-2AAC) Coding standard: ISO11172-3, layers 1,2 Conformance: Highest level (16 bit) - AC3(Dolby AC3) Coding standard: ATSC A/52 Coding Modes: 1+1, 1/0, 2/0, 3/0, 2/1, 3/1, 2/2, 3/2 Multi-channel down-mixing Re-matrixing to preserve Dolby Prologic encoding Conformance: Group A (20 bit) MP4 오디오인코더모듈개발 - Low complexity profile -Mainprofile - 품질 indistinguishable - 속도: 재생대비 200% 이하(5.1ch 기준) MP4 오디오디코더모듈개발 - Low complexity profile -Mainprofile - 속도재샘대비 60% 이하(5.1ch 기준) AC3 오디오인코더모듈개발 편집기개발편집기사용자인터페이스설계 - Wave Display - Selection - Panning - Filtering 오디오코덱모듈을포함한편집 S/W 기능설정 - File input/output - Play - Split/Cut/Copy/Paste/Move - Play/Stop/Rewind/Forward MP4, AC3 오디오입출력테스트및편집기개발 - MP4 Codec module test - AC3 Codec module test - File open/save - Real-time Player - Filter Volume Equalizer - 품질 indistinguishable Echo/Reverb - 속도 : 재생대비 200% 이하(5.1ch 기준) - Editing(Split/Cut/Copy/Paste/Move) AC3오디오디코더모듈개발 편집후MP4, AC3 오디오품질평가 - Downmixing - Downmixing test - 속도 : 재생대비 40% 이하(5.1 ch 기준) - 주관평가시스템시험 개발내용은크게두부분으로나뉘어지며각세부내용과규격은위표 4와같다. ( 개발될인코더및디코더의규격은 HDTV (High Definition Television) 에서요 구되는규격을따름), 그리고개발모듈간의구성은그림 4 와같다. -15-
그림 4. 개발대상시스템개념도 2. 기술개발의범위 AC3와 MP4 오디오코덱은고품질/ 저비트율로다채널을전송할수있는오디오데이터포맷으로현재한국, 미국, 일본, 유럽의 HDTV용오디오전송표준으로채택되었고, DVD, 음악압축, 인터넷오디오전송등에활용빈도가높아지고있다. 본연구에서는 AC3와 MP4 방식의오디오데이터를디코딩인코딩할수있으며, 재생/ 변환/ 편집할수있는 PC 기반소프트웨어를개발한다. 그림 5는고품질의다채널오디오생성시스템, 압축전송환경, 다채널재생시스템을포함한주변기술과대상기술다이어그램이다. 그림 5. 주변기술및개발대상기술 개발대상은시스템은그림 5와같이 AC3와 MP4 의인코더및디코더, 편집, 변환, 재생모듈로구성된다. -16-
표 5. 개발기술요약 구분내용성능및규격 원료자재 사용환경펜티엄급이상의 IBM PC 개발툴 C, Visual C++ 개발기술및방법 -개발코덱규격및기능설계 -MP4 오디오인코더모듈개발 -MP4 오디오디코더모듈개발 -AC3 오디오인코더모듈개발 -AC3 오디오디코더모듈개발 -편집기사용자인터페이스설계 -오디오코덱모듈을포함한편집 S/W 기능설정 -MP4, AC3 오디오입출력테스트및편집기개발 -편집후 MP4, AC3 오디오품질평가 사용자 Interface: PC 환경,S/w,DialogGUI 기반코덱 :MPEG 그룹, Dolby사의요구사항만족편집 : Split, Cut, Paste, Mixing 기능품질 : indistinguishable 개발제품용도/ 기능 개발목표 MP4와 AC3코덱을개발하고 MP4와 AC3 오디오를편집/ 재생하는소프트웨어로서 HDTV, 인터넷방송용멀티미디어제작및효율적인고품질오디오파일의압축전송 차세대오디오코덱규격인 MP4 및 AC3 오디오코덱을개발하고이를편집, 변환, 재생할수있는소프트웨어를개발하여보다나은디지털오디오컨텐츠제작환경을제공한다. 실시간 MP4 및 AC3 재생, 재생시간대비 2배이하의압축속도제공. HDTV, DVD, 인터넷방송용코덱요구성능만족 -17-
3. 개발제품의판매 수출등사업화방안 표 6. 사업화방안 시장진입계획홍보계획시장확보계획수입모델및판매계획 개발된코덱모듈과재생기는자사 web site를통해 Shareware 형태로배 포하고, 편집소프트웨어는인터넷방송국, HDTV, DVD용컨텐츠제작자 와, 멀티미디어컨텐츠변환사용자를대상으로패키지화또는 web site를 통한 Download 형식으로판매한다. 이를연도별로세분화하면다음과같 다. - 2001년 10월 홍보용 Website 구축과 MPEG site, Dolby site와 link 등록추진. MP4, AC3 플레이어 Shareware 버전제공. 전시회( 국내, 국제) 참가및개발코덱활용그룹구성. - 2002년 2월 MP4, AC3 편집소프트웨어 package 화및판매. 코덱개발및편집컨설팅. - Web Site 홍보, 대중매체를이용한광고. - 전시회(COMDEX) 및북미시장개척단활동에참여하여해외시장에홍보 - 일본은 ORT, 미국과유럽은 Yeeha를통해마케팅 - HDTV용오디오컨텐츠제작및서비스방안설명회개최 - 디지털오디오컨텐츠제작자들에게정보제공(e-mail 을통한홍보, 발표회개최 ) - 멀티미디어컨텐츠분야의전공학생들을위한편집샘플제작배포. - 웹컨텐츠제작사들과개발코덱의활용방안을위한 consortium 구성. - 고품질디지털오디오서비스강화. - Multi-platform 구축으로사용자층확대. - 코덱의 licensing 판매및편집도구판매는 2002년부터시작 - 인터넷방송및관련업체에게는기간별 site license 형태로제공. - 코덱편집기는 5.1 채널사운드카드업체와접촉하여번들형태로제공. - 개발모듈의 ASIC화및 test container consulting. -18-
제 4장기술개발결과 제 1절개발제품의개요및성능 1. 개발제품의기본기능 본연구에서개발된제품은순수소프트웨어형태로서다양한포맷의오디오파일을입력받아오디오데이터를편집하고, 음향효과를적용하고, 오디오포맷을변환하고, 다채널사운드카드를통하여실시간으로모니터링할수있다개발제품의일반적인사양은표 7 과같다. 고품질오디오처리를위하여최대 24bit, 48Khz의샘플링율의데이터를입출력할수있으며, 2 채널스테레오, 4 채널, 5.1 채널등다양한형태의압축포맷을지원한다. 각각의압축포맷은국제표준을따르며, 사용자의편의를위하여다양한옵션을제공한다. 오디오파형편집기는다양한형태의오디오데이터를디스플레이할수있으며, 사용자가필요한부분을선택하여자르거나이동시킬수있으며여러가지음향효과를적용할수있다. -19-
표 7. 개발제품의사양 MP4, AC3 코덱사양지원코덱규격및기능 편집기사양편집기사용자인터페이스 Sampling rates: 48 khz, 44.1 khz, 32 khz - MP4(MPEG-2 AAC) Coding standard: ISO11172-3, layers 1,2 Conformance: Highest level (16 bit) -AC3(DolbyAC3) Coding standard: ATSC A/52 Coding Modes: 1+1, 1/0, 2/0, 3/0, 2/1, 3/1, 2/2, 3/2 Multi-channel down-mixing Re-matrixing to preserve Dolby Prologic encoding Conformance: Group A (20 bit) MP4 오디오인코더 - Low complexity profile -Mainprofile - SSR(Scalable Sampling Rate Profile) - 품질: indistinguishable - 속도: 재생대비 200% 이하(5.1ch 기준) MP4 오디오디코더 - Low complexity profile -Mainprofile -SSRProfile - 속도재생대비 60% 이하(5.1ch 기준) AC3 오디오인코더 - 품질 indistinguishable - 속도 : 재생대비 200% 이하(5.1ch 기준) - Downmixing - Wave Display -Selection - Panning -Filtering 오디오코덱모듈을포함한편집 S/W 기능 -Fileinput/output -Play - Split/Cut/Copy/Paste/Move -Play/Stop/Rewind/Forward MP4, AC3 오디오입출력테스트및편집기능 - MP4 Codec module test -AC3Codecmoduletest - File open/save -Real-timePlayer -Filter Volume Equalizer Echo/Reverb - Editing(Split/Cut/Copy/Paste/Move) AC3 오디오디코더편집후 MP4, AC3 오디오품질평가 - 속도 : 재생대비 40% 이하(5.1ch 기준) - Downmixing test - 주관평가시스템시험 -20-
그림 6. 개발제품의실행화면 -21-
그림 6 은개발제품의실행화면이다. 각각의기능을설명하면다음과같다. 번호 1은 메뉴바/ 툴바 로서모든명령을포함하고있으며, 사용빈도가높은기능은툴바에아이콘으로제공을된다. 메뉴바에있는대표적인메뉴로는 File, Edit, View, Control, Mix, Effects 등이있으며, 각메뉴에포함되어있는기능들은표 8 와같다. 표 8 개발제품의기능요약 메뉴명 File Edit View Control Mix Effects Generat e DirectX Options 기능 Open, New Project, Open Project, Close Project, Save, Save As, Save All, Import, Export, Recent files, Exit Undo, Redo, Cut, Copy, Paste, Paste Repeat, Delete, Select All, Split, Group, Marker, Slice Switch, Slice Properties, Track Switch, Track Properties 등. Time Zoom In, Time Zoom Out, Track Zoom In, Track Zoom Out, Zoom Normal, Full Screen. Record, Play, Play Slice, Play Track, Pause, Stop, Goto Start, Rewind, Forward, Loop Mono Mix, 2 Channel Mix, 4 Channel Mix, 5.1 Channel Mix, Mix to New Channel Sound Image, Sound Field, Surround Panning, Volume Amp, FIR, Pitch Shift Tones, Morse, DTMF PC에설치되어있는소프트웨어를호출하여사용 Preferences, Auto Crossfade, Direct Envelope, Bypass All Effects, Status Format, Sound Meter, Master Device Setting, Smpte Device Setting 툴바에는메뉴바에서지원하는기능의대부분을선택할수있다. 각툴바는 View 메뉴에서보이거나숨도록설정할수있다. 스텐다드툴바 ( ): 스텐다드툴바에서는새로운프로 프로젝트생성, 파일열기, 프로젝트저장, 자르기, 복사하기, 붙이기, 작업복구, 재 실행, 바이패스, 오토크로스페이드, 엔벨롭편집, 온라인도움말열기등을수행한 다. -22-
믹싱툴바 ( ): 믹싱툴바에서는프로젝트의출력상태를모노나스테레오로설정하기, 새로운채널로믹싱하기, 모든데이터를비어있는트랙으로믹싱하기, 출력을헤드폰으로출력하기, 믹싱후교체하기, 스피커로출력하기의기능을수행한다. 스위치툴바 ( ): 스위치툴바는슬라이스나트랙에적용되 는옵션을조정하는툴바로서슬라이스Mute, 슬라이스Bypass, 슬라이스보호기능, 슬라이스오토크로스페이드, 트랙 Solo, 트랙 Mute, 트랙 Bypass, 트랙보호기능 을수행한다. 뷰툴바 ( ): 뷰툴바에서는 Effects Bar, Explorer Bar, Meter Bar 를보이게하거나안보이게하는기능을수행한다. 편집툴바 ( ): 편집툴바에서는슬라이스나누기, 그룹생성하기, 그룹해제하기, 모든그룹해제하기, 그룹목록보기의기능을수행한다. 컨트롤툴바 ( ): 컨트롤툴바는녹음, 재생, 정지, 일시정지, 처음으로가기, 되감기, 빨리가기, 끝으로가기, 반복재생의기능을수행한다. 줌툴바 ( ): 줌툴바에서는수평으로확대, 축소, 수직으로확대, 축소, Normal 크기, 전체화면보기의기능을수행한다. 번호 2는프로젝트창을나타내는것으로왼쪽의박스에는각각오디오데이터가출력될채널을나타낸다. 즉왼쪽, 오른쪽, 센터, 후방왼쪽, 후방오른쪽또는중저음우퍼중어느채널의스피커로오디오데이터를출펵할것인가를나타낸다. 번호 3은이펙트바로서입체음향, 서라운드이펙트를비롯한다양한이펙트를사용할수있다. 번호 4는멀티메터바로서각각의채널로출력되는데이터의크기를나타내다. 그리고출력의이득을조정할수가있다. 번호 5는프로젝트창에있는오디오데이터에적용된음향효과를나타낸다. 번호 6은파일검색, 열기, 미리듣기등의기능을제공하는탐색바이다. 2. 재생기능 오디오데이터를재생하는기능으로재생의위치에따라재생선(Playback Line) 이오른쪽으로움직인다. 재생방법은전체트랙을재생하는 Play, 슬라이스만재생하 는 Play Slice, 한트랙만을재생하는 Play Track 3 가지가있다. -23-
그림 14. 오디오재생화면 재생이끝나면바로이어서다시처음부터재생하는반복재생을설정할수있고, 만약선택영역이있을경우에는그부분이반복재생된다. 3. 편집기능 개발제품은오디오데이터를편집하는데필요한다양한편집기능들을제공한다. 가. 작업복구및재실행편집이잘못되었을경우작업복구(Undo) 명령을통해이전작업을복구할수있으며, 재실행(Redo) 명령을통해서는작업복구명령을통해되돌린작업을다시취소할수있다. 나. 잘라내기, 복사, 붙여넣기, 삭제슬라이스의잘라내고자하는부분을마우스로선택하여잘라내는기능과, 슬라이스의선택된부분을복사하는기능이있다. 복사또는잘라내기로클립보드에저장된오디오데이터를마우스로지정한위치에붙이는붙여넣기기능이있다. 또한붙여넣기에서는사용자가붙여넣을횟수또는반복을원하는시간을지정할수있으며이횟수에따라반복붙여넣기를할수있다. 그림 15. 반복붙여넣기 -24-
다. 슬라이스나누기사용자가원하는위치에서슬라이스를나눌수있는기능이다. 재생라인위치에서슬라이스를나누거나, 마우스로영역을선택하여선택된처음과끝의슬라이스를나눌수있다. 라. 스위치스위치는슬라이스와트랙의속성을변경하며, 슬라이스스위치와트랙스위치로나뉜다. 슬라이스스위치는 Mute Slice. Bypass Slice. Protect Slice, Cross Fade Slice 등의속성을조절한다. 표 9. 슬라이스스위치기능 메뉴 기능 Mute Slice 재생또는믹싱시슬라이스를포함하지않는다. Bypass Slice 재생또는믹싱시슬라이스에적용된이펙트를무시한다. Protect Slice 슬라이스의이동, 나누기, 삭제를불가능하게한다. Cross Fade Slice 슬라이스의자동크로스페이드를가능하게한다. 그림 16. 크로스페이드실행화면 크로스페이드란서로분리되어있는슬라이스를겹쳤을때에끝나는부분이겹쳐진슬라이스는자연스럽게볼륨이감쇄하고, 처음부분이겹쳐진슬라이스는자연스럽게볼륨이증가되도록하는기능이다. 마. 마커원하는위치에마커를삽입, 삭제하고마커의설명을바꿀수있으며삽입시 1번부터순서대로번호가생성된다. 마커는중요한위치와시간을기억하고영역선택과나누기를실행하는데유용하다. -25-
그림 17. 마커표시실행화면 바. 그룹편집 선택된슬라이스들을그룹핑하거나그룹으로설정된객체를해제하는기능으로그 룹핑된슬라이스들은클릭으로함께선택되며, 이동, 삭제, 스위치및이펙트적용 시같은효과가적용된다. 그림 18. 그룹설정화면 -26-
제 2절 AC3 인코더 AC3 인코더는편집이마무리된여러채널의오디오데이터를멀티채널압축포맷인 AC3 파일로저장한다. 인코더모듈에서필요로하는여러파라미터들은 'Audio Service Configuration' 이라는기능을이용하여설정할수있으며, 오디오서비스의파라미터들은돌비디지털인코더모듈의기본적인기능을나타내고있다. 각파라미터는 Audio Coding Mode, Data Rate, Sampling Rate 그리고 Dialog Normalization 등의정보를포함한다. 그림 19는이와같은파라미터정보를설정할수있는 'AC3 file export' 메뉴화면이다. 그림 19. AC3 인코더옵션설정화면 1. 데이터율(Data Rate) 돌비디지털비트스트링의데이터율값은파라미터를이용하여설정된다. 데이터율은양질의오디오상태를유지하기위하여돌비디지털인코더가지원하는오디오코딩모드파라미터에의존적이다. 일반적, 비트스트림이작은채널을지원하는오디오코딩모드는낮은데이터율을지원한다. 표 10은오디오코디모드에따른지원가능한데이터율과추천할만한데이터율의예를나타내고있다. 보통각각의오디오코딩모드에서는추천하는데이터율을사용하면양질의오디오상태를유지한다. 표 10 오디오코딩모드에따라지원하는데이터율 -27-
2. 오디오코딩모드(Audio Coding Mode) 오디오코딩모드파라미터는인코딩비트스트림내부에있는메인오디오채널수를정의하며, 채널포맷을나타낸다. 오디오코딩모드파라미터는 m/n같은형태의두개의숫자로지정된다. 앞의 m 은전방채널의값을나타내고, 'n' 은후방채널의값을나타낸다. 1+1 인코딩모드는 ATSC DTV 포맷에서나 DVD-V v포맷에서허용되지않는다. 만일파라미터값이 1/0(mono) 와같이인코딩되었다면, 디코더는센터채널또는좌/ 우양채널로시그널을보낸다. 3. 표본화율(Sample Rate) 인코딩비트스트림의표본화율을설정한다. 표본화율은 32Khz, 44.1Khz, 48Khz가가능하며, 데이터의용도에따라선택하여사용할수있다. 4. 오디오대역폭(Audio Bandwidth) 일반적으로오디오대역폭은인코더안에서자동으로조절된다. 코더는전체오디오스펙트럼대역을유지한다. 대부분의경우인 5. 압축특성 (Compression characteristic) 영화의사운드트랙에서는대사의오디오레벨이배경음악과같은사운드레벨보다 20dB 정도낮은것이일반적이다. 이와같은이유로영화사운드트랙의인코딩에 는높은(20:1) 의압축률이적용된다. 그리고음악의경우에는다이나믹레인지가좁 기때문에인코딩할때압축을사용할필요가거의없지만, 절대적인소리강도를 유지하기위해서약간의압축을사용한다. 표 11은각압축방법에대하여설명하고 있다. -28-
표 11. AC3 압축방법 No. 1 2 3 4 5 압축방법표준영화압축 (Film Standard Compression) 라이트영화압축 (Film Light Compression) 표준음악압축 (Music Standard Compression) 라이트음악압축 (Music Light Compression) 음성압축 (Speech Compression) Null Band : 10dB, Null Band는압축을하지않는영역을의미하며, 표준영화압축의경우 Null Band보다높은신호에대해서는 20:1 의비율로압축을하고, 그밴드보다낮은신호에대해서는 2:1 의압축( 최대증폭 6 db) 을한다. Null Band: 20dB, 압축비율은표준영화압축과같다 Null Band는 10dB 이고, Null Band보다높은신호에대 해서는 20:1 의비율로압축을하며, 그밴드보다낮은 신호에대해서는 2:1 의압축( 최대증폭 12dB) 을한다. Null Band는 20dB 이고, Null Band보다높은신호에대 해서는 2:1 의비율로압축을하며, 그밴드보다낮은 신호에대해서는 2:1 의압축( 최대폭 12dB) 을한다. Null Band는 10dB 이고, Null Band 보다높은신호에 대해서는 20:1 의비율로압축을하며, 그밴드보다낮 은신호에대해서는 5:1 의압축( 최대증폭 15dB) 을한 다. 6. LFE On LFE채널파라미터는 LFE(Low-Frequency Effects) 채널을동작시키거나또는동작하지않게한다. 멀티채널프로그램으로 LFE 채널의사용은선택사항이지만, mono, stereo 혹은서라운드인코딩프로그램에는사용할수없다. Two-channel 돌비디지털제품혹은 two-channel downmix 모드에서작동하는멀티채널제품은 LFE 신호를생략한다. 7. 디코더출력(Decoder output) 디코딩할때의코딩모드를설정한다. 인코더에서오디오데이터는 5채널데이터를인코딩해도디코더가디코딩하여출력할때디코더출력모드에의하여 4채널또는 2 채널로등으로재생한다. -29-
8. 입력파일(Input File) 인코딩하기위한입력오디오데이터에대한정보를나타낸다. 입력오디오데이터의표본화율, 분해능, 채널수그리고데이터의크기를 byte 단위로나타낸다. 9. 입력채널경로설정 (Input Channel Routing) 인코딩하기위한오디오데이터를각채널별로정렬하여인코딩비트스트림에지정한다. 6 개의지정된모드와사용자모드를제공하며. "Front Left" 에 "Input 1" 을지정하면 AC3 파일의 Front Left 채널에입력오디오데이터의첫번째채널데이터가배정된다. 그림 21. 입력채널경로설정그림 22. 필터설정 -30-
10. 필터 LFE filter : 서브우퍼채널에입력되는오디오신호에용할것인가를설정. 120Hz의저역통과필터를사 DC filter : 인코딩되는오디오신호의직류전압성분의제거여부를설정. 90 phase shift : 돌비서라운드(L/C/R/S) 재생을위한 Lt/Rt Downmix를위해서는이옵션이설정되어야한다. Bandwidth filter : 정해진오디오대역이상의신호를제한하는기능. Perform digital deemphasis : 고주파대역의 harshness 잡음을줄이기위하여사용되었던기능인 preemphasis 처리된오디오신호를인코딩하는경우에는반드시이옵션을설정해야한다. Preemphasis는 A/D, D/A conversion 시에오디오에발생할수있는 harshness 잡음을제거하는방법으로사용되어왔다. ADC 전에 high frequency를약 10dB 증폭하고 DAC 단계에서다시 -10dB 증폭해서고주파대역의잡음을제거하는기술로서, 돌비디지털비트스트림은 preemphasis없이인코딩되기때문에 preemphasis된 Linear PCM 비트스트림을인코딩하려면반드시디지털 deemphasis 단계를거쳐야한다. 그렇지않을경우인코딩된오디오는고주파대역이과다하게증폭된사운드를가지게된다. Enable 3dB surround attenuation : 일반적인극장세팅은서라운드스피커들을 3dB 높여서사용하고있기때문에, 필름용으로인코딩할경우에는이옵션을설정해야한다(DVD 용인경우 OFF). RF overmodulation protection : 공중파방송용으로인코딩할경우 RF over-modulation 되는것을막기위한설정이다. -31-
제 3절 AC3 디코더 AC3 디코더는 AC3 포맷으로압축된오디오데이터를디코딩하여비압축방식의오 디오데이터로변환하는소프트웨어모듈이다. 그림 23은 AC3 디코더의실행화면 이다. 그림 23. AC3 디코더실행화면 1. 워드사이즈(Word size) 디코딩시하나의오디오데이터를이루는분해능값을지정한다. 해능값은 16비트와 24 비트가있다. 지원가능한분 -32-
2. Karaoke capable 이파라미터는디코더로하여금 V 채널을둘다재생하던지, 하나혹은재생시키지않게선택할수있다. 두개의 V 채널을선택하거나, 하나혹은아무것도선택하지않았을때의기본값은표 12 에나타나있다. 2채널과멀티채널재생모두에해당되는값들이나와있으며, 사용자가 V 채널을선택하지않거나(none), 하나만선택하거나(V1 혹은 V2) 모두선택(V1과 V2) 할경우의값도나와있다. M채널과싱글 V 채널은출력중앙에서재생되며, 출력의 V 채널한쌍은왼쪽(V1) 과오른쪽(V2) 에서재생된다. 출력에기여하는모든채널들이총동원되는경우에, 수적인오버플로우가발생하지않도록실제계수는하향조정되어야한다. 표 12. Karaoke capable 3. Channel configuration Channel configuration 파라미터는 decoding 할때디코딩된 wave 파일의채널수를정의하며, 채널포맷을나타낸다. Channel configuration는 m/n같은형태의두개의숫자로지정된다. 앞의 m 숫자는앞채널(front 채널) 의숫자를나타내고, n 의숫자는뒷부분( 서라운드) 채널의숫자를나타낸다. 4. LFE On LFE: 채널파라미터는게한다. LFE(Low-Frequency Effects) 채널을작동혹은작동불가하 -33-
5. Dynamic rage compression AC3 포맷으로가능한오디오데이터는뉴스, 영화사운드트랙, 록뮤직, 오케스트라뮤직등여러가지가있는데, 각데이터의기준오디오레벨이각각다르기때문에정규화가필요하다. 돌비디지털포맷에는영화사운드트랙을믹스할때의대사(dialog) 기준레벨인 -31dBFS Laeq가그기준으로선택되어 AC3 인코딩에사용되고있고, 그것을 dialnorm 이라고한다. 가. Line out mode 2CH TV나 5.1 CH TV, A/V Surround Decoder, 외부 Dolby Digital Adapter 등에사용할경우에는반드시 Line Out 모드를선택하여야한다. dialog, -31 dbfs LAeq 레벨에서재생된다(2CH이나모노로다운믹스될경우채널당 3dB 낮음). 나. RF remod mode TV 방송을위해서 2CH로 downmix된신호를생성해야만하는경우를위해서최적화된모드이다. 기준프로그램레벨이 11dB 더높게책정되어있고, 대사(dialog) 레벨을기준으로최대 20dB의헤드룸을가지도록 peak level 을제한하고있다. Dynamic Control은항상 ON 으로되어있어야한다. 6. ChanneI Routing 디코딩하기위한 AC3파일의각채널을오디오출력을위한비압축오디오파일의 각채널에지정한다. 6 개의지정된모드와사용자모드를제공하며, "Front Left" 에 "Output 1" 을지정하면 AC3 파일의 Front Left 채널을비압축오디오파일의첫번 째채널에디코딩한다. 그림 24. 출력채널경로설정 -34-
7. Scale factor 이파라미터는 0에서 1.0 사이의소수값을가지며, 최종출력데이터를오디오출 력버퍼에쓰기전에데이터를조정하는데사용된다. 이값이 0이면오디오파일에 는어떤소리도들어가지않는다. 8. Cut scale factor (Dynamic range scale factor : high level signals) 이파라미터는 0에서 1.0 사이의소수값을가지며, dynamic range scale control word의 high-level signal 을조정하는데사용된다. 이값이 0이면고급압축을하지않는다. 압축모드가 RF mode 로설정되어있으면이값은무시된다. 9. Boost scale factor(dynamic range scale factor : low level signals) 이피라미터는 0에서 1.0 사이의소수값을가지며, dynamic range scale control word의 low-level signal 을 조정하는데 사용된다. 이 값이 0이면 low-level amplification 을하지않는다. 압축모드가 RF mode로설정되어있으면이값은무 시된다. 10. Dual mono reproduction AC3 파일이 dual mono 로인코딩되어있을경우, 각각의모노구조로 stereo, mixed mono, left mono, right mono 형태로디코딩한다. -35-
11. Bitsteam information Input AC3 file information중 Bitstream config와 Etc는 AC3파일의 bitstream에저장되어있는여러가지정보를나타낸다. 이정보는디코딩할때아주중요한정보로쓰이게된다. 그림 25. 비트스트림정보그림 26. 비트스트림기타정보 12. Production information Production information 탭은돌비디지털비트스트림내부에존재하는믹싱레벨과 룸타입파라미터와 Dialog normalization 값을나타낸다. Channel 2 탭은 AC3 파 일이 dual mono 형태로인코딩됐을때 2번째 mono의 prodution information이 다. 제 4절 AC3 인코딩성능 실험에사용된원본파일은 5.1 채널, 파일사이즈는 31,767,576 Bytes, 44.1kHz 샘플링율을가진파일이다. 사용된 PC는 Pentium4, l.7ghz, 256MB로서 Windows2000 Professional 운영체제에서테스트하였다. 성능실험결과는 4가지경우의압축특성과 3가지의 Data Rate에따른인코딩 CPU 시간과인코딩결과인 AC3 파일의크기및압축률을나타낸다. -36-
표 13. AC3 인코딩성능요약 네가지경우의압축특성에대해 3가지 Data Rate를테스트한결과를위와같은결과를얻을수있었다. 압축률인 Reduction rate는 AC3 파일의크기/ 원본파일의크기를백분율로나타낸것이다. 5.1채널을인코딩할경우권장하는 Data Rate인 224-640kbps 중에서 3가지경우를테스트한결과약 5.3% 에서 15.12% 정도로파일크기가축소된것을알수있다. 대체적으로 CPU 시간은압축특성과관계없이 Data Rate 에따라결정된다는것을알수있다. 제 5절 MP4 인코더 본절에서는 MP4 인코딩과정을화면캡쳐를통해그림으로설명한다. MP4 인코 딩을할수있는파일은 2채널용으로는 wav, mp3 등이있으며 5.1채널을지원하 려면확장 wav 파일을사용하면된다. 2채널용 mp3 파일은우선 wav로변환되어 편집창에뜨게되므로 MP4로의인코딩시에는 wav 파일과동일하게취급된다. 여기 서는다채널 MP4 인코딩의예를보여주기위해 5.1채널확장웨이브파일을예로 설명한다. -37-
그림 27. MP4 인코딩을하기위한원본 Wav 파일을읽어들인다. 5.1채널확장웨이브포맷파일을읽어들이면 5.1채널에파형이각각읽어들여져서디스플레이된다. 그림 28. MP4 파일로 export ( 즉인코딩) 하는메뉴를선택한다. -38-
그림 29. MP4 인코딩옵션창이뜨는데여기에서각종옵션을조정하게된다. 자세한것은인코딩옵션을참고하라. 그림 30. 원본웨이브파일이 5.1채널로 6개의채널을사용하므로디폴트로 5.1 채널이선택되게된다. 5.1채널이하의것을사용하게되면내부적으로믹싱되어인코딩된다. -39-
그림 31. 샘플링율도원본웨이브파일이 44.1 khz 이므로기본적으로 44.1 khz 로지정되어있고, 이를변경할수있다. 원본의샘플링율보다낮은샘플링율로만선택될수있도록콤보박스내의내용이자동으로변화한다. 그림 32. 비트율은인코딩비트율테이블에서참조하여허용가능한비트율만을보여준다. 허용가능한비트율은채널과샘플링율에따라결정되게된다. -40-
그림 33. 모든인코딩옵션이결정되면출력할 aac 파일의이름을지정한다. 그림 34. 모든인코딩옵션과출력파일이름이결정되면 Encode 버튼을눌러서인코딩을시작한다. 1. MP4 인코딩옵션( 파라메터) 인코딩명령을실행하게되면그림 35와같이기본적으로원본웨이브파일의속성 ( 채널수, 샘플링율등) 이보여진다. 인코딩옵션에보면채널수와샘플링률은기본으로원본파일의것과동일하게주어진다. 여기에따라비트율도자동으로사용가능한최소비트율로세팅된다. 프로파일(Profile) 은 Main, L/C, SSR의세가지중에선택하면된다. 이창에서는기본적으로모든옵션이자동으로디폴트로세팅되므로출력파일이름만지정하고바로인코딩해도된다. -41-
MP4 인코딩옵션은크게 6 가지로구분된다. 그림 35와같이 Profile, Channel, Sampling rate, Bit rate, Header Type, Resolution 으로구분된다. 여기서 Header Type과 Resolution은현재버전에서는각각 ADTS와 16 비트로고정되어있다. 프로파일(Profile) 은 Main, L/C (Low Complexity), SSR(Scalable Sampling rate) 의 3 가지중에서선택하게되어있다. L/C 프로파일은계산속도가가장빠르지만, 가장좋은품질을원하면 Main 프로파일을사용하면된다. 그림 35, MP4 인코딩옵션창이뜨는데여기에서각종옵션을조정하게된다. 기본적으로원본웨이브파일의속성( 채널수, 샘플링율등) 이보인다. 인코딩옵션에보면채널수와샘플링율은디폴트로원본파일의것과동일하게주어진다. 여기에따라비트율도자동으로사용가능한최소비트율로세팅된다. 프로파일(Profile) 은 Main, L/C, SSR 의세가지중에선택하면된다. 이창에서는기본적으로모든옵션이자동으로디폴트로세팅되므로출력파일이름만지정하고곧바로인코딩해도된다. 채널수(Channel) 와샘플링율(Sampling rate) 은디폴트로원본파일의것과동일하게주어진다. 여기에따라표 14에따라비트율도자동으로사용가능한최소의비트율로세팅된다. 디폴트이외의것을사용하고자하는사용자는비트율콤보박스에서원하는비트율로세팅할수있다. -42-
표 14. MP4 인코더비트율범위 제 6절 MP4 디코더 MP4 디코딩과정을그림으로설명한다. *.aac라는확장자를가진파일을디코딩할수있으며, 현재는 16bit. ADTS 헤더로된 aac 파일만디코딩가능하다. 현재 5.1 채널의 aac 파일은 5.1 채널확장 wav 파일로디코딩된다. 또한디코딩시에실시간으로 2 채널로미리듣기를할수있다. -43-
그림 36. 먼저빈채널프로젝트를연다. 디코딩된후에디코딩된웨이브파일이이곳으로읽어들여진다. 그림 37. Import( 즉, 디코딩) 메뉴에서 AAC 파일메뉴를클릭한다. -44-
그림 38. 디코딩시에는별다른옵션을지정할필요가없이채널프로젝트의샘플링율에따른확장 wav 파일이생성된다. 그림 39. 먼저디코딩할 aac 파일을선택한다. 그림 40. 디코딩된파일이저장될출력파일이름을설정한다. -45-
그림 41. 디코딩후출력 wav 파일이름을지정한다. 그림 42. 만일 Stereo play를선택하게되면디코딩과동시에프론트 2채널이 실시간플레이된다. 이제 OK 버튼을눌러디코딩을수행한다. -46-
그림 43. 디코딩이끝난후에생성된확장 wav 파일이자동으로로딩된다. 그림 44. 원본 wav 파일인 all51serial.wav 파일과인코딩후디코딩된 wav 파일인 all51serial1.wav 파일을동시에비교하였다. 완벽하게일치하는것으로보아인코딩/ 디코딩이잘수행되었음을알수있다. 원본파일인 all51serial.wav는 3,961KB 의크기였으나, 인코딩된 all51serial1.aac는 271KB, 다시디코딩된 all51serial1.wav는 3,961KB 의크기를가진다. 인코딩된 aac 파일은약 1/15 의용량으로압축된것을알수있다. -47-
제 7절 MP4 인코딩성능 다양한인코딩옵션에대해서압축률과 Encoding 시간을보았다. 원본파일은 5.1 채널, 파일사이즈는 31,781,460 Bytes, 44.1kHz 샘플링율을가진파일이다. 사용된 PC는 Pentium4, 1.7GHz, 512MB로서 Windows2000 Professional 운영체제에서테스트하였다. 표 15. 세가지프로파일과 2 가지샘플링율, 2가지비트율에따른인코딩 CPU 시간과인코딩결과인 aac 파일의크기및압축률을나타낸다. 세가지프로파일에대해 2가지샘플링율과 2가지비트율을조사한결과위의표 15 와같은결과를얻을수있었다. 여기에서압축율인 Reduction rate은 AAC 파일 의크기/ 원본파일의크기를백분율로나타낸것이다. 약 6.8% 에서 9.9% 정도로 파일크기가축소된것을알수있다. 대체적으로 CPU 시간은 Main > L/C > SSR 의순서로시간이걸리고압축율은 Main < L/C < SSR 의순서로된다는것을알 수있다. -48-
제 8절음질평가 다채널압축포맷인 MP4와 AC3 오디오데이터의음질을평가하기위하여 ITU-R의권고안에근거하여음질평가실험을실시하였다. ITU-R의권고에서는멀티채널스테레오방송의음성시스템을그림 45 와같은스피커배치로하고있다. 그림 45. ITU-R 권고에근거한멀티채널스피커배치 그림 45와같이앞방향 3, 뒤방향/ 옆방향 2 개의스피커의조합이다. 단, 뒤방 향/ 옆방향스피커는보다큰청취영역에대해서는 2보다더많은수의스피커를 이용한다. L.R의스피커는청취영역으로부터 60 도각도를기준으로하고있지만, 영상과의 관계에대한주의를언급하고있다. 앞방향스피커를직선으로설치할경우필요 에따라서중앙스피커에시간지연을보상한다. 뒤방향/ 옆방향스피커는앞중앙보다 100도에서 120 도범위이내에설치하고, 정확한배치는필요하지않다. 뒤방향/ 옆방향스피커에시간지연을보상하지않 는경우에는, 이스피커들은앞방향스피커보다가까워서는안된다. -49-
앞방향스피커는이상적으로는청취자의귀의높이와거의같은높이에설치하고, 음향투과형스크린이아닐경우에는중앙스피커는스크린의바로위나밑에두어 야한다. 뒤방향/ 옆방향스피커의설치높이는정확하지않아도된다. 2 개 이상의 뒤 방향/ 옆 방향의 스피커를 이용할 경우에는 정 중앙선으로부터 60~150 도의원호상에대칭이고, 등간격으로배치한다. 2 개이상의뒤방향/ 옆방향의스피커를대칭배치한경우, LS신호는실내의왼쪽 의뒤방향 / 옆방향스피커에공급되고, RS 신호는실내의오른쪽뒤방향/ 옆방 향스피커에공급된다. 신호의합이득은 LS( 또는 RS) 의전체파워가 1개의스피커 로재생한파워와같도록조절한다. 이와같은실험조건에서 20/30대로이루어진 11명의피실험자로하여금압축전의 오디오를들려주고다시압축후의오디오를들려준후압축된오디오의음질을압 축전의오디오와비교하여 3 단계의점수를주도록하였다. 표 16는실험의조건과 결과를나타내고있다. 표 16. 음질평가환경및결과 조건 비고 실험장소 오디오데이터 음향실 한국대중음악 ( 가수: 포지션, 제목: 마지막약속) 오디오시스템 5.1 개인용컴퓨터 채널사운드카드 5.1 채널오디오스피커시스템 AC3 MP4 평가 평가 열등보통우수 0명 3명 8명 0명 2명 9명 음질평가에서 열등 은압축하지않은오디오에비해압축후오디오데이터음질이매우많이저하되었음을나타내고, " 보통 은압축후오디오데이터가거의압축전과비슷할경우를나타내며, " 우수 는압축후오디오데이터가압축전의음질과거의같거나우수할경우를나타낸다. 실험결과를정리해보면일반적으로 AC3 또는 MP4 포맷으로압축을했을경우, 압축전과비교하여음질의차이를거의느낄수없는것으로나타났다. -50-
제 5 장기대효과 본과제에서개발된 AC3, MP4의인코더및디코더모듈과편집도구는일반적인 PC 환경에서 HDTV 용오디오컨텐츠를제작하고재생할수있으며, 인터넷, 가전, 오락, 통신등다양한응용분야로의산업적인파급효과는매우클것으로예상된다. 다음표 17 은목표시장규모이다. 표 17 목표시장(* 서비스업총조사보고서(1999.12. 통계청), 광고연감(1999)' 을근거로하여작성 ) 구분 목표시장 ( 국내) 규모 ( 단위 : 백만원 ) 내용및특성 2002 2003 규모추정근거 = 방송컨텐츠산업총매출의 1% 75,675 90,743 + 광고컨텐츠산업총매출의 1% 디지털음향컨텐츠는활용되지않는곳이없을정도로교육, 오락, 영화, 군사, 광고등모든분야에서활발히사용되고있다. 그러나그수준이초보적인수준을벗어나기힘든것은효율적인제작도구를가지고있지못한것이큰원인이라할수있다. 따라서, 국내에서자체개발한저렴하고사용하기편리한제작도구가있다면전산업분야에서활용될수있는디지털음향컨텐츠를보다고급의제품으로만들수있을것이며그러한제품들이창출해낼부가가치는엄청날것이다. 수행결과는영화/DVD/ 비디오/TV 프로그램, 애니메이션, 게임, 시뮬레이터, 원격교육/ 훈련용컨텐츠등을제작하는분야에서활용될수있으며, 외국의제작도구를대체하여다양한종류의디지털음향컨텐츠를보다고부가가치의상품으로개발할수있게될것이다. - 디지털 TV 음향컨텐츠제작이가능한시스템은 Stand-alone 제품으로상용화되어도그응용분야가많아서사회의각분야에파급효과가있음. - 게임및멀티미디어컨텐츠방송용음향컨텐츠제작시에고급음향효과처리도구로서활용. - 국내에서는음향효과구현에있어대부분외국에서구입한오디오신호편집도구를사용하여디지털컨텐츠제작등에활용하고있는실정인데개발된시스템의상용화를통한수입대체효과가기대됨. - 다양한음향효과제작기능을통해게임및멀티미디어음향컨텐츠제작의고급화및고부가가치화에기여. - 향후디지털 TV가일반화되면디지털 TV의표준이되고있는 MPEG2에기반한영상물과멀티채널에기반한음향물이많이보급될것임. 그때에는입체음향은물론이고멀티채널지원을할수있는입체음향기술및입체음향편집기에대한수요가급증할것임. -51-