38 특집 : 차세대방송표준기술 특집 차세대방송표준기술 ATSC 3.0 오디오코덱표준화동향 오현오, 홍성진, 곽진삼 / ( 주 ) 윌러스표준기술연구소 I. 서론 북미의방송표준을제정하는기구인 ATSC 에서는 ATSC 3.0이라는프로젝트로 UHD 방송표준을한참제정하고있다. 여정의긴시작은 2012 년에시작되었고, 2015 년말에는표준화과정의가장중요한마일스톤인후보표준 (Candidate Standard) 을완성하는것을목표로마무리단계에진입해있다. 방송표준을구성하는여러레이어및기술요소들이주요이슈들을대부분해결하고표준문서작업이완료된가운데, 오디오시스템은많은이해관계자들의높은관심이모인가운데아직표준화여정이한참진행되고있다. ATSC 3.0의오디오표준제정이 ATSC 내에서크게관심이있어온이유는일정이늦어진이유도있지만, 후보기술간의경쟁구도가첨예하게놓여져있기때문이기도하다. 경쟁하는후보 기술을선정하기위한잣대를구체적으로결정하는 CfP(Call for Proposal) 가발행되었고, 현재의 HD 방송표준인 ATSC 1.0 표준을보유한디펜딩챔피언 Dolby와유럽시장과모바일시장을석권하고있다고할수있지만북미시장관점에서는도전자인 MPEG국제표준진영의대결구도가형성되었다는점등여러흥행 (?) 요소가오디오표준제정과정에존재했다. 그결과가장최근 (2015년 9월 23일 ) 회의인워싱턴 DC 인근에서열린 F2F 회의 (face-to-face, 오프라인대면회의 ) 에는역대최대인원이라고봐도될약 120 명의방송업계전문가들이현장및전화로참석하여열띤토론으로오디오코덱결정을위한논의를진행하였다. 본기고에서는이회의가있기까지 ATSC 3.0 오디오코덱표준화과정을정리한다. 38 방송과미디어제 20 권 4 호
ATSC 3.0 오디오코덱표준화동향 423 II. ATSC 표준기구및표준화절차 1. ATSC 표준기구및 ATSC 표준소개 업전반에미치는영향이매우클것으로예상된다. 2. ATSC 3.0 표준화절차 ATSC(Advanced Television Systems Committee) 는방송기술에관한표준을제정하는비영리표준화단체이다. ATSC는 1982년 JCIC (Joint Committee on InterSociety Coordination), EIA(the Electronic Industries Association), NAB(National Association of Broadcasters), NCTA(National Cable Telecommunications Association) 및 SMPTE(Society of Motion Picture and Television Engineers) 의회원들이주축이되어텔레비전시스템에관한모든기술을아우르는기술표준을제정하기위해설립되었다. 현재방송사, 전자제품제조사, 방송장비제조사등디지털방송과디지털방송관련산업을대표하는 200여개의회원사가 ATSC 에참여하고있다. ATSC 는 1990 년대초 HD 화질의디지털방송을지원하는디지털방송표준인 ATSC 1.0 표준을제정한바있다. 이후, ATSC 는 ATSC 1.0 표준과양립가능한양방향방송과하이브리드방송을위한표준인 ATSC 2.0 표준을제정하였으며, 현재는 ATSC산하서브커미티중하나인 TG3(Technology Group 3) 를통해차세대 UHD 방송을위한방송표준인 ATSC3.0 표준을제정하고있다. 현재, ATSC 는 DVB-T 다음으로많은사용자를확보하고있는지상파디지털방송표준이다. 미국, 캐나다, 멕시코를비롯한북중미국가와대한민국이 ATSC 표준에기반한디지털방송을송출하고있다. 북중미시장이소비자전자제품시장에서큰비중을차지하고, ATSC 3.0 이 UHD 방송을위한선구적표준임을고려할때, ATSC 3.0 표준이경제및방송산 ATSC 3.0 표준을제정하는 TG3는산하에각기술레이어및기능단위로분류된 4개의스페셜리스트그룹 (Specialist Group) 을포함한다. 스페셜리스트그룹중 S34는 Applications and Presentation 레이어로서오디오및비디오에관한기술을다룬다. S34 는다시세부기술에따라나뉘어진서브그룹을운영한다. 서브그룹중 S34-2 가오디오기술에관련한표준을제정하는오디오서브그룹이다. 오디오서브그룹은각회원사의참여위원들의논의를통해선정된기술을표준에포함될후보기술로 S34에추천한다. 이때, 오디오서브그룹은 기술적인 범주에서만논의를진행한다. 오디오서브그룹은회원사들의이러한논의과정을통해선정된기술과합의된사항을 draft document 로만들어 S34 에상정한다. S34 는이에대해 기술외적인 여러요인을함께고려하여표준문서의초안이라고할수있는표준초안 (Working Draft) 을만든다. S34-2 와 S34 회의는소위합의 (Consensus) 기반의의사결정을수행한다. S34-2 의참여위원이사실상 S34 참여위원이기도하다. 따라서 S34-2 에서합의가잘이뤄질경우, S34 에서는별다른논의없이바로표준초안을 TG3 에추천한다. 추천된표준초안은 TG3 에서일정자격요건을갖춘기관들이각각 1표씩을행사하는투표절차 (ballot) 를통해승인이된다. 표준초안이승인되면, 표준초안은후보표준 (Candidate Standard) 으로승격되거나바로제안표준 (Proposed Standard) 으로승격된다. 표준초안이후보표준으로승격되면, TG3는 TG3의모든회원사가참여하는후보표준안에대 2015 년 10 월 39
424 특집 : 차세대방송표준기술 한구현과기술리뷰를진행한다. 후보표준에대한구현및기술리뷰과정에서후보표준이 TG3가선정한요구사항을모두만족하는것으로확인되면, TG3는후보표준을제안표준으로승격한다. 이러한리뷰과정에서후보표준은개정될수있으며, 일정요건을만족하지않는것이발견된경우다시표준초안상태로강등될수있다. 제안표준이제정되면, ATSC 는제안표준을 ATSC 의정식표준으로승격할것인지결정하는투표절차 (ballot) 를진행한다. 이러한투표절차에는일정한자격요건을갖춘 ATSC 회원사들이참여한다. 투표절차를통과한제안표준은마침내 ATSC 의정식표준으로승인된다. 2. CfP 요약 ATSC 3.0 의오디오시스템을선정하기위한기술공개모집인 CfP는 2014 년 12월에공식 Issue 되었다. CfP는복수의후보기술이제안되었을때이들에대한평가방법을구체화하여기술한다. 구체적으로 CfP는 Proponent( 기술제안사 ) 가처음후보기술을등록하는과정에서부터후보기술에대한성능평가방법그리고최종선정방법까지기술하여, 공개문서인 CfP만을참조하더라도후보기술을제안하고또평가하는것을가능하게한다. CfP 는 S34-2 참여위원들의참여에의해만든문서로써다음과같은주요내용을포함한다. III. ATSC 3.0 오디오시스템표준화및 CfP 1. S34-2 오디오서브그룹표준화진행상황 S34-2 에서는복수의후보기술이시장에존재하여이들을선정하기위한절차로써 CfP(Call for Proporal) 을만들기로결정하였다. 2013 년하반기에 CfP를만들기로결정한이래 1년여의긴시간동안예비기술제안사를포함한여러전문가들이참여하여다양한관점에서논의를한끝에 2014 년 12월에야비로소 CfP를완성하고발행하였다. 이후 CfP 표준절차에따라후보기술이제안되면, 이에대한경합및선정과정을통해 2015 년 8월에후보기술을선정하고, 선정된후보기술을 S34에추천하는일정을계획하였다. 그러나, 최종선정단계에서남아있던 2개후보기술에대한참여기관간의지지의견이엇갈려합의가이뤄지지않았다. 1) ATSC 3.0 의오디오시스템요구사항 ATSC 3.0 시스템요구사항자체는 TG3에서승인하여 2014 년초에공식 Issue 된별도의문서에기재되어있으며 [1], CfP에서는이가운데오디오시스템과관련된내용만을추려나열하고있다. 제안된시스템은 CfP에기재된시스템요구사항을모두만족할것을요구한다. 다음장에주요요구사항을다시정리하였다. 2) 오디오시스템평가방법및절차 Proponent Registration: S34-2의회원사가기술제안사로최초등록하기위해서는제안하는회사에대한소개, 제안하는기술에대한개요, 추후진행될음질평가를수행할수있는시설보유여부등을기재한문서를등록신청서와함께제출하여야한다. Precertification( 사전인증 ): 등록내용을 ATSC 가승인하고나면, 기술제안사는즉시사전인증절차에들어간다. 사전인증단계에서는 40 방송과미디어제 20 권 4 호
ATSC 3.0 오디오코덱표준화동향 425 상세한기술문서와함께 ATSC 에서제공한테스트음원샘플을부호화하고복호화한음원파일, 그리고해당음원파일에대해 ITU-R BS.1116 표준 [3] 에기반한자체주관적음질평가결과를제시하도록되어있다. 여기서상세한기술문서는기술문서자체만으로시스템을구현할수있을정도의상세함이요구된다. 통상다른기관에서표준화된기술인경우, 해당표준문서를함께제출한다. 자체적으로행해지는주관적음질평가는 ITU-R BS.1548 [4] 에따라 5점만점에 4.0 이상의점수를유지하는여부와이를위해필요한 bitrate 를제시하도록되어있다. Phase 1 - 공식음질평가및특징평가 : Phase 1 평가는사전인증을통과한후보기술에대해서본격적으로비교음질평가를포함하는과정이다. 오디오시스템선정의핵심요인은실제서비스에서사용될비트율, 포맷, 재생환경등의시나리오에서어떤기술이가장좋은음질을보이는지에있다. 이를평가하기위해 S34-2 는 ITU-R BS.1534 표준 ( 일명 MUSHRA, [5]) 에따른비교음질평가방법을수행하였다. 본평가방법에대한결정은앞서 CfP 작성과정에서각기술제안사별로가장첨예하게입장이나뉘어서합의에많은시간이걸린부분이기도하다. < 표 1> 은 Phase 1 평가중코덱성능평가항목에서사용된콘텐츠포맷및비트율을정리한것이다. 코덱성능평가이외에몰입감에대한헤드폰평가 (Immersive Headphone Test) 역시비교음질평가항목으로포함되었다. ATSC 3.0이강력하게지향하고있는방향중하나가모바일기기에서의방송시청인데, 이경우헤드폰을통해 Immersive Sound( 몰 입감과현실감이극대화된입체음향 ) 를제공할수있는지여부는코덱성능의중요한평가지표라할수있다. Phase 1 평가는비교음질평가이외에도일명기술특징평가 (Feature Evaluation) 가포함된다. 시스템요구사항의만족여부를상세히검증함과더불어 ATSC 3.0 서비스에유용한부가적인기술특징이있는경우이를제안하고, 확인하는과정이다. 그리고, 마지막으로 Phase 1 평가에응한기술제안사들은해당기술에대한데모를적극독려받았는데, 실제로 2015 년 7월에 Atlanta 의한호텔에서기술제안사가각각데모부스를열고데모를실시하였다. Phase 1의비교음질평가에서특정제안기술이비교우위를보인다면, 해당기술이표준으로추천될가능성이가장높았을것이다. < 표 1> ATSC 3.0 Phase 1 의코덱성능평가에사용된비트율 (in kbps), ±2% ( 원문 [3]) CONTENT FORMAT LOW MEDIUM HIGH Stereo 32 64 96 5.1 80 144 208 7.1+4 144 256 384 22.2 288 512 768 HOA +LFE 10 kbps/ch 20 kbps/ch 30 kbps/ch [ch=(n+1) 2 ] +4 kbps/lfe +8 kbps/lfe +16 kbps/lfe Phase 2 - 오디오시스템선택 : Phase 1의공식음질평가결과와기술특징평가결과를바탕으로하여 S34-2 는한개혹은복수의시스템에대한후보가되는표준문서를각위원들간의합의 (Consensus) 를기반으로결정하여상위그룹인 S34에추천 (Recommendation) 하는것이 Phase 2의과정이며, Phase 2가완료되면 CfP에따른절차가사실상종료된다. 2015 년 10 월 41
426 특집 : 차세대방송표준기술 3. ATSC 3.0 오디오시스템요구사항최종선정된 ATSC 3.0 오디오시스템표준은제시된 ATSC 3.0 시스템요구사항 [1] 을모두만족해야한다. 만족여부는제시된기술문서등을근거로기술제안사에서소명해야하며, S34-2 서브그룹의위원들은그만족여부를검증한다. 각각의상세한요구사항은지면관계상생략하고핵심적인특징만요약하면다음과같다. 1) 이머시브포맷과기존포맷의지원 (Immersive & legacy support): 기존시장에서널리사용되던포맷인모노, 스테레오, 5.1 채널, 7.1 채널및소위이머시스오디오를지원해야한다. 이머시브포맷의전형적인예로써표 1 의 7.1+4 채널포맷을사용하였으며, 역시표 1에제시된것과같이 22.2 채널포맷과 HOA 포맷을선택적으로제안할수있다. 2) 차세대유연한렌더링환경대응 (Next-gen system flexibility & renderer): 시스템은다양한스피커환경은물론헤드폰을통해서도이머시브오디오를재현할수있어야한다. 3) 개인화및인터렉티브제어 (Personalization & interactive control): 시스템은배경음대비대사의상대적인볼륨을조정하거나, 인터넷망을통해전송된 NRT(Non-Real Time) 오디오트랙과의효과적인믹싱, 부가오디오트랙과의믹싱등의제어기능을제공해야한다. 4) 차세대라우드니스및다이내믹레인지제어 (Next-gen loudness management & DRC): 재생오디오신호에대한라우드니스와다양한재생기기에서허용하는다이내믹레인지에대해적응할수있는기능을제공해야한다. 5) 방송시스템및제반환경대응 (Broadcast system & infrastructure): 라이브중계가가능한정도의충분히낮은시간지연, FCC의규정만족, 비디오포맷과의결합성, 오디오 / 비디오립싱크등방송시스템으로갖춰야할다양한요구사항을만족해야한다. 6) 압축성능및품질 (Compression requirements: relative performance: efficiency/quality): 최신오디오코덱으로써이머시브오디오를 ITU-R 의 BS.1548 의기준을만족할만큼높은압축율로압축할수있어야한다. IV. 제안된기술요약 2014 년 12월 CfP를이슈한후 2015 년 1월에실제기술을응모한기술제안사는당초 CfP 문서작업에적극적으로참여했던곳이기도한 DTS, Dolby, 그리고 MPEG-H Audio Alliance(MAA) 의 3개회사 ( 혹은연합 ) 였다. MAA는 Fraunhofer IIS, Technicolor, Qualcomm 의 3개회사가연합한팀이다. 각회사가제안한기술은특징은다음과같다. 1. MAA MAA는 ISO/IEC 23008-3 MPEG-H 3D Audio 42 방송과미디어제 20 권 4 호
ATSC 3.0 오디오코덱표준화동향 427 ( 이하 3DA) 에해당하는국제표준기술을제안하였다. 3DA는 22.2 채널까지의채널포맷은물론객체 (Object) 오디오및 HOA(High Order Ambisonics, 고차앰비소닉스 ) 라는신호포맷까지를입력으로수용하여, 시장에존재하는기술중가장높은압축성능을가질뿐아니라임의의스피커레이아웃을위한포맷컨버전기능, 헤드폰을통한이머시브사운드제공을위한바이노럴렌더링기능등을하나의표준안에모두포함한종합솔루션이다. 기존 MP3, AAC 등모바일시장에서널리쓰이는오디오코덱을개발했던국제표준기구로써, MAA의제안사이외에도표준에참여했던많은글로벌기업들이잠재적특허권자로써직접적이해관계를가지고있을것으로예상된다. 제안된기술중유일하게특정회사의단독소유기술이아닌국제표준기구의표준화를통해완성된기술이기도하다. 3DA는표준화과정에서부터 ATSC 3.0 표준에정조준하여일정과내용을진행하였기때문에, 해당표준의요구사항을만족하는데는문제가없을것으로예상되기도했다. 가장효과적인압축성능과모바일에서의호환성을중요장점으로생각할수있는반면, 북미시장의경우기존방송인프라에적용된사례가없고, 북미의지원인프라가충분치않을것이라는점이단점으로지적되었다. 2. Dolby Dolby 는기존 ATSC 1.0인북미및국내 DTV 표준의오디오코덱인 AC3를소유한회사로써, 이번기술제안은일종의디펜딩챔피언으로써의참여성격이짙다. Dolby 가제안한기술은 AC4 라는신규표준에기반한시스템으로써, ETSI 를통해국제표준문서등록을진행한표준이기는하나 Dolby 가 사실상독점한기술로볼수있다. AC4 는 Version 1 과 Version 2 기술로나뉘는데, Version 2에와서야 ATSC 3.0의모든요구사항을만족할수있는, 특히객체오디오에대한송수신이가능한기술이다. AC4 개발과정은철저히 Dolby 사내부의연구개발을통해진행된절차이고, 표준문서및기술제안서를통해공개된내용이외의정보를알수없기때문에 MAA에견주면기술에대한상세한장단점파악이어렵다. Dolby가 2000년대후반기존 MPEG SBR 등의표준기술을개발하던독일의 Coding Technologies 라는회사를인수하여이팀이 AC4 개발에주도적으로참여한것으로추정되는바, SBR 등 Coding Technologies 사가가지고있던기술들이 AC4에대거사용되었을것으로예상할수있다. Dolby 는또한극장용사운드트랙생성및렌더링을위한기술인 Dolby ATMOS 라는기술기반의인프라를시장에적극적으로확산하는과정에있기때문에, 이를근간으로그리고기존 AC3 기반의시스템에서축적된노하우등을근거로북미방송 / 컨텐츠제작사들로부터높은지지를받을것으로예상되었으며, MAA 대비시단독개발한기술의한계로압축성능에서약점을가질점이우려되기도했다. 3. DTS DTS 는 ATSC 2.0 표준의툴박스에포함되기도한 DTS-HD라는표준이있지만, 이보다는 DVD, Bluray 등의디스크미디어를통해널리알려진 DTS, DTS-HD 코덱을가진회사로써, 상대적으로데이터를많이쓰는대신 ( 압축을덜하는대신 ) 더고음질을추구하는사용자를위한코덱기술로포지셔닝하고있는회사이며, 이번표준화참여시의전 2015 년 10 월 43
428 특집 : 차세대방송표준기술 략도그와같은지위였던것으로보인다. ATSC 3.0 에는 DTS:X 라는기술패키지로제안을하였으며, 이안에 ATSC3.0 의요구사항을만족하기위한여러기술이포함된것으로발표하였다. 그런데 CfP 에따른사전인증 (Precertification) 단계에서자체음질평가결과가 4.0 에이르지못한포인트가있었던점과더불어, 제안시스템을이해하는데필요한충분한수준의문서, 즉, 표준문서를제출하지못한점이많은도전을받았다. 그리고, 사전인증단계참여이후 DTS 스스로제안철회를하게되어이후표준화일정에후보기술로참여를하지않았다. V. 경과및결론 본원고마감이있던 2015 년 9월말현재 ATSC 는 3.0을위한오디오시스템을결정하지못했다. CfP를발행하기위한기간이길어지면서비디오, 시스템등다른부분들의표준화일정에비해시간이많이늦춰진것이큰원인이다. 또한후보기술중 DTS가일찌감치철회를하여 2파전양상이되었고, ATSC 참여회원사들의입장이 MAA와 Dolby 로양분되어어느한쪽으로컨센서스를모으기어려운상황이었던점도표준결정에어려움을 주었다. 가장최근의 S34-2 회의 (2015 년 9월 23 일 ) 에서는이와같은 deadlock 상황의결론으로써, 오디오서브그룹단계의활동은 MAA와 Dolby 가제안한기술모두를 Draft Document 로작성하여 S34에올리는것으로합의하였다. 이과정에서도일부반대의견이있었다. MAA와 Dolby 제안기술모두 ATSC3.0 오디오시스템의모든요건조건을충족하였고두기술간의기술적인우열을판단하기어렵기에, 두기술모두 S34-2 에서는 졸업 시키자는결론이다. 이후의판단은기술외적인모든요소를같이고려하여 S34 에서다시논의가진행될예정이며, 표준화마일스톤을고려할때 2015 년 10월중에는 S34 에서도결론을낼것을기대하고있다. ATSC 는북미지상파수신자를고려한시장의크기보다는콘텐츠생성의거대중심인북미시장의방송표준이라는상징적의미가더큰곳이기에여러이해관계자들의입장이첨예하게부딪히며높은관심을갖는가운데표준화가진행되고있다. HD 방송을 ATSC 1.0 기반으로사용하고있는국내의경우도지상파 UHD 방송표준제정에있어 ATSC 표준의방향으로부터완전히자유롭기는쉽지않다. 그런이유로 ATSC 3.0 오디오표준의향후진행에대해서도계속해서관찰되어야할것으로보인다. 참고문헌 참고문헌 [1] ATSC TG3-S31-087r10, ATSC 3.0 System Requirements, Advanced Television Systems Committee, Washington, DC, 2014. [2] ATSC S34-11r4, Call for Proposals: ATSC 3.0 Audio System, Advanced Television Systems Committee, Washington, DC, 2014. [3] ITU-R Recommendation BS.1116-2, Methods for the Subjective Assessment of Small Impairments in Audio Systems Including Multichannel Sound Systems, International Telecommunications Union, Geneva, Switzerland, 2014. [4] ITU-R Recommendation BS.1548-4, User requirements for audio coding systems for digital broadcasting, International Telecommunications Union, Geneva, Switzerland, 2013. 44 방송과미디어제 20 권 4 호
ATSC 3.0 오디오코덱표준화동향 429 필자소개 오현오 - 1996 년 2 월 : 연세대학교전자공학과졸업 ( 학사 ) - 1998 년 2 월 : 연세대학교대학원전자공학과졸업 ( 석사 ) - 2002 년 8 월 : 연세대학교대학원전기전자공학과졸업 ( 박사 ) - 2010 년 8 월 : LG 전자 Digital TV 연구소책임연구원 - 2011 년 3 월 : 연세대학교전기전자공학과연구교수 - 2015 년현재 : ( 주 ) 윌러스표준기술연구소연구위원 - 2015 년현재 : 가우디오디오랩 ( 주 ) 대표이사 - 주관심분야 : 오디오 / 방송표준화, 이머시브오디오, 오디오 / 음성신호처리, 가상현실 홍성진 - 2007 년 2 월 : 서울대학교전기공학부졸업 ( 학사 ) - 2010 년 2 월 : TOPFIELD 근무 - 2012 년 11 월 : 제 49 회변리사시험합격 - 2015 년 6 월 : 한미르특허법률사무소방송표준 / 비디오코덱표준기술담당변리사 - 2015 년현재 : 윌러스표준기술연구소선임연구원 - 주관심분야 : 차세대방송 / 통신표준 곽진삼 - 1998 년 2 월 : 서울대학교전기컴퓨터공학과졸업 ( 학사 ) - 2000 년 2 월 : 서울대학교전기컴퓨터공학과졸업 ( 석사 ) - 2004 년 8 월 : 서울대학교전기컴퓨터공학과졸업 ( 박사 ) - 2005 년 10 월 : Georgia Institute of Technology, 박사후연구원 - 2006 년 12 월 : University of Texas at Austin, 박사후연구원 - 2012 년 10 월 : LG 전자차세대통신연구소책임연구원 - 2015 년현재 : 윌러스표준기술연구소대표이사 - 주관심분야 : 차세대방송 / 통신표준, 5G 응용기술, 가상현실 2015 년 10 월 45