02본문

Similar documents
: AA ( ) TV : ios ( ).. 2

(JBE Vol. 21, No. 3, May 2016) HE-AAC v2. DAB+ 120ms..,. DRM+(Digital Radio Mondiale plus) [3] xhe-aac (extended HE-AAC). DRM+ DAB HE-AAC v2 xhe-aac..

02본문

02본문

OMA Bcast Service Guide ATSC 3.0 (S33-2) T-UHDTV 송수신정합 Part.1 Mobile Broadcast (Open Mobile Alliance) 기반 Data Model ATSC 3.0 을위한확장 - icon, Channel No.

02본문

MPEG-4 Visual & 응용 장의선 삼성종합기술원멀티미디어랩



08김현휘_ok.hwp

2 PX-8000과 RM-8000/LM-8000등의 관련 제품은 시스템의 간편한 설치와 쉬운 운영에 대한 고급 기술을 제공합니다. 또한 뛰어난 확장성으로 사용자가 요구하는 시스템을 손쉽게 구현할 수 있습니다. 메인컨트롤러인 PX-8000의 BGM입력소스를 8개의 로컬지

그림 2. 최근 출시된 스마트폰의 최대 확장 가능한 내장 및 외장 메모리 용량 원한다. 예전의 피쳐폰에 비해 대용량 메모리를 채택하고 있지 만, 아직 데스크톱 컴퓨터 에 비하면 턱없이 부족한 용량이다. 또한, 대용량 외장 메모리는 그 비용이 비싼 편이다. 그러므로 기존

02손예진_ok.hwp

서 인코딩한 데이터를 무선으로 송신하기 위한 무선 송신 수단; 및 통화중 상기 입력 수단으로부터의 음원 데이터 전송신 호에 따라 상기 저장 수단에 저장되어 있는 해당 음원 데이터를 상기 디코딩 수단에 의해 디코딩하고, 상기 디코딩한 음원 데이터와 상기 입력 수단을 통해

(JBE Vol. 22, No. 6, November 2017) UHD(Ultra High Definition), , UHD 2012, 2015, 5. UHD ATSC(Advanced Television System Commi

Microsoft Word - 09 장대영(특집)-3차 81~90

(JBE Vol. 22, No. 6, November 2017) UHD(Ultra High Definition), , UHD 2012, 2015, 5. UHD ATSC(Advanced Television System Commi

(JBE Vol. 23, No. 6, November 2018) (Special Paper) 23 6, (JBE Vol. 23, No. 6, November 2018) ISSN 2

(JBE Vol. 22, No. 6, November 2017) (Special Paper) 22 6, (JBE Vol. 22, No. 6, November 2017) ISSN 2

차세대방송표준포럼단체표준 ( 국문표준 ) 제정일 : 2016 년 3 월 30 일 지상파 UHDTV 방송송수신정합 - 파트 1. 서비스및시스템요구사항 Transmission and Reception for Terrestrial UHDTV Broadcasting Servi

소수, 비트심도 (bit depth) 10~12bit 로색을표현하며, 컬러포맷 4:2:2 이상으로큰화면에서더욱섬세하고자연스러운영상의표현이가능하다. 또한동일디스플레이크기에서는물리적인화소의크기가더욱작아지게됨으로써시청거리가짧아져도화소간격 (pixel pitch) 을인지할수없

KRNet 2005 DMB Visual Radio - The New Interactive Radio Show SBS 기술연구소 오건식

02본문


목 차

19_9_767.hwp

Editorial MPEG 표준화관련최근동향소개 ETRI 차지훈그룹장 MPEG 표준화관련최근동향소개 많은 ICT 기술들이그러하듯미디어기술도하루가다르게진화하고있다. 10년전만해도모바일단말에서동영상을자유롭게소비하는것이쉽지않았으나, 이제는누구나일상에서즐기는보편화된서비스가되었

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Jun.; 27(6),

02본문

이 발명을 지원한 국가연구개발사업 과제고유번호 A 부처명 지식경제부 연구관리전문기관 연구사업명 IT핵심기술개발 연구과제명 융합형 포털서비스를 위한 이용자 참여형 방송기술개발 기여율 주관기관 전자부품연구원 연구기간 2008년 03월 01일 ~ 2

표지

,,, 3D, 3D 3D. 3DTV,,, [1][2].,, (frame-compatible) 3D [3][4]. 3DTV, 3DTV, 3DTV DTV [5]. 3DTV,, 3. 3DTV MPEG-2 (ISO/IEC ) [6] 3DTV (dual

PowerPoint 프레젠테이션

<C1B6BBE D303720B5F0C1F6C5D0C4DCC5D9C3F7C1A4C3A5B5BFC7E228B0A1C0BBC8A3292E687770>

歯3이화진

BT.709 DCI BT [ 1] TTA Journal Vo

AVN2100Kor_Ç¥Áö110818F

FMX M JPG 15MB 320x240 30fps, 160Kbps 11MB View operation,, seek seek Random Access Average Read Sequential Read 12 FMX () 2

슬라이드 1

8-VSB (Vestigial Sideband Modulation)., (Carrier Phase Offset, CPO) (Timing Frequency Offset),. VSB, 8-PAM(pulse amplitude modulation,, ) DC 1.25V, [2

. "" "",.... :...,,....,.. :..,,,..,,...,.... 2

Sequences with Low Correlation

DBPIA-NURIMEDIA

SIGIL 완벽입문

EDIUS 7 & DaVinci Resolve 11 Workflow

방송공학회 논문지_최정아_심사용.hwp

멀티미디어 콘텐츠 접속을 위한 사용자인증 시스템_교열(박세환, ).hwp

Disclaimer 본 자료는 제안된 IP공모와 관련하여 기관투자가와 일반투자자들을 대상으로 실시되는 presentation에서의 정보제공을 목적으로 티브이로직 (이하 회사 )에 의해 작성되었으며 이의 반출, 복사 또는 타인에 대한 재배포는 금지됨을 알려드리는 바입니다

1 : MMT MPEG-2 TS (MinKyu Park et al.: An Overhead Comparison of MMT and MPEG-2 TS in Broadcast Services). MPEG-2 TS(Transport Stream) MPEG-2 (Part) [

DBPIA-NURIMEDIA

06±‚º˙µø«‚

1. Motivation 2014년베를린에서열린 IFA2014에서는삼성전자가오큘러스와합작하여개발한기어 VR을발표하며 VR시장에진출하였고, 구글은누구나손쉽게 VR 및 360 파노라마뷰컨텐츠를즐길수있도록제작된 HMD (Head-mounted Display) 인카드보드를출시

<C3E6B3B2B1B3C0B C8A32DC5BEC0E7BFEB28C0DBB0D4292D332E706466>

1 : MPEG-DASH MMT (MinKyu Park et al.: MMT-based Broadcasting Services Combined with MPEG-DASH) (Regular Paper) 20 2, (JBE Vol. 20, No. 2, Marc

01이국세_ok.hwp

그룹웨어와 XXXXX 제목 예제

28 저전력복합스위칭기반의 0.16mm 2 12b 30MS/s 0.18um CMOS SAR ADC 신희욱외 Ⅰ. 서론 Ⅱ. 제안하는 SAR ADC 구조및회로설계 1. 제안하는 SAR ADC의전체구조

Á¦3ºÎ-6Àå

À±½Â¿í Ãâ·Â

2010 산업원천기술로드맵요약보고서 - 화학공정소재

07변성우_ok.hwp

9장 프리미어 프로 CS4 시작하기

19-3DTV방송기술


스마트폰 모바일 랩 세미나

2 : MMT QoS (Bokyun Jo et al. : Adaptive QoS Study for Video Streaming Service In MMT Protocol). MPEG-2 TS (Moving Picture Experts Group-2 Transport S

(JBE Vol. 21, No. 4, July 2016) (Special Paper) 21 4, (JBE Vol. 21, No. 4, July 2016) ISSN

1 : MMT MPEG-2 TS (MinKyu Park et al.: An Overhead Comparison of MMT and MPEG-2 TS in Broadcast Services). MPEG-2 TS(Transport Stream) MPEG-2 (Part) [

이도경, 최덕재 Dokyeong Lee, Deokjai Choi 1. 서론

슬라이드 1

- 2 -

고객 카드

±Ù·Î½Ã°£ ´ÜÃà°ü·Ã ¹ýÁ¦µµ Á¤ºñ¹æ¾È.hwp

디지털TV솔루션 브로셔

master.hwp

02본문

슬라이드 1

1. 3DTV Fig. 1. Tentative terrestrial 3DTV broadcasting system. 3D 3DTV. 3DTV ATSC (Advanced Television Sys- tems Committee), 18Mbps [1]. 2D TV (High

TX-SR252-Cover.mif

제5장 비디오와 애니메이션

P017173_CH.hwp

½ºÅ丮ÅÚ¸µ3_³»Áö

272*406OSAKAÃÖÁ¾-¼öÁ¤b64ٽÚ

PART

Part Part

£01¦4Àå-2

TV방송분야

<4D F736F F D203034BCADC0E7C7F628C6AFC1FD292DC3D6C1BE>

BMP 파일 처리

(JBE Vol. 24, No. 1, January 2019) (Regular Paper) 24 1, (JBE Vol. 24, No. 1, January 2019) ISSN 2287

TV방송분야

LCD Monitor

<4D F736F F D203033C1A4BFF8BDC428C6AFC1FD292DC3D6C1BE>

$08.Tech&trend

2 라이선스 라이선스 돌비 래버러토리스의 허가를 얻어 제조한 제품입니다. 돌비 및 더블 D 심볼은 래버러토리스의 상표입니다. DivX 비디오에 관하여 DivX 는 Rovi Corporation 의 자회사 DivX, LLC가 개발한 디지털 비디오 포맷입니다. 본 제품은

2 : MMT DASH MMTP DASH segment (Hyomin An et al.: Method of Delivering DASH Segments based on MMTP for Re-use of DASH Contents under MMT Broadcasting

가상현실의완성, 가상현실오디오 그림 1. 반응형렌더링이되지않아몰입감이저하된예 Gaming VR vs. Cinematic VR 현재의 VR 시장은크게둘로나눠볼수있다. 하나는게임이가상현실로들어온가상현실게임이고, 다른하나는실사영상을기반으로한 VR ( 이하 Cinematic

KOREAN Mobile Audio Interface For Guitar & Bass USERS MANUAL


상기 DVD 플레이어는 거의 거치형(톱니형)으로 개발되어 텔레비젼, AC3 앰프 및 6개의 스피커 또는 단순 히 스테레오 시스템 등에 연결되어 영화 재생용으로만 특징지워지고, 반면에 상기 DVD-롬 드라이브는 컴 퓨터에 장착되어 소정의 인터페이스 방식을 통해 컴퓨터 테

Transcription:

95 특집 하이브리드오디오 UHDTV 를위한차세대오디오표준 : MPEG-H 3D Audio 이태진, 백승권 / ETRI Ⅰ. 서론 방송환경이점차고화질로발전해가면서, HDTV 를넘어서는 UHDTV 와같은차세대방송서비스에대한관심이증대되고있다. UHDTV 를위한오디오서비스는몰입감 (Immersive) 과개인화 (Personalization) 라는키워드로정의할수있다. 몰입감은 < 그림 1> 과같이 10.2 채널 [1] 과같은수직면까지제공하는다채널오디오기술, 헤드폰환경에서 3D 입체음향을재생하는기술등을활용하여기존스테레오나 5.1채널서비스를넘어서는현장감과사실감을제공해주는것을의미한다. 개인화는방송환경에서개인의취향에 따른오디오제어및선택이가능한서비스로스포츠중계에서아나운서 / 해설자의목소리만을크게하여좀더명료한방송을청취하거나, 관중과현장의소리를크게하여좀더현장감있는방송을청취할수있다 [2]. UHDTV 오디오서비스를위한표준기술은 MPEG 의 MPEG-H 3D Audio 와 Dolby 의 AC-4 등이있다. 두기술모두몰입감과개인화라는 UHDTV 오디오서비스를제공할수있지만, 본논문에서는차세대방송표준포럼에서선정한국내지상파 UHDTV 서비스를위한오디오표준인 MPEG-H 3D Audio 에대해서소개하고자한다. 본원고는 2016 년도정부 ( 미래창조과학부 ) 의재원으로정보통신기술진흥센터의지원을받아수행된연구임 (No.B0101-16-0295, 초고품질콘텐츠지원 UHD 실감방송 / 디지털시네마 / 사이니지융합서비스기술개발 ) 2016 년 7 월 95

300 특집 : 하이브리드오디오 < 그림 1> 10.2 채널스피커구성 Ⅱ. MPEG 오디오표준 오디오압축기술은디지털오디오신호를음질손실을최소화하면서데이터량을줄이는기술로 1980 년대후반부터기술개발및표준화를진행해오고있다. MPEG 에서는 1992 년 MPEG-1 Audio 표준 (ISO/IEC 11172-3)[3] 을시작으로 2016 년하반기표준화가예정되어있는 MPEG-H 3D Audio (ISO/IEC 23008-3)[4] 까지다양한압축률과기능을제공하는오디오압축기술에대한표준화를진행해왔다. < 그림 2> 는 MPEG 의오디오압축기술에대한역사를간략하게정리한것이다. 1.41 Mbit/s 의정보량을가지는 CD를 192kbps 로압축하기위한 MPEG-1 오디오표준은우리에게 MP3라는표준으로잘알려져있으며, DTV 방송과모바일오디오 재생장치등에많이활용되고있는 MPEG 오디오표준중가장성공적으로시장에서비스되고있다. AAC(Advanced Audio Coding) 이라는표준명으로잘알려져있는 MPEG-2 오디오표준 (ISO/IEC 13818-7) 은 128kbps 로 CD를압축하기위한기술로 DAB, DRM 등에서오디오표준으로서비스되고있다 [5]. 고주파대역이나, 스테레오에대한정보를파라미터로표현하여 64kbps 까지 CD를압축하기위한 MPEG-4 오디오표준 (ISO/IEC 14496-3) 은 HE-AAC(High-Efficiency AAC) v1/v2 로알려져있으며 DVB, DAB 등에서사용되고있다 [6]. 스테레오기반의오디오서비스에서 5.1채널과같은다채널오디오서비스가확장되어가면서, 다채널오디오에대한효율적인압축기술에대한시장의요구에따라 MPEG-D MPEG-Surround (ISO/IEC 23003-1) 표준이개발되었다 [7]. 또한 96 방송과미디어제 21 권 3 호

UHDTV 를위한차세대오디오표준 : MPEG-H 3D Audio 301 < 그림 2> MPEG 오디오압축기술의역사 다채널뿐아니라다객체오디오신호에대한압축기술인 MPEG-D SAOC(ISO/IEC 23003-2) 가 2002 년에표준화되었다 [8]. 인간의음성생성모델을기반으로하고있는음성부호화기술과, 인간의청각모델을기반으로하고있는오디오부호화기술은, 음성통신과음악방송등각각의독립적인서비스영역에서독자적으로기술발전을이루어왔다. 하지만최근방송과통신이융합하는방향으로기술이발전하면서, 음성통신과음악방송으로구분되던서비스구조가깨어지고, 더이상음성과오디오신호를별도의콘텐츠로분리하는것이어렵게되었다. 따라서하나의부호화기로음성과오디오신호모두를처리할수있는새로운부호화기술이필요하게되었다 [9]. 하지만기존의부호화기술은음성이나오디오신호의특성을기반으로서로다른목표에따라개발되었기때문에, 음성과오디오신호모두에대해우수한음질을제공할수없다. 이에따라새로운부호화기술에대한표준이요구되었고, MPEG에서는 2007년 CfP를시작으로표준화를진행하여 2012년 MPEG-D USAC(Unified Speech and Audio Coding) 표준을승인하였다 (ISO/IEC 23003-3)[10]. USAC 에대한표준화이후, UHDTV 환경에서다수의스피커를이용하여공간상의임의의위치에음원을위치시킬수있고, 정확한음상정위가가능한새로운오디오부호화기술에대한시장의요구에따라 2013 년 1월 103차 MPEG 회의에서부터 CfP를시작으로 MPEG-H 3D Audio 에대한표준을진행하였다 [11]. Ⅲ장에서는 MPEG-H 3D Audio 의요구사항에서부터, 현재까지의표준화현황에대해서기술한다. Ⅲ. MPEG-H 3D Audio 표준화현황 MPEG-H 표준은 AV 모두에대해몰입감과현장감이현저하게증가한새로운표준으로비디오 2016 년 7 월 97

302 특집 : 하이브리드오디오 < 표 1> MPEG-H 3D Audio 서비스시나리오 서비스시나리오 특징 UHD 환경에서 FOV(Field of View) 의증가에따른몰입감과현장감이증대되는상황에서, 홈씨어터 오디오는청취자주위를스피커로둘러싸서, 기존보다더많은채널을제공하여비디오와동일한수준의몰입감과 (Home theater) 현장감제공 헤드폰환경에서도다채널스피커와동일한수준의몰입감과현장감제공 개인형 TV 고화질을제공하는개인형 3D 디바이스환경에서홈씨어터에비해상대적으로작은 display 주위에 ( 상 / 하, 좌 / 우 ) (Personal TV) 스피커를배치하여향상된몰입감과현장감제공 ( 헤드폰환경도고려 ) 현대인의삶에서스마트폰은매우중요한역할을하며이러한스마트폰환경에서비디오청취는자연스러운 모바일 TV 일이기때문에, MPEG-H 3D Audio도이를고려해야함 ( 스마트폰 ) MPEG-H 3D Audio는다채널환경이기본이므로, 이를모바일환경에서전송하기위해저비트율, 저복잡도 오디오기술이필요 오디오전용서비스 비디오가없는오디오단독청취환경에대한고려도필요하며, 이경우더높은수준의몰입감과현장감을제공 < 그림 3> MPEG-H 3D Audio 평가를위한다채널오디오재현환경 의경우 HD를넘어서는 UHD 환경을고려하고있고, 오디오의경우몰입감이현저하게증가한환경에서개인화서비스를제공한다. 2012년부터새로운오디오표준에대한논의를시작하여, 홈씨어터, 개인형 TV, 모바일 TV와오디오전용서비스와같은 4개의서비스시나리오를선정하였다 [12]. 4개의모든시나리오에대해 < 그림 3> 과같이 22.2채널과같은다채널오디오신호에대한압축과다양한재생환경에적응적으로재생이가능한 Flexible rendering/downmix 기능을고려하고있다. 4개의서비스시나리오를기반으로요구사항을정의하여, 기본적인요구사항 6개와부가요구사항 2개를선정하였다. 98 방송과미디어제 21 권 3 호

UHDTV 를위한차세대오디오표준 : MPEG-H 3D Audio 303 < 표 2> MPEG-H 3D Audio 요구사항기본요구사항특징 High quality 고음질 application 을위해비트율을증가시키면 CD 수준의음질을제공해야함 Localization and Envelopment 주어진청취환경에서정확한음상정위, 높은몰입감과현장감을제공해야함 Rendering on setups with 비트스트림은 Reference 렌더링환경보다더적은수의스피커환경에서디코딩 / 렌더링을 fewer loudspeakers 제공하고 Reference 환경과비슷한음질을제공해야함 Flexible Loudspeaker Placement Reference 렌더링과다른위치에있는스피커배치에서도높은몰입감과현장감을제공해야함 Latency 생방송을고려하여충분히낮은 latency를제공해야함입력오디오신호 채널, 객체, HOA 입력신호를지원해야함부가요구사항특징복잡도 디코더는디코딩 / 렌더링이저복잡도로가능해야함 Interactivity 개인의 interactive application 을위해객체오디오신호를제어할수있어야함 MPEG-H 3D Audio 는아래와같이 3개의입력오디오신호포맷을지원한다. 고차다채널오디오 (High-order Multichannel Audio): NHK 22.2 채널과같이상층채널 (Height Channel) 을포함하여스피커들이 3차원으로배치되는다채널오디오재생시스템을지원하여야한다. 고차다채널오디오신호는전방위음향장면을표현할수있으며, 적어도 9.1 이상의채널로구성되어있다. 객체기반오디오 (Object-based Audio): 다채널오디오배경음과분리되어있는오디오객체음원들을전송하고단말에서제어할수있어야한다. 오디오객체는자유롭게음향장면을구성할수있으며, 사용자와상호작용서비스를가능하게한다. 장면기반오디오신호 (HOA-based Audio): 음향장면기반오디오신호를전송할수있어야한다. 음향장면기반의오디오신호는특정오디오획득장비를통해획득될수있으며, 오디오채널신호와장면을표현하는메타데이터 로구성된다. MPEG 에서장면기반오디오신호를획득하기위한수단으로 HOA(High Order Ambisonics) 포맷을채택하였으며, HOA 포맷은오디오채널신호와채널신호를배치하기위한메타데이터정보가필요하다. 지금까지설명한 MPEG-H 3D Audio 의요구사항과서비스시나리오를기반으로먼저홈씨어터와오디오전용서비스를위한 Phase 1에대한표준화를 2013 년 103차 MPEG 회의에서부터시작하여 2014 년에완료하였다 [13]. MPEG-H 3D Audio Phase 1은 512kbps 의비트율에서최대 22.2 채널의오디오신호에대한압축기술과헤드폰과다양한스피커환경에대한렌더링기술을포함하고있다. MPEG-H 3D Audio Phase 2는개인형 TV나스마트폰과같이모바일환경 (128kbps 이하 ) 을고려한것으로, 2014 년 4월 108차 MPEG 회의에서부터표준화를진행하였고, Phase 1과 Phase 2를합한 MPEG-H 3D Audio 에대한표준을 2016 년하반기에승인할예정이다. 2016 년 7 월 99

304 특집 : 하이브리드 오디오 Ⅳ. MPEG-H 3D Audio 기술 고차 채널신호 압축효율을 높이기 위하여 MPEG Surround 기술을 접목하였다. MPEG Surround MPEG-H 3D Audio 인코더는 다채널 오디오 신 기술도 이미 표준화가 완료된 기술로 MPEG-H 호, 다객체 오디오 신호, HOA 신호 등 기본적으로 3D Audio에 USAC과 더불어 활용된 기술이다. 오 고차 오디오 채널 신호를 압축하여 전송하는 기능 디오 객체신호는 MPEG SAOC 기술을 활용할 수 을 담당한다. 기존의 스테레오 및 5.1 채널보다 다 있다. HOA 기반 장면 오디오 정보는 MPEG-H 루는 입력 채널수가 고차이므로, MPEG-H 3D 3D Audio에 새롭게 소개된 포맷으로 HOA를 위한 Audio 인코더의 압축 성능도 중요하기 때문에, 코 인코딩/디코딩 모듈이 필요하며, 종전의 MPEG 오 어 압축 모듈로 USAC 기술을 채택하였다. USAC 디오 표준기술로 HOA기반 오디오 채널 신호를 복 은 MPEG-H 3D Audio 이전에 표준화된 최신 오 원할 수 없었으므로 새로운 HOA 인코딩/디코딩 모 디오 압축 기술로 음성/음악에서 고른 성능을 보이 듈이 필요하다. HOA는 채널 신호와 메타데이터로 며 압축 효율 측면에서도 매우 뛰어난 성능을 제공 표현할 수 있으므로 채널신호는 USAC으로 인코딩 한다. MPEG-H 3D Audio는 새로운 압축 모듈을 /디코딩하고 추가된 HOA 모듈에서 전송된 메타데 개발하고 탑재하는 대신 USAC 기술을 활용하되, 이터를 활용하여 장면정보를 복원할 수 있다. <그림 4> MPEG-H 3D Audio 디코더 구조 100 방송과 미디어 제21권 3호

UHDTV 를위한차세대오디오표준 : MPEG-H 3D Audio 305 MPEG-H 3D Audio 의주요특징을정리하면, 다양한형태의입력오디오포맷을지원하기위하여 MPEG-Surround, SAOC, USAC 등 MPEG 오디오표준기술을활용하였으며, HOA 메타데이터처리를위한 HOA 메타데이터처리모듈과, 다양한형태의재생환경에적응하기위한렌더링모듈만이새롭게개발되어포함된것이다. 즉, 압축하고전송하는측면에서의 MPEG-H 3D Audio 기술은최대한기존 MPEG 기술을활용한것으로상호간에유연한동작을위하여하나의코덱구조에적절하게조합되어구현되었다. < 그림 4> 는 MPEG-H 3D Audio 디코더구조이다. MPEG-H 3D Audio 의주요특징은다양한형태의입력오디오포맷에대한고효율압축과다양한재생환경에최적의 3D Audio 를재현하기위한렌더링기술이다. 예를들어 22.2 채널의콘텐츠가사용자단말에전달되었다하더라도, 상황에따라서사용자는스테레오혹은 5.1 채널로 22.2 채널콘텐츠를소비하기를희망한다고했을때, MPEG-H 3D Audio 는이를충족시킬수있는기능을제공하여야한다. 이를위해필요한것이렌더링기술이다. MPEG-H 3D Audio 렌더링기술은콘텐츠형태와사용자단말환경에무관하게최상의 3D Audio 를제공하기위한기술이다. < 그림 4> 에서 format converter 가본기능을수행한다. format converter 는입력채널레이아웃과재생출력레이아웃간의변환장치로수동적 (passive) 믹싱과정을통해출력채널을생성하는대신에, 원콘텐츠의효과를최대한반영하기위한능동적 (active) 믹싱과정을지원한다. 예를들어, 22.2 채널을단순하게다운믹스하여스테레오채널신호를생성할수있겠으나, 채널간의상관관계, 위치정보들을고려하여다운믹싱을수행하면보다원 콘텐츠음향장면에가까운스테레오신호를얻을수있다. 사용자가헤드폰환경을선호하게된다면 MPEG-H 3D Audio 는원콘텐츠의효과를최대한반영할수있도록헤드폰을위한스테레오신호를생성할수있다. 이를위해 MPEG-H 3D Audio 는바이노럴렌더링모듈을탑재하고있다. 바이노럴렌더링모듈은디코딩된고차다채널신호를스테레오신호로변환하는과정에서 < 그림 5> 와같이공간상의스피커위치에서발생하는전달함수를적용하여스테레오신호를생성하는모듈이다. 스피커위치에서발생하는전달함수를 BRIR(Binaural Room Impulse Response) 이라고하며, 채널수만큼의 BRIR이존재하며이를활용하여바이노럴스테레오신호를생성한다. 원리는단순하게 < 그림 5> MPEG-H 3D Audio 바이노럴렌더링기술 2016 년 7 월 101

306 특집 : 하이브리드오디오 디코딩된채널신호와해당하는 BRIR을콘볼루션 (convolution) 하는것이다. 그러나채널수가증가함에따라콘볼루션연산량이급격하게증가할수밖에없으며, MPEG-H 3D Audio 에서는이를효율적으로최적화된연산량으로처리할수있는툴을추가하였다. 마지막으로, MPEG-H 3D Audio 에서지원하는기능으로 DRC(Dynamic Range Control) 모듈이있다. MPEG-H 3D Audio 는기본적으로다양한포맷의오디오신호를처리한다. 따라서상호간에발생하는오디오신호의레벨차가존재할수있다. DRC의첫번째요구되는기능은상호포맷간의레벨차를맞추어주어야한다. 따라서프로그램별로다양한형태의오디오포맷이존재하더라도최종출력레벨의차이를느낄수없도록 DRC가오디오포맷별로출력레벨을조절할수있어야한다. 기본적으로 DRC기능은출력신호의레벨을자동적으로일정레벨로맞추어줄수있어야한다. 예를들어, 방송콘텐츠별로상이한오디오레벨로제작되었다하더라도, 사용자단말에서는사용자가볼륨조절을개별적으로조절하지않아도동일한라우드니스 (loundness) 를가질수있도록 DRC가처리할수있어야한다. 이는최근들어많은이슈가되어왔던사항으로, 사용자가채널별로혹은콘텐츠별로인지하는라우드니스레벨차이가상이하여시청시, 오디오볼륨을상시조절해야하는번거로움을배제하기위한기술이다. MPEG-H 3D Audio 는코덱단에서원천적으로 DRC를통해라우드니스를제어하여출력신호를제공함으로써, 사용자의볼륨조절의번거로움을최소화시킬수있다 [14]. Ⅴ. MPEG-H 3D Audio 프로파일 MPEG 표준은 RM(Reference Model) 선정이후에도성능향상을위해다양한툴들을추가하기때문에, 활용분야에따라채널수, 비트율, 사용툴등에대해프로파일로정의한다. 각프로파일은서비스목적에따라선택적으로복잡도를제공할수있고기능및지원가능한채널수를명시하고있다. MPEG-H 3D Audio 는 3개의프로파일을지원하며각각의특징은아래와같다. Main 프로파일 : Main 프로파일은 Phase1 에서개발된툴들에대한프로파일로복잡도의제약사항을두지않고, 고품질및다기능을지원하기위하여최대한필요한툴들을모두포함시키고있으며, 채널수및객체수도가능한제약을두지않고있다. Main 프로파일에포함된툴들은앞서열거한 USAC, SAOC, MPEG Surround, HOA 등으로기존표준기술들을그대로포함시킨 superset 프로파일이다. Low-Complexity(LC) 프로파일 : MPEG-H 3DA가고음장감을제공하고다기능을지원함으로써새로운오디오코덱형상을제시한것은사실이나, Main 프로파일은실제서비스단말에지원하기위해서는높은복잡도로인하여다소부담이되는것은사실이다. 이를해결하기위하여 Phase 2 기술개발기간동안에저복잡도를갖는툴, 혹은기존툴을저복잡도로단순화한기술들을표준에반영하였다. LC 프로파일은이러한툴들을조합하여저복잡도를갖는프로파일을제공하는것으로저복잡도를갖는다하더라도음질성능및기본적인기능은 Main 프로파일과크게다르지않다. 102 방송과미디어제 21 권 3 호

UHDTV 를위한차세대오디오표준 : MPEG-H 3D Audio 307 < 표 3> MPEG-H 3D Audio LC 프로파일의레벨 레벨 최대샘플링율 최대채널수최대스피커수최대디코더채널 + 객체최대 HOA 최대 HOA 차수 ( 비트스트림 / 디코더 ) / 구성 ( 예 ) 객체수구성 ( 예 ) 차수 + 객체 ( 예 ) 1 48000 10/5 2/2.0 5 2채널 +3객체 2 2차 +3객체 2 48000 18/9 8/7.1 9 6채널 +3객체 4 4차 +3객체 3 48000 32/16 12/11.1 16 12채널 +4객체 6 6차 +4객체 4 48000 56/28 24/22.2 28 24채널 +4객체 6 6차 +4객체 5 96000 56/28 24/22.2 28 24채널 +4객체 6 6차 +4객체 High 프로파일 : High 프로파일은 Main 프로파일과 LC 프로파일의 superset 프로파일이다. LC 프로파일이저복잡도를위한프로파일이기는하나, 새롭게추가된툴들로인하여 Main 프로파일에기술되지않은툴들이발생하였다. 이에따라 MPEG-H 3D Audio 의모든툴들이포함된 High 프로파일을새롭게정의하여 MPEG-H 3D Audio Phase 1과 Phase 2의모든툴들을반영하였다. LC 프로파일에대해서는 < 표 3> 과같이스테레오에서 22.2 채널에대해레벨을정의하고있다. Ⅵ. 국내지상파 UHDTV 표준화현황 국내를포함하여일본, 미국, 유럽등에서초고선명 TV에대한기술개발과표준화가활발하게진행중에있다. ATSC(Advanced Television Systems Committee) 에서는 ATSC 3.0이라는프로젝트를 2012 년도부터진행해왔으며, 차세대 UHD 방송표준을제정하는것을목적으로하고있다. 비디오의경우, UHD 영상을위한압축방식으로 MPEG 의 HEVC(High Efficiency Video Coding) 기술이채택되는것에대하여이견이없었으나, 오디오의경우이해관계자들의첨예한대립으로인하여오디오코덱표준선정의어려움이있었지만, ATSC 3.0에서는 MPEG-H 3D Audio 와 AC-4 두개의오디오표준코덱을포함하고나라별로오디오표준을선정하는방향으로논의가되고있다. 국내에서도 2015 년지상파 UHDTV 방송을위한 700MHz 주파수대역을각방송사가할당받음으로써, 본격적인 UHDTV 방송을위한작업에착수하였다. ATSC 와마찬가지로비디오코덱선정은 HEVC로무난하게결정되었으나, 오디오의경우 Dolby 의 AC-4, MPEG-H 3D Audio, DTS 기술이경합하여, 차방포럼에서는 UHDTV 오디오서비스를실현하기위한렌더링기능을포함한 MPEG-H 3D Audio 기술을잠정표준 RM(Reference Model) 으로선정하고표준초안을작성하였다. 현재국내지상파 UHDTV 서비스를위한정합테스트를준비중에있으며, 올 9월까지 MPEG-H 3D Audio 기반의국내지상파 UHDTV 에대한정합테스트를마무리한후 2017 년 2월부터본격적인 MPEG-H 3D Audio 기반의 UHDTV 오디오서비스를제공할예정이다. 2016 년 7 월 103

308 특집 : 하이브리드오디오 Ⅶ. 맺음말 본논문에서는차세대방송환경에서 5.1채널을넘어서는몰입감과개인형방송서비스를제공하기위한 UHDTV 오디오기술인 MPEG-H 3D Audio 의기술의표준화현황및기술의개요에대해살펴보았다. 국내에서는최대 16트랙을지원하는 UHDTV 오디오서비스를 MPEG-H 3D Audio 를이용하여서비스할예정이므로, 청취자는오디오채널에대한제어및선택을통한개인화된방송과기존 5.1채널을넘어서는몰입감과현장감을제공하는새로운오디오서비스를받을수있다. 물론대부분의방송프로그램이스테레오형태로제작되고있기때문에, 5.1채널이상의서비스와객 체기반의개인화서비스가보급될때까지는많은시간이필요할것으로예상된다. 하지만먼저객체기반의서비스를통해청취자가특정오디오신호의볼륨을제어한다든지특정오디오채널을선택하는것과같은개인화된방송을먼저시작하고, 가정내에서사운드바와같이다채널오디오를쉽게서비스받을수있는환경이구비되면 5.1채널을넘어서는몰입감 / 현장감을제공하는오디오서비스로단계적으로접근한다면, MPEG-H 3D Audio 표준의모든기능을활용하여가정에서 10.2 채널의다채널오디오서비스와객체기반서비스를제공받는시점이우리가생각하는것보다훨씬빨라질수도있다. 참고문헌 참고문헌 [1] 이태진외, UHDTV를위한 10.2채널기반다채널오디오재현기술, 방송공학회논문지제 17권제5호, 2012년 9월 [2] 오현오외, ATSC 3.0 오디오코덱표준화동향, 방송과미디어제 20권 4호, 2015년 10월 [3] ISO/IEC 11172-3:1993, "Information Technology Coding of moving pictures and associated audio for digital storage media at up to about 1.5 Mbit/s Part 3: Audio" [4] ISO/IEC 23008-3:2015, "Information Technology High efficiency coding and media delivery in heterogeneous environments Part 3: 3D Audio" [5] ISO/IEC 13818-7:2006, "Information Technology Generic coding of moving pictures and associated audio information Part 7: Advanced Audio Coding(AAC)" [6] ISO/IEC 14496-3:2009, "Information Technology Coding of audio-visual objects Part 3: Audio" [7] ISO/IEC 23003-1:2007, "Information Technology MPEG Audio Technologies Part 1: MPEG Surround" [8] ISO/IEC 23003-3:2010, "Information Technology MPEG Audio Technologies Part 2: Spatial Audio Object Coding(SAOC)" [9] 이태진외, MPEG 오디오최신표준 : USAC 기술, 방송공학회논문지제 16권제5호, 2011년 [10] ISO/IEC 23003-3:2012, "Information Technology MPEG Audio Technologies Part 3: Unified Speech and Audio Coding" [11] 서정일외, 차세대실감방송서비스를위한 MPEG-H 3D AUdio 표준화동향 전기의세계, 제 64권제2호, 2015년 [12] ISO/IEC JTC1/SC29/WG11/N13411, Call for Proposals for 3D Audio, January 2013, Geneva, CH [13] ISO/IEC 23008-3:2015, MPEG-H (High efficiency coding and media deliver in heterogeneous environments), Part 3: 3D Audio, 2015. [14] 백승권, MPEG-H 3D Audio 배경및진행과정, 방송과기술, 5월호, 2016년. 104 방송과미디어제 21 권 3 호

UHDTV 를위한차세대오디오표준 : MPEG-H 3D Audio 309 필자소개 이태진 - 2014 년 2 월 : 충남대학교전자전파정보통신공학과 ( 공학박사 ) - 2002 년 10 월 ~ 2003 년 9 월 : 일본 Tokyo Denki University, 방문연구원 - 2000 년 5 월 ~ 현재 : ETRI 책임연구원, 오디오연구실실장 - 2015 년 3 월 ~ 현재 : 과학기술연합대학원대학교이동통신및디지털방송공학전공부교수 - 주관심분야 : 오디오부호화, 실감음향, 오디오신호처리 백승권 - 1999 년 2 월 : 한국항공대학교전자공학과 ( 공학사 ) - 2001 년 2 월 : 한국과학기술원정보통신공학부 ( 공학석사 ) - 2005 년 8 월 : 한국과학기술원정보통신공학부 ( 공학박사 ) - 2005 년 8 월 ~ 현재 : ETRI 선임연구원 - 주관심분야 : 오디오부호화, 오디오신호처리 2016 년 7 월 105