<4D F736F F F696E74202D20B9CCB5F0BEEE20BACEC8A3C8AD202D20B1B8B4EBBCBA202D>

Similar documents

AVN2100Kor_Ç¥Áö110818F

PowerPoint 프레젠테이션

MPEG-4 Visual & 응용 장의선 삼성종합기술원멀티미디어랩

Microsoft PowerPoint - chap11.ppt [호환 모드]

<4D F736F F F696E74202D DB1B8C1D8B8F02DC0CCB5BFC5EBBDC5B0FA20444D4220BCADBAF1BDBA2E BC0D0B1E220C0FCBFEB5D>

사용 설명서 이용 안내 사용 설명서의 내용은 제품의 펌웨어 버전에 따라 사용자에게 통보 없이 일부 변경될 수 있습니다. 제품의 특장점 기능을 살펴보려면 '특장점' 6쪽을 참조하세요. 제품 사용 중 문제가 발생하면 'A/S를 신청하기 전에' 53쪽을 참조하세요. 제품에

슬라이드 제목 없음

Left Center Right 3차원 L 비디오 C 부호화시스템 R LCR 가상시점영상 N- 시점영상출력 깊이정보맵생성 L C R 깊이정보맵 가상시점영상합성 1. 3 N- Fig. 1. N-view system with the 3-view configuration.

그림 2. 최근 출시된 스마트폰의 최대 확장 가능한 내장 및 외장 메모리 용량 원한다. 예전의 피쳐폰에 비해 대용량 메모리를 채택하고 있지 만, 아직 데스크톱 컴퓨터 에 비하면 턱없이 부족한 용량이다. 또한, 대용량 외장 메모리는 그 비용이 비싼 편이다. 그러므로 기존


그룹웨어와 XXXXX 제목 예제

슬라이드 제목 없음

저작자표시 - 비영리 - 동일조건변경허락 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 이차적저작물을작성할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비

03홍성욱.hwp

(JBE Vol. 21, No. 3, May 2016) HE-AAC v2. DAB+ 120ms..,. DRM+(Digital Radio Mondiale plus) [3] xhe-aac (extended HE-AAC). DRM+ DAB HE-AAC v2 xhe-aac..

디지털TV솔루션 브로셔

1. 3DTV Fig. 1. Tentative terrestrial 3DTV broadcasting system. 3D 3DTV. 3DTV ATSC (Advanced Television Sys- tems Committee), 18Mbps [1]. 2D TV (High

0. 들어가기 전

01이국세_ok.hwp

01박기준.hwp

<4D F736F F F696E74202D204D504547B1B9C1A6C7A5C1D8C8AD5FC8A3BFE4BCBA BC8A3C8AF20B8F0B5E55D>

서 인코딩한 데이터를 무선으로 송신하기 위한 무선 송신 수단; 및 통화중 상기 입력 수단으로부터의 음원 데이터 전송신 호에 따라 상기 저장 수단에 저장되어 있는 해당 음원 데이터를 상기 디코딩 수단에 의해 디코딩하고, 상기 디코딩한 음원 데이터와 상기 입력 수단을 통해

Microsoft Word - SRA-Series Manual.doc

KRNet 2005 DMB Visual Radio - The New Interactive Radio Show SBS 기술연구소 오건식

디지털영상처리3

2 라이선스 라이선스 돌비 래버러토리스의 허가를 얻어 제조한 제품입니다. 돌비 및 더블 D 심볼은 래버러토리스의 상표입니다. DivX 비디오에 관하여 DivX 는 Rovi Corporation 의 자회사 DivX, LLC가 개발한 디지털 비디오 포맷입니다. 본 제품은

08김현휘_ok.hwp

인켈(국문)pdf.pdf

IPIU2008_김승환.hwp

2 사용하기 전에 안전을 위한 주의사항 1 사용하기 전에 주의사항은 경고 와 주의 의 두 가지로 구분되어 있으며, 의미는 다음과 같습니다. > : 이 그림 기호는 위험을 끼칠 우려가 있는 사항과 조작에 대하여 주의를 환기시키기 위한 기호입니다. 이 기호가 있는 부분은

Slide 1

멀티미디어시스템특강10-동영상압축의 이해(I)

1 : MPEG-DASH MMT (MinKyu Park et al.: MMT-based Broadcasting Services Combined with MPEG-DASH) (Regular Paper) 20 2, (JBE Vol. 20, No. 2, Marc

2 PX-8000과 RM-8000/LM-8000등의 관련 제품은 시스템의 간편한 설치와 쉬운 운영에 대한 고급 기술을 제공합니다. 또한 뛰어난 확장성으로 사용자가 요구하는 시스템을 손쉽게 구현할 수 있습니다. 메인컨트롤러인 PX-8000의 BGM입력소스를 8개의 로컬지

2011년 10월 초판 c 2011 Sony Corporation. All rights reserved. 서면 허가 없이 전체 또는 일부를 복제하는 것을 금합니다. 기능 및 규격은 통보 없이 변경될 수 있습니다. Sony와 Sony 로고는 Sony의 상표입니다. G L

02손예진_ok.hwp

V. 통신망 기술

ez-shv manual

2 : MMT QoS (Bokyun Jo et al. : Adaptive QoS Study for Video Streaming Service In MMT Protocol). MPEG-2 TS (Moving Picture Experts Group-2 Transport S

FMX M JPG 15MB 320x240 30fps, 160Kbps 11MB View operation,, seek seek Random Access Average Read Sequential Read 12 FMX () 2

,,, 3D, 3D 3D. 3DTV,,, [1][2].,, (frame-compatible) 3D [3][4]. 3DTV, 3DTV, 3DTV DTV [5]. 3DTV,, 3. 3DTV MPEG-2 (ISO/IEC ) [6] 3DTV (dual

airDACManualOnline_Kor.key

4 : (Hyo-Jin Cho et al.: Audio High-Band Coding based on Autoencoder with Side Information) (Special Paper) 24 3, (JBE Vol. 24, No. 3, May 2019

10 서석용(69~79)_수정.hwp

À̵¿·Îº¿ÀÇ ÀÎÅͳݱâ¹Ý ¿ø°ÝÁ¦¾î½Ã ½Ã°£Áö¿¬¿¡_.hwp


T T A S t a n d a r d

미쓰리 파워포인트

슬라이드 제목 없음

1 : S-JND HEVC (JaeRyun Kim et al.: S-JND based Perceptual Rate Control Algorithm of HEVC) (Regular Paper) 22 3, (JBE Vol. 22, No. 3, May 2017)

상기 DVD 플레이어는 거의 거치형(톱니형)으로 개발되어 텔레비젼, AC3 앰프 및 6개의 스피커 또는 단순 히 스테레오 시스템 등에 연결되어 영화 재생용으로만 특징지워지고, 반면에 상기 DVD-롬 드라이브는 컴 퓨터에 장착되어 소정의 인터페이스 방식을 통해 컴퓨터 테

V. 통신망 기술

요약문 1 요 약 문 1. 과 제 명 : 소음노출 저감을 위한 작업환경관리 및 측정방안 연구 2. 연구기간 : ~ 연 구 자 : 연구책임자 장 재 길 (연구위원) 공동연구자 정 광 재 (연구원) 4. 연구목적 및 필요성

BT.709 DCI BT [ 1] TTA Journal Vo

(JBE Vol. 20, No. 6, November 2015) (Regular Paper) 20 6, (JBE Vol. 20, No. 6, November 2015) ISSN

Microsoft Word - JAVS_UDT-1_상세_메뉴얼.doc

歯AG-MX70P한글매뉴얼.PDF

. "" "",.... :...,,....,.. :..,,,..,,...,.... 2

< C0FCC6C4BBEABEF7B5BFC7E E687770>

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션

a), b), c), b) Distributed Video Coding Based on Selective Block Encoding Using Feedback of Motion Information Jin-soo Kim a), Jae-Gon Kim b), Kwang-d

Contents Why DMB? When DMB? Where DMB? What DMB? Who DMB? How DMB? Demonstration Conclusion 2/ 27

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Nov.; 26(11),

방송공학회논문지 제18권 제2호

스마트폰 모바일 랩 세미나

Microsoft Word - HD-35 메뉴얼_0429_.doc

hwp

DBPIA-NURIMEDIA


Sequences with Low Correlation

3 : S-JND HEVC (JaeRyun Kim et al.: A Perceptual Rate Control Algorithm with S-JND Model for HEVC Encoder) (Regular Paper) 21 6, (JBE Vol. 21,

Microsoft PowerPoint - D08_ImageCompression_note.ppt [호환 모드]

1217 WebTrafMon II

2 : (JEM) QTBT (Yong-Uk Yoon et al.: A Fast Decision Method of Quadtree plus Binary Tree (QTBT) Depth in JEM) (Special Paper) 22 5, (JBE Vol. 2

슬라이드 1

: AA ( ) TV : ios ( ).. 2

1 : MV-HEVC (Jae-Yung Lee et al.: Fast Disparity Motion Vector Searching Method for the MV-HEVC) High Efficiency Video Coding (HEVC) [1][2]. VCEG MPEG

<30335FB1E8C1BEC8A32DB0EDC7D8BBF3B5B520BFB5BBF3C0C720C8BFB0FAC0FBC0CE2E687770>

(JBE Vol. 20, No. 2, March 2015) (Special Paper) 20 2, (JBE Vol. 20, No. 2, March 2015) ISSN

2

i-movix 특징 l 안정성 l 뛰어난화질 l 차별화된편의성

전자실습교육 프로그램

슬라이드 1

Â÷¼øÁÖ

사용 설명서 이용 안내 사용 설명서의 내용은 제품의 펌웨어 버전에 따라 사용자에게 통보 없이 일부 변경될 수 있습니다. 사용 설명서는 Windows XP 환경을 기준으로 설명하고 있으며 사용자의 OS 환경에 따라 다소 차이가 있을 수 있습니다. 제품에 사용된 음원, W

2 : HEVC (Young-Ho Seo et al.: H.265/HEVC Video Watermarking Method with High Image Quality) (Regular Paper) 24 1, (JBE Vol. 24, No. 1, January

(JBE Vol. 24, No. 2, March 2019) (Regular Paper) 24 2, (JBE Vol. 24, No. 2, March 2019) ISSN

PowerPoint 프레젠테이션

목차 1. 개요 3 2. H.264의개발 3 3. 영상압축작동방법 4 4. H.264 프로파일과레벨 5 5. 프래임의이해 5 6. 데이터를줄이는기본적인방법 6 7. H.264의효율성 7 8. 결론 9

ez-md+_manual01

PowerPoint 프레젠테이션

(JBE Vol. 20, No. 6, November 2015) ISO/IEC HEVC [1]. LG 7680x4320 8k UHD TV 4 HEVC. HEVC H.264/AVC 3 2 [2]. UHD,,, HEVC.,,. Davinci Resolve

ȲÀμº Ãâ·Â

제5장 비디오와 애니메이션

목 차 3. EDIUS 시작 5. EDIUS NLE에서 K2-CAMP로 미디어 전송 5. 단계 1: EDIUS 타임라인에서 HQ 코덱으로 프로젝 트를 트랜스코딩 6. 단계 2-A: FTP를 통해 K2-CAMP에 파일 전송 9. 단계 2-B (다른방법): 외장 드라이브(

(72) 발명자 정진곤 서울특별시 성북구 종암1동 이용훈 대전광역시 유성구 어은동 한빛아파트 122동 1301 호 - 2 -

<4D F736F F F696E74202D203137C0E55FBFACBDC0B9AEC1A6BCD6B7E7BCC72E707074>

Chapter4.hwp

Transcription:

방송특허연구회자체세미나개최 방송기술표준및전략적특허분석 주제 3 : 미디어부호화기술 H.264 MPEG-1/2/4 Audio JPEG/PNG/MNG 심사관 : 구대성 2006-02-09 영상기기팀 1 H.264 H.264 는 MPEG-4 Part 10(AVC) 라고도불리우며, ITU-T 의 VCEG(video coding experts group) 과 ISO/IEC 의 MPEG(moving picture experts group) 의공동작업에의해탄생한가장최근의영상부호화표준이다. H.264/MPEG-4 AVC(Advanced Video Codec) 는 384Kbps 의대역폭으로이동단말기상에서 VHS 급의화질을구현할수있는최첨단압축규격이다. MPEG-4 Part2 와비교하여 20~50%, 지상파디지털방송에적용한 MPEG-2 에비하여최고 18 배까지압축효율이높다. H.264 표준안구조 2006-02-09 영상기기팀 2 1

H.264/AVC TML/JM 표준화과정 2006-02-09 영상기기팀 3 ITU-T/MPEG 표준화과정 2006-02-09 영상기기팀 4 2

H.264/AVC 프로파일구조 응용분야에따라요구되는성능과기능을그룹화하여이를충족하는기술들을부분집합으로정의한개념을 프로파일 이라고한다. 응용분야 베이스라인프로파일 : 화상전화, 화상회의무선통신분야메인프로파일 : TV방송과비디오저장매체분야확장된프로파일 : 스트리밍미디어응용분야 2006-02-09 영상기기팀 5 H.264 성능비교 40 Performance Comparison 38 36 PSNR[dB] 34 32 30 28 26 24 0 200 400 600 800 1000 1200 1400 1600 1800 2000 Bit-rate[Kbit/Sec] MPEG-2 H.263 MPEG-4 H.264 2006-02-09 영상기기팀 6 3

H.264/AVC 비디오포맷 Format Luminance 해상도 프레임당비트수 Sub-QCIF QCIF CIF 128 96 176 144 352 288 147,456 304,128 1,216,512 이동식멀티미디어응용제품 화상통신응용분야 4CIF 704 576 4,866,048 TV, Video 용도로사용 Foreman 영상의비디오포맷 CIF (Common Intermediate Format) QCIF (Quarter CIF) Sub-QCIF 2006-02-09 영상기기팀 7 H.264 용어 Sampling 4:2:0 : 색차성분은휘도성분의 1/2 에해당하는수평및수직해상도 4:2:2 : 색차성분은휘도성분의 1/2 에해당하는수평해상도 4:4:4 : 색차성분은휘도성분과동일한해상도 Entropy Coding : 중복성을제거하기위한부호화방법 Inter : 시간적인예측또는보상을이용하여비디오프레임을압축하는방법 Intra : 시간적인예측을사용하지않고비디오프레임을압축하는방법 2006-02-09 영상기기팀 8 4

Macro Block : 하나의단위로부호화되는프레임의영역 (16*16, 8*8, 4*4) VLC(Variable Length Coding) : 가변길이부호 Interlace : 연속적인필드로표현되는비디오데이터. HVS(Human Visual System) : 인간의시각적인특성을이용하여영상을인지하고판단하는시스템. Profile : 비디오코덱의기능적인성능을집합시켜놓은것. 2006-02-09 영상기기팀 9 각블록들은정수변환방식으로변환. 변환계수들은엔트로피코딩방식을이용하여양자화및인코딩수행. 입력비디오신호는매크로블록들로화면분할. 매크로블록결합에서슬라이스그룹과슬라이스가선택된다. 동영상에서서로다른슬라이스경우매크로블록들의효과적인병렬프로세싱이가능하다. 2006-02-09 영상기기팀 10 5

4x4 Forward 변환블록은고정된정수변환을수행한다. 그리고양자화블록에서는양자화단계크기가거의 12.5% 혼합율을나타낸다. H.264 엔트로피코딩에서는단일 UVLC(Universal Variable Length Coding) 또는 CABAC(Context-Based Adaptive Binary Arithmetic Coding) 를모두이용하여수행할수있다. 각매크로블록은 Intra 모드또는 Inter 모드로인코딩되며, 매크로블록내의각블록에대한예측블록은복원된영상샘플에의해생성된다. Intra 모드에서 PRED 는현재슬라이스에존재하는이전단계에인코딩, 디코딩되어복원된샘플로부터생성된다. 엔트로피인코딩계수들은매크로블록내의각블록을디코딩하는데필요한부가적인정보들과함께압축된비트스트림을형성하여 NAL 을통해전송되거나저장된다. 인코더는매크로블록내의각블록을인코딩하여전송할뿐만아니라, 정보를다시디코딩하여이후의예측을위한참조데이터를생성한다. 2006-02-09 영상기기팀 11 디코더는 NAL로부터압축된비트스트림을받아서데이터요소들에대해엔트로피디코딩을수행하여양자화된계수를생성한다. 생성된계수들은역양자화되고역변환되어인코더와동일하게생성된다. 디코더는비트스트림으로부터디코딩된헤더정보를사용하여인코더에서생성된원래의예측블록 PRED와동일한예측블록 PRED를생성한다. 2006-02-09 영상기기팀 12 6

NAL(Network Adaptation Layer) NAL 은다음과같은계층을전송하기위해 H.264/AVC 데이터를매핑시키는기능을수행한다. 여러종류의실시간유 / 무선인터넷서비스를위한 RTP/IP 저장매체와 MMS을위한파일포맷 유선, 무선통신서비스를위한 H.32X 방송서비스를위한 MPEG-2 NAL 구조 NAL 유닛형식 2006-02-09 영상기기팀 13 움직임벡터흐름도 2006-02-09 영상기기팀 14 7

매크로블록코드당평균비트 2006-02-09 영상기기팀 15 매크로블록형태의분할 동영상에대하여매크로블록형태의화면내에서발생하는 4x4 모드와 16x16모드의예측과슬라이스에종류에따라구분되는분할및서브매크로블록에관한사항 2006-02-09 영상기기팀 16 8

오디오부호화 MPEG Audio MPEG-1 Audio (ISO/IEC 11172-3) MPEG-2 Audio (ISO/IEC 13818-3) MPEG-2 AAC (ISO/IEC 13818-7) MPEG-4 Audio (ISO/IEC 14496-3) MPEG-7 Audio (Multimedia Content Description Interface) 2006-02-09 영상기기팀 17 MPEG-Audio의개념 정보화시대가도래하여전기통신, 오락및정보산업을수렴시키는기술이보편화되고, 시장세력이동일해지면서모든업계에공통으로적용하여다수판매자시스템의전반적인시행가능성을높일수있는새로운디지털표준이 MPEG(Moving Picture Expert Group) 이다. MPEG/audio 는고품질고능률스테레오부호화를위한 ISO/IEC 의표준방식이다. MPEG/audio 의압축알고리즘이실제적으로손실이나, 이알고리즘이제공하는변형은인간의지각적인면에서는손실이없고게다가 6 배혹은 18 배의압축율을제공한다. 2006-02-09 영상기기팀 18 9

MPEG-Audio 의양자화 16 비트 resolution. 1bit 증가시약 6dB 의 SNR 개선효과. 약 92dB 이상에서구분이어렵다. 32, 44.1, 48 khz 의샘플링주파수사용. 한채널당 48kHz 사용시 768 kbps 전송율 STEREO : 1.536 Mbps 5.1 ch : 4.608 Mbps 2006-02-09 영상기기팀 19 MPEG-1 Audio 알고리즘 Total Bitrate Layer-1 : 32 kbps ~ 448 kbps Layer-2 : 32 kbps ~ 384 kbps Layer-3 : 32 kbps ~ 320 kbps Mono, Dual, Stereo, Joint Stereo 방식지원 Frame 단위로코딩 Layer-1 : 384 samples Layer-2, 3 : 1,152 samples 2006-02-09 영상기기팀 20 10

MPEG-1 Audio는 Subband Coding과 Perceptual Coding의개념을결합시킨코딩방식으로높은압축율에서도좋은음질을얻을수있도록구성되어있다. Layer1 : 256Kbps의비트율, 32 Subband, Bit Allocation, Scale Factor, 프레임당 384샘플을이용한다. Layer2 : 193Kbps의비트율, 32 Subband, Bit Allocation, Scale Factor, 프레임당 3개조의 1152샘플을이용한다. Layer3 : 128Kbps의비트율, Hybrid Filterbank, Bit Allocation, Scale Factor, 프레임당 1152샘플, 허프만부호화, Entropy Coding을이용한다. 2006-02-09 영상기기팀 21 서브밴드필터의이론적배경 서브밴드코딩은 1980 년대초 Bell 연구소에서처음으로개발. 시간영역의이산신호를입력수열의순서대로변환하지않고주파수성분이비슷한것끼리샘플들을재구성하여부호화하는방식. MPEG/audio 의서브밴드부호화에서는엘리어싱을일으키지않고대역을필터뱅크에의해분할하여서브샘플링하는것이필요하다. 2006-02-09 영상기기팀 22 11

Polyphase/MDCT 필터뱅크 Polyphase FilterBank : 주파수분할방식에서 32밴드로분할하여막대한연산량을처리하는데사용되는방법. MDCT(Modified Discreted Cosine Transform) : 576샘플을한꺼번에시간영역신호로부터주파수영역신호로변환하는방법. 필터뱅크에의해분리된서브밴드는인접한서브밴드와엘리어싱이발생하는데, 이렇게인접서브밴드의간섭을제거하기위해인코딩과정에서 MDCT를사용하고디코딩과정에서는 IMDCT를사용한다. 2006-02-09 영상기기팀 23 MPEG-1 Audio Encoder 구조 PCM Audio Sample's 32, 44.1, 48 khz Mapping Quantizer and Coding Frame Packing Encoded bitstream Psychoacoustic Model ISO/IEC 11172-3 Encoder Ancillary Data 2006-02-09 영상기기팀 24 12

Masking 마스킹효과란특정신호에의해서다른신호가가려지는현상으로써, 인간의청력기관은입력음성을각기다른특성을갖는수많은필터뱅크에의해주파수분석을수행한다. 주파수분석과정에서인간의청각기관이갖는해상력의한계에의해마스킹효과가발생하고마스킹효과가일어나는주파수폭을임계적밴드라한다. 임계적밴드의특성을보면밴드폭은 1kHz이상의주파수에서는주파수에거의비례하고, 1kHz미만의주파수에서는 100Hz의폭으로거의일정하다. 최소한의가청한계와마스킹 2006-02-09 영상기기팀 25 MPEG-2 Audio MPEG-2 오디오는좌, 우서라운드채널및저주파향상채널 (Low Frequency Enhancement Channel) 을추가하여 5.1 채널로구성되어있다. 5.1 채널은공간적입체감을느낄수있는데, 중앙채널은방향적인안정감을주고, 서라운드채널은생생한현장감을준다. 5.1 채널방식은청취자의기호와청취환경의변화에빠르게대체할수있으며음질의고급화를이룰수있는방식이다. 2006-02-09 영상기기팀 26 13

MPEG-2 Audio Bit stream Header CRC BAL SCFSI SCF Subband Sampling Ancillary Data 1 Ancillary Data 2 MC-Header MC-CRC MC-BAL MC-SCFSI MC-SCF MC-Subband Sampling Multingual Ancillary Data 2 1. 하나의프레임을처리할헤더정보를갖고있다. 2. 에러체크를위한 CRC 정보로써 16 비트로구성. 3. 실제처리데이터로써비트할당정보, 스케일상수선택정보, 스케일상수, 서브밴드샘플데이터로구성. 4. 보조데이터를위한것으로써여러가지응용에사용. 2006-02-09 영상기기팀 27 MPEG-2 Audio 부호화 기본부호화알고리즘은 subband coding 과 perceptual coding 으로구성. 입력신호를 32 개의가중중첩방식등간격필터뱅크로처리하여통계적인신호의중복성을제거한후서브밴드샘플로변환. FFT 를사용하는심리음향모델에서는지각적인중복성을제거한후마스킹임계값으로신호대마스크비 (SMR) 를구한다. 2006-02-09 영상기기팀 28 14

MPEG-2 Audio Encoder Filter Bank Data Compression Audio Input Scalefactors Determination Multiplex Data Compression Encoding Bit stream output FFT Masking Threshold Dynamic bit allocation Psychoacoustic Model 2006-02-09 영상기기팀 29 MPEG-2 AAC MPEG-2 AAC는다채널고음질오디오표준이며, MPEG-2 AAC 오디오표준은 5채널, 오디오신호전대역에대해 320Kbit/sec 데이터레이트에서원음과식별불가능한것으로 ITU-R 에서인정했다. 메인 profile은최대 8.1 채널을제공하며, 이보다간단한 LC(Low Complexity) profile은 2채널로구성되어, 휴대용오디오에적합하게되어있으며, 이 2가지 profile들은최대 96KHz~8KHz까지의샘플링주파수를사용한다. MP-3 파일과비교하여최대 30% 까지압축할수있다. TNS와 Prediction이라는두가지기법을통하여음질을향상시킨다. 2006-02-09 영상기기팀 30 15

AAC Profile SSR(Scalable Sampling Rate) profile : 통신환경에서낮은비트율로네트웍전송이가능하도록최대 20KHz에서 6KHz 까지비교적낮은샘플링주파수를사용한다. Main profile : 컴퓨팅자원의제한이없는환경에서최고의압축율과, 음질을갖는다. LC profile : 컴퓨팅자원이제한적인경우에적합하도록 prediction과 gain control tool를사용하지않으며,tns 필터의차수도제한되어있다. 최소의비트율을사용하여, 통신환경에서낮은비트율로통신가능하도록 gain control 툴을사용하여오디오대역을강제적으로제한하며, prediction과 coupling channel를지원하지않는다 2006-02-09 영상기기팀 31 MPEG-2 AAC Encoder/Decoder Input time signal Perceptual Model Gain Control Filte r Bank Noiseless Decoding Inverse Quantizer TNS Legend Intensity/ Coupling Data Control Scale Factors Quantized Spectrum of Previous Frame Prediciton M/S Bitsream Multiplex 13818-7 Coded Audio Stream Bitsream Demultiplex M/S Prediciton Scale Factor Intensity/ Coupling Rate/Disto rtion Control Process Quantizer Noiseless Coding TNS Filter Bak Gain Control Output Time Signal 2006-02-09 영상기기팀 32 16

심리음향모델의세부블록 Input Buffer FFT (long and short) Window Size long : 2048 Window Size Short : 256 36 Samples 36 Samples 12 Samples 12 Samples 24 Samples Unpredictability measure (CW) 계산 FilterBank 를위한지연보상 Threshold (Part 1) 계산 첫째단블록에서 FFT 연산이수행되고, 비예측성값을측정한이후에심리음향엔트로피값을구한다. 심리음향엔트로피값을기준으로윈도우형태를결정하고입력버퍼에서출력버퍼로지연보상을해주는블록은 MDCT 필터뱅크에서수행한다. Long Block 사용 N Threshold (part 2) 계산 Perceptual Entropy 계산 Perceptual Entropy > Switch pe Short Block 사용 ShortBlock을위한 Threshold 계산 Threshold지연, BlockType, 하나의블록에의한 Perceptual Entropy 만일, ( Window_sequence (n) = EIGHT_SHORT_SEQUENCE Window_sequence (n-1) = ONLY_LONG_SEQUENCE ) Window Sequence (n-1) = LONG_START_SEQUENCE Y Output Buffer : BlockType, Threshold(ratio), Perceptual Entropy, Time Signal 2006-02-09 영상기기팀 33 AAC 블록들의기능 Gain-control 4 개밴드의 PQF(PolyphaseQuadratureFilterbank) 는동일한 4 개의주파수밴드에입력으로들어간다. Gain control 의역할은단지 SRS(Sampling rate scalable) Profile 에이용되고, 추가적으로시간영역의 gain control 은 preecho 영향을감소시키는역할을한다. Filter-Bank filter bank 는입력신호를서브샘플된스펙트럼요소 (time-frequency domain) 으로분해하는데사용된다. 48kHz 에서 AAC system 은 23Hz 의주파수분해능과 2.6ms 의시간분해능을허락한다. 2006-02-09 영상기기팀 34 17

TNS(Temporal Noise Shaping) 양자화보정기술로써아날로그의연속적인음악데이터를 0 과 1 의디지털데이터로만들때생기는오차를지능적으로줄여잡음을감소시키고원음에가깝게만든다. Intensity coding and coupling 다중채널신호를위해서 intensity stereo coding 이적용된다. 이작용에서는단지 energy envelope 가전송되어지는데, intensity stereo coding 은전송된공간정보에서감소하고, 매우낮은데이터율에서들을수있는잡음을감소시키는강력한방법이다. 2006-02-09 영상기기팀 35 Prediction TNS 로보정된수치를기억하는것으로써앞에서보정된정보를기억해다음에같은데이터가나타날때기억된데이터를이용한다. 만일, 양자화단계에서같은음의보정수치가다르면다른소리로들리게되므로이를같게만드는기술이다. M/S stereo coding M/S stereo coding 은선택된스펙트럼영역의코딩효율을개선시키기위해서 left, right 또는 mid, side 양채널모두다허락한다. Scalefactors 스펙트럼은 Scale-factor 밴드로불리는일반적인그룹의스펙트럼계수들로분할되어있는데이것을하나의스케일펙터라고한다. 스케일펙터는스케일펙터밴드안에있는모든스펙트럼계수들의증폭을변화시키는데사용된다. 2006-02-09 영상기기팀 36 18

Quantizer Spectrum Component 는양자화되고, 마스크쓰레스홀드아래로양자화잡음을유지하는목적으로코드화된다. 이단계는분석과합성두단계모두에서사용된다. Noiseless coding 허프만코딩은양자화된스펙트럼, 다른스펙트럼계수들에적용되고, 지향적인정보를갖는다. 전체 12 개의정적인허프만코드북은 code pairs 또는 4 곱의스펙트럼계수들이속해있다. perceptual model psychoacoustic model 과동일한의미이며 IS11172-3 psychoacoustic model II 가이에속해있다. 2006-02-09 영상기기팀 37 MPEG-4 Audio (ISO/IEC 14496-3) MPEG-4 Audio 는 Natural-Tool 과 Synthetic-Tool 과같은 2 그룹의사운드코딩툴이있는데, Natural-Tool 은디지털오디오에서압축변환되고합성을하며, Synthetic-Tool 은파라미터기술의사운드를변환합성하는데이용된다. MPEG-2 AAC 는 3 개의 Profile 로구성되어있는데, MPEG-4 Audio 는 4 개의 Profile 로구성되어있다. 각각의 Profile 은 Speech Audio Profile, Synthesis Audio Profile, Scalability Audio Profile, Main Audio Profile 로구성되어있다. 2006-02-09 영상기기팀 38 19

ISO/IEC 14496-3 의 Profile Speech Audio Profile : 파라미터의 speech coder로써 CELP Speech coder와 Text-to-Speech 간의인터페이스기능을한다. Synthesis Audio Profile : 매우낮은비트율에서 Sound와 Speech 생성능력이있고, 컴퓨터게임을위한유용성이있다. Scalibility Audio Profile : Speech Profile이포함하고있는 AAC LC, AAC LTP, AAC Scalibility, Twin VQ와호환되고, 인터넷이나디지털방송을위하여 speech나 music을유용하게적용시킬수있다. Main Audio Profile : Natural-Tool과 Synthetic-Tool의사운드코딩툴을위하여다른 Profile을포함하는풍부한통합툴이다. 2006-02-09 영상기기팀 39 MPEG-4 Audio Coding Tool General audio(ga) 코더 : 음악비트율의채널당 16-64 kb/s와같은고음질의넓은밴드의다중채널신호들의변환을허락한다. 이코더에서스케일할수있는버전은심리음향압축기술로잘알려진, MPEG-2 AAC (Advanced Audio Coding) 표준안에기반을두고있고추가적으로 MPEG-4를위해서는음질과기능면에서개선되었다. Celp Coder : 여자선형예측기술의코드북을사용하는데, 16-24 kb/s의범위에서고압축의음성코딩을할수있다. parametric speech coder : harmonic vector excitation coding 방식에바탕을두고 toll-quality 음성을 6 kb/s 하강시킨다. 2006-02-09 영상기기팀 40 20

MPEG-4 BSAC 지상파 DMB 에서사용되는오디오압축기술이 MPEG-4 BSAC 대부분의기술이 AAC 알고리즘을채택하고있지만, 후반의부호화단계에서 Huffman Coding 대신에 Arithmetic Coding 을사용하여미세한계층스케일러빌러티 ( 확장성 ) 를제공한다. 지상파 DMB 의오디오규격으로는 MPEG4 Part3 의 [AAC] 와 MPEG4 Part 3 의 [aacplus= AAC+ = HE AAC], MPEG4 Part3 의 [BSAC] 중에서 MPEG4 Part3 의 [BSAC] 이최종결정되었다. BSAC 는삼성에서개발한기술로압축효율한단계높인기술규격이다. 이중 BSAC 는 96kbps 로 MP2 인 192Kbps 의 50% 대역폭으로 CD 수준의음질을보장한다. 2006-02-09 영상기기팀 41 Dolby AC-3 AC-3 는 Audio Coding-3 의약자로써, 돌비연구소가개발한디지털오디오코딩중세번째의것이란뜻이다. AC-3 는 5.1 채널로구성되는것이특징이다. AC-3 는 5.1 채널 16 비트의코드를 32Kbps( 킬로비트 / 초 ) 에서 640Kbps 사이의데이터를가진 1 채널로압축할수있는오디오코딩방식이다. AC-3 의특징은영화의사운드트랙용이라는점이다. 응용분야 : 극장용시스템, DVD, 홈시어터, 하이엔드오디오시스템 장점 : 저비트율로인한다양한용도에사용된다. 단점 : 채널각각의음질이 CD 보다못하다. 0.1채널이담당하는 LEF를재생하기위한서브우퍼이다. 프런트스피커의저역재생능력이부족할때서브우퍼는 LEF재생뿐만아니라메인채널의저역까지담당. 2006-02-09 영상기기팀 42 21

JPEG (Joint Photographic Coding Experts Group) JPEG 는 Joint Photographic Experts Group( 정지화상전문가그룹 ) 의약자로현재가장많이쓰이는정지화면영상의규격중하나이다. 컴퓨터, 전자카메라, 컬러팩스, 컬러프린터등에응용되는영상의저장및전송을위한효율적인압축에관한국제표준 (ISO-IEC10918) 으로서이표준화를담당하는작업반의별칭이기도하다. JPEG 압축방식은크게무손실모드와손실모드로나눌수있는데무손실모드는원데이터에전혀손상을주어서는안되는경우에쓰이고, 손실모드는시각적으로못느낄정도의손실을허용하면서압축률을높이는대부분의응용분야에채택하고있다. 무손실모드 : DPCM, RLE, 허프만코딩, 산술압축 손실모드 : DCT 양자화 2006-02-09 영상기기팀 43 PNG (Portable Network Graphics) 압축된그래픽이미지파일. PNG 형식은인터넷위원회에의해서개발되었기때문에특허권으로부터자유롭다. [GIF 파일 : Unisys 사가특허권소유 ] 손실없는압축이가능하다. ( 압축해제시이미지정보복원 ) GIF 형식보다 10~30% 압축율증가. 애니메이션지원불가. 투명도를조절할수있고, 확장성이있다. 인터레이싱이미지기능이제공. 감마교정기능, 색상밝기형태로이미지보정 팔레트, 그레이스케일및트루컬러를사용하여저장 2006-02-09 영상기기팀 44 22

PNG (GIF+JPG) PNG 는 8 비트와 24 비트개념이있는데, PNG-24 의경우엔수천만칼라를지원하므로원본사진과거의차이가없고, PNG-8 의경우 GIF 와비슷한압축률을가지고 PNG-24 의경우에는 GIF 보다용량이더커집니다. PNG-8 의경우인터레이스를지원하는데체크할경우용량이좀더불어나게된다. 압축률은각포맷마다조정하기나름이며그림의종류에따라장단점을가지게됩니다. PNG-8 의경우에는 GIF 와같은 256 색상이한계치이며, 직접표현할수없는색은 Dithering 으로표현하게됩니다. 흰점과검정색점이섞여있으면회색으로보이는이치와같습니다. 이러한경우원본과차이가있습니다. 특히원본사진에포함된칼라가아주다양할수록더크게차이가나고색깔수가제한된사진이라면큰차이를느끼기힘듭니다. 2006-02-09 영상기기팀 45 MNG (Multiple Network Graphic) 손실또는무손실압축을사용할수있으며, 감마와알파채널정보를저장할수있다. 안타깝게도옛버전의브라우저는플러그인없이이미지를랜더링할수없다. Reference - www.libpng.org (PNG/MNG) - www.mpeg.org (MPEG) - H.264 and MPEG-4 Video Codec ( 차세대영상압축기술 ) 2006-02-09 영상기기팀 46 23