<363020B9CEBCD2BFAC2D4C535020C6C4B6F3B9CCC5CDC0C720BAD0C6F7C6AFBCBAC0BB20C0CCBFEBC7D12E687770>

Similar documents
지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월

28 저전력복합스위칭기반의 0.16mm 2 12b 30MS/s 0.18um CMOS SAR ADC 신희욱외 Ⅰ. 서론 Ⅱ. 제안하는 SAR ADC 구조및회로설계 1. 제안하는 SAR ADC의전체구조

DBPIA-NURIMEDIA

08김현휘_ok.hwp

슬라이드 제목 없음

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Nov.; 26(11),

Sequences with Low Correlation

12È«±â¼±¿Ü339~370

Chapter4.hwp

Slide 1

8-VSB (Vestigial Sideband Modulation)., (Carrier Phase Offset, CPO) (Timing Frequency Offset),. VSB, 8-PAM(pulse amplitude modulation,, ) DC 1.25V, [2

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA

09권오설_ok.hwp

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Mar.; 28(3),

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Jul.; 27(7),

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Oct.; 27(10),

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Nov.; 26(11),

DBPIA-NURIMEDIA

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 29, no. 6, Jun Rate). STAP(Space-Time Adaptive Processing)., -

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 29, no. 10, Oct ,,. 0.5 %.., cm mm FR4 (ε r =4.4)

歯1.PDF


°í¼®ÁÖ Ãâ·Â

그룹웨어와 XXXXX 제목 예제

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Jun.; 27(6),

untitled

DBPIA-NURIMEDIA

High Resolution Disparity Map Generation Using TOF Depth Camera In this paper, we propose a high-resolution disparity map generation method using a lo

DBPIA-NURIMEDIA

#Ȳ¿ë¼®

Microsoft Word - SRA-Series Manual.doc

<5B D B3E220C1A634B1C720C1A632C8A320B3EDB9AEC1F628C3D6C1BE292E687770>

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Dec.; 26(12),

±è¼ºÃ¶ Ãâ·Â-1

03 장태헌.hwp

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA

. 서론,, [1]., PLL.,., SiGe, CMOS SiGe CMOS [2],[3].,,. CMOS,.. 동적주파수분할기동작조건분석 3, Miller injection-locked, static. injection-locked static [4]., 1/n 그림

63-69±è´ë¿µ

서강대학교 기초과학연구소대학중점연구소 심포지엄기초과학연구소

(b) 미분기 (c) 적분기 그림 6.1. 연산증폭기연산응용회로

09김정식.PDF

RRH Class-J 5G [2].,. LTE 3G [3]. RRH, W-CDMA(Wideband Code Division Multiple Access), 3G, LTE. RRH RF, RF. 1 RRH, CPRI(Common Public Radio Interface)

에너지경제연구제 16 권제 1 호 Korean Energy Economic Review Volume 16, Number 1, March 2017 : pp. 95~118 학술 탄소은행제의가정용전력수요절감효과 분석 1) 2) 3) * ** *** 95

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 27, no. 8, Aug [3]. ±90,.,,,, 5,,., 0.01, 0.016, 99 %... 선형간섭

(JBE Vol. 21, No. 3, May 2016) HE-AAC v2. DAB+ 120ms..,. DRM+(Digital Radio Mondiale plus) [3] xhe-aac (extended HE-AAC). DRM+ DAB HE-AAC v2 xhe-aac..

Software Requirrment Analysis를 위한 정보 검색 기술의 응용

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Dec.; 25(12),

½½¶óÀ̵å Á¦¸ñ ¾øÀ½

1. KT 올레스퀘어 미디어파사드 콘텐츠 개발.hwp

내용 q Introduction q Binary passand modulation Ÿ ASK (Amplitude Shift Keying) Ÿ FSK (Frequency Shift Keying) Ÿ PSK (Phase Shift Keying) q Comparison of

인문사회과학기술융합학회

05 목차(페이지 1,2).hwp

1. 3DTV Fig. 1. Tentative terrestrial 3DTV broadcasting system. 3D 3DTV. 3DTV ATSC (Advanced Television Sys- tems Committee), 18Mbps [1]. 2D TV (High

DBPIA-NURIMEDIA

Microsoft PowerPoint - 30.ppt [호환 모드]

(JBE Vol. 21, No. 1, January 2016) (Regular Paper) 21 1, (JBE Vol. 21, No. 1, January 2016) ISSN 228

학습영역의 Taxonomy에 기초한 CD-ROM Title의 효과분석

<333820B1E8C8AFBFEB2D5A B8A620C0CCBFEBC7D120BDC7BFDC20C0A7C4A1C3DFC1A42E687770>

DBPIA-NURIMEDIA

05( ) CPLV12-04.hwp

a), b), c), b) Distributed Video Coding Based on Selective Block Encoding Using Feedback of Motion Information Jin-soo Kim a), Jae-Gon Kim b), Kwang-d

., 3D HDTV. 3D HDTV,, 2 (TTA) [] 3D HDTV,,, /. (RAPA) 3DTV [2] 3DTV, 3DTV, DB(, / ), 3DTV. ATSC (Advanced Television Systems Committee) 8-VSB (8-Vesti

???? 1

<313120C0AFC0FCC0DA5FBECBB0EDB8AEC1F2C0BB5FC0CCBFEBC7D15FB1E8C0BAC5C25FBCF6C1A42E687770>

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Jun.; 27(6),

11¹ÚÇý·É

DBPIA-NURIMEDIA

Journal of Educational Innovation Research 2016, Vol. 26, No. 3, pp DOI: Awareness, Supports

<31325FB1E8B0E6BCBA2E687770>

<352E20BAAFBCF6BCB1C5C320B1E2B9FDC0BB20C0CCBFEBC7D120C7D1B1B920C7C1B7CEBEDFB1B8C0C720B5E6C1A1B0FA20BDC7C1A120BCB3B8ED D2DB1E8C7F5C1D62E687770>

: 4 2. : (KSVD) 4 3. :

¼º¿øÁø Ãâ·Â-1

09È«¼®¿µ 5~152s

27 2, 17-31, , * ** ***,. K 1 2 2,.,,,.,.,.,,.,. :,,, : 2009/08/19 : 2009/09/09 : 2009/09/30 * 2007 ** *** ( :

Gray level 변환 및 Arithmetic 연산을 사용한 영상 개선

특허청구의범위 청구항 1. 복소수감마통계모델 (complex gamma statistical model) 에기초한음성검출 (VAD; Voice Activity Detection) 방법으로서, 입력된음성신호에대하여고속푸리에변환 (FFT) 을수행하여주파수영역의음성신호로변환

À±½Â¿í Ãâ·Â

(2005) ,,.,..,,..,.,,,,,

DBPIA-NURIMEDIA

大学4年生の正社員内定要因に関する実証分析

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Sep.; 26(10),

06_ÀÌÀçÈÆ¿Ü0926

(JBE Vol. 20, No. 6, November 2015) (Regular Paper) 20 6, (JBE Vol. 20, No. 6, November 2015) ISSN

01이국세_ok.hwp

1_12-53(김동희)_.hwp

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Mar.; 25(3),

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Dec.; 27(12),

(Exposure) Exposure (Exposure Assesment) EMF Unknown to mechanism Health Effect (Effect) Unknown to mechanism Behavior pattern (Micro- Environment) Re

<35335FBCDBC7D1C1A42DB8E2B8AEBDBAC5CDC0C720C0FCB1E2C0FB20C6AFBCBA20BAD0BCAE2E687770>

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Apr.; 28(4),

<445350BCB3B0E820BAB8B0EDBCAD2E687770>

2 : (JEM) QTBT (Yong-Uk Yoon et al.: A Fast Decision Method of Quadtree plus Binary Tree (QTBT) Depth in JEM) (Special Paper) 22 5, (JBE Vol. 2

Journal of Educational Innovation Research 2018, Vol. 28, No. 4, pp DOI: * A S

에너지경제연구 제13권 제1호

- 2 -

04_이근원_21~27.hwp

1. 스펙트럼분석기 (Spectrum Analyzer) 1 스펙트럼분석기 (Spectrum Analyzer) 란? - 스펙트럼분석기 (Spectrum Analyzer) 는마치프리즘이빛을파장별로분해하여보여주듯이신호의스펙트럼또는주파수를분해하여그크기를화면에표시하여주는계기이다

[ReadyToCameral]RUF¹öÆÛ(CSTA02-29).hwp

Transcription:

Journal of the Korea Academia-Industrial Cooperation Society Vol. 12, No. 12 pp. 5843-5848, 2011 http://dx.doi.org/10.5762/kais.2011.12.12.5843 LSP 파라미터의분포특성을이용한 EVRC 의음질개선에관한연구 민소연 1*, 나덕수 2 1 서일대학교정보통신과, 2 ( 주 ) 보이스웨어연구소 A Study on the Improvements of the Speech Quality by using Distribution Characteristics of LSP parameters in the EVRC(Enhanced Variable Rate Codec) So-Yeon Min 1* and Deok-Su Na 2 1 Dept. of Information and Communication, Seoil College 2 Voiceware co. Ltd, R&D center 요약 EVRC에서는채널스펙트럼의효율을높이고시스템의소비전력을줄이기위하여, 통화시간중에서사용자가말을할때만음성신호를압축하여전달하고, 말을하지않을때는음성신호를전달하지않는다. 또한, EVRC에서는음성프레임을 1, 1/2, 1/8의세가지전송률로구분하여다르게처리하고있으며, 예를들어, 1/8 전송률은입력신호가묵음구간인것을의미한다. 본연구에서는 LSP 파라미터의분포특성을이용한유성음구간, 무성음구간, 묵음구간을구분하는방법을사용하여, 유성음인경우에대해 1 rate으로부호화하고, 무성음구간의경우는 1/2 rate, 묵음의경우에는 1/8 rate으로전송하는방법에대하여제안하였다. 즉, EVRC에서 full rate으로보내는부분에대해서는기존의방식을그대로적용하며, half rate은유성음, 무성음을구분하여유성음일경우 full rate으로바꾸어전송하였고, 묵음에대해서는 EVRC 기본 rate을적용하였다. 실험과정에서는, SNR, ASDM, 전송률을측정하였으며, 제안한알고리즘을사용하는경우 EVRC에비해음성품질이향상됨을증명하였다. Abstract To improve the efficiency of the channel spectrum and to reduce the power consumption of the system in EVRC, the voice signal is compressed and transmitted only when the user speaks to. In addition to this, voice frames are divided into three rates 1, 1/2 and 1/8 and each frame is handled differently. For example, we assumed that the input is silence region if the 1/8 rate is used. In this paper, the sections are firstly separated into the voiced speech signal region, unvoiced speech signal region, and silence region by using distribution characteristics of LSP parameters. Then the paper suggested to encode 1 rate for the voiced speech signal, 1/2 rate for the unvoiced speech signal region, 1/8 rate for the silence region. In other words, traditional way of transmission is used when sending full rate in the EVRC. However, when sending half rate, the voice is firstly distinguished between voiced and unvoiced. If the voice is distinguished as voiced, voice is converted into full rate before the transmission. If it is distinguished as silence, EVRC s basic rate is applied. In the experimental results with SNR, ASDM, transmission bit rate measurement, we have demonstrated that voice quality was improved by using the proposed algorithm. Key Words : EVRC, LSP, Speech Quality, Transmission Bit Rate 1. 서론 EVRC(Enhanced variable rate codec) 는이동통신시스템 에서사용되어지고있는대표적인음성압축방식으로, 채널스펙트럼의효율을높이고시스템의소비전력을줄이기위해사람이말할때만음성을압축하여전달하고말 본논문은 2010 년도서일대학학술연구비에의해연구되었습니다. * 교신저자 : 민소연 (symin@seoil.ac.kr) 접수일 11 년 11 월 25 일수정일 11 년 12 월 12 일게재확정일 11 년 12 월 13 일 5843

한국산학기술학회논문지제 12 권제 12 호, 2011 을하지않을때는음성을전달하지않으므로저전송률이가능하다. 또한 EVRC에서는패킷타입별로 1, 1/2, 1/8의세가지전송률로구분하여다르게처리를하고있다. 예를들어, 1/8 전송률은입력신호가음성신호가아닌잡음만이존재하는묵음구간이라는것을의미하고있다 [1]. EVRC 부호화방식에서사용되는 LSP 파라미터는일정한스펙트럼민감도와저전송률부호화특성을지니며낮은스펙트럼왜곡, 좋은선형보간특성을지닌다 [2]. 본연구에서는 LSP 파라미터를이용하여음성신호의성분분리를수행하고, 이를적용한부호화기에서의음질향상을목적으로한다. 본논문의구성은다음과같다. 2장에서는 EVRC와 LSP 파라미터에대해분석하고, 3장에서는 LSP 파라미터의분포특성을이용하여유 / 무성음구간, 묵음구간을판별하고, 효율적성분분리를수행하여 rate 결정을수행함으로써음질을향상하는제안한방법에대해설명한다. 4 장에서는제안한알고리즘의실험결과를살펴보고 5장에서는결론을맺는다. 2. EVRC 와 LSP 파라미터 2.1 EVRC 부호화방식 EVRC 부호화방식은채널용량을효율적으로사용하기위해세가지의전송률을가변적으로사용한다. 즉, 최대전송률인 Rate 1, 중간전송률인 Rate 1/2, 그리고최소전송률인 Rate 1/8이다 [1]. EVRC에입력된음성신호는전처리단을통과하여코덱의음질을저하시킬수있는매우낮은저주파성분과주변잡음에대해입력신호를조절하는과정을거치게된다. 이과정은 DC 성분을제거하기위해 120Hz의차단주파수를갖는고역통과필터링과스펙트럼차감법을이용한잡음억제과정으로이루어진다. 다음으로 20ms의프레임단위로선형예측계수를구하여 LSP(Line Spectrum Pairs) 파라미터로변환된다. 또한전처리된음성신호를현재와이전프레임에서얻은 LSP 파라미터를보간 (interpolation) 하여얻은역필터 (inverse filter) 에통과시켜잔차 (residual) 신호를얻은후, 개회로검색으로지연을추정하고장구간예측이득을구한다. 그리고 RDA(Rate Determination Algorithm) 는앞의과정에서구한 17개의자기상관계수와장구간예측이득을이용하여세가지전송률중에서하나를선택한다 [1]. 프레임전송률은추정잡음레벨에비례하는전송률결정임계치 (Rate Determination Threshold) 와프레임에너 지를비교하여결정되는데추정잡음레벨이높아지면같은프레임에너지를갖는프레임이낮은전송률로부호화될확률이높아진다. 그림 1에서위에서설명되어진 EVRC에대한전체처리과정을도시화하고있다. [ 그림 1] EVRC 의전체블록도 [Fig. 1] Block diagram of EVRC 2.2 LSP 파라미터 다양한종류의저전송률음성부호화기에사용되는 LSP 파라미터는일정한스펙트럼민감도와저전송률부호화특성을지니며낮은스펙트럼왜곡, 좋은선형보간특성을지닌다. [ 그림 2] LSP 파라미터의예 (a) 자음 /s/ (b) 모음 /a/ (c),(d) /s/ 와 /a/ 에대한 LPC 분석과 LSP [Fig. 2] Example of the LSP parameter (a) Consonant /s/ (b) Vowel /a/ (c),(d) The analysis of LPC and LSP for /s/, /a/ 그림 2에서음성신호의주파수스펙트럼과 LPC 분석그리고 LSP 파라미터를보여주고있다 [2]. 즉영문 /s/ 발 5844

LSP 파라미터의분포특성을이용한 EVRC 의음질개선에관한연구 음에해당하는스펙트럼은 (a) 와같이저주파수영역의에너지가낮고고주파수영역의에너지가높다. 반면에유성음의스펙트럼은 (b) 와같이 1kHz 이내에서제 1 포만트가나타나고 3개이상의포만트가존재한다. 이와같은스펙트럼모양으로 LSP의모양도유성음과무성음에서뚜렷한차이를가진다. 먼저유성음구간에서는포만트로인해저주파수영역에서보다많은 LSP가분포하고그간격도고주파수의 LSP 간격보다좁게나타난다. 반면에무성음구간에서는고주파수영역에서 LSP가많이분포하고그간격도저주파수영역의 LSP 간격보다좁게나타난다 [2~4]. 유성음의제 1 포만트와제 2 포만트가주로저주파수영역에존재하기때문이다. 이와반대로 NLH가 NLL보다큰경우는무성음프레임이라고판단한다. 무성음프레임에해당하는스펙트럼은주요포만트가고주파영역에나타나기때문이다. 또한가지정보로는제 1 포만트의존재여부로써무성음인지유성음인지를결정한다. 즉, LSP 파라미터들의간격을조사하여 이하의영역에서좁은간격을나타내는 LSP들이존재하면유성음으로간주한다 [5,6]. 3. 제안한알고리즘 EVRC의추정잡음레벨은주피치의검출여부에따라갱신되는데, 주피치가검출되지않으면추정잡음레벨이점차높아지게된다. 또한, 이전프레임과현재프레임의관계에의해서 1/2 rate을결정하고있다. 이전프레임이 1 rate 이고현재프레임이배경잡음 (background noise) 으로결정되면현재프레임을 1/2 rate으로선택된다. 무성음 (unvoiced speech signal) 경우는잡음구간으로판단되어 frame rate 결정에오류를범할수있다. 그렇기에음성의불연속성으로인하여 1/2 rate으로결정이되는경우 rate 결정오류를범할수있어유 / 무성음구간을구분하지않으면음성이존재하는구간에서도낮은전송률로보내음질열하를초래하게된다. 또한, 기존성분분리과정에서는파열음이나천이구간이존재하는음성인경우안정된주기측정이어렵고, 에너지가낮은유성자음구간의경우배경에있어서잡음에너지와구분이어렵다. 그러므로주변잡음과임펄스 (impulse) 성잡음에도강인하며, 음절간에생기는묵음구간도음성신호에포함시켜서검출하여야한다. 그림 3은 LSP 파라미터의분포특성을이용한 EVRC에서의음질개선알고리즘의블록도이다. 먼저 LSP parameter 를이용하여유, 무성음, 묵음구간을구분하며, 유성음인경우에대해 1 rate으로 encoding하며, 무성음인경우는 1/2 rate, 묵음의경우에는 1/8 rate으로전송한다. 이과정에서샘플링주파수를 라고가정할때 이하의주파수영역에존재하는 LSP 개수를 NLL이라하고 이상의주파수영역에존재하는 LSP 개수를 NLH라하면 NLL이 NLH보다큰경우는음성신호의스펙트럼이저주파쪽에서봉우리가많이나타나는모양이어서유성음프레임구간이라고판단한다. 왜냐하면, [ 그림 3] 제안한알고리즘의블록도 [Fig. 3] Block diagram of proposed algorithm 묵음구간에서는 LSP들이비교적일정한간격으로나타나고무성음에서는고주파영역에서좁은간격을나타내는 LSP들이존재한다. 이러한특징을이용하여, 묵음구간과무성음구간의결정을위해 이상의 LSP들의간격중최소값과최대값이 2배이상차이가있는지를계산하였다. 만일차이가 2배이상존재한다면무성음이고그렇지않다면묵음으로간주한다. EVRC full rate으로보내는부분은그대로적용하며, half rate 은유 / 무성음을구분하여유성음일경우 full rate 으로바꾸어전송한다. 묵음에대해서는 EVRC에서사용하는원래의전송률을적용하여동작하므로문제삼지않는다. 5845

한국산학기술학회논문지제 12 권제 12 호, 2011 4. 실험결과 LSP 파라미터의분포특성을이용한성분분리알고리즘을 C++ 로구현하여부호화기에서의전송률을측정하였고, 음성신호각프레임구간에서 LSP 파라미터의분포특성을분석하기위해 Matlab으로구현하였다. 그림 4에서는임의의유성음구간음성프레임에대한시간영역음성파형, 주파수영역분석결과, LSP 파라미터분포특성을나타내었다. 그림 5에서는무성음구간에해당하는임의의음성프레임에대해시간영역음성파형, 주파수영역분석결과, LSP 파라미터분포특성을나타내었다. 즉, 그림 4와그림 5의실험결과를통해유성음구간은저주파수영역에서 LSP 파라미터가많이분포하고있으며, 이결과저주파수쪽에서봉우리 (pole) 가많이나타남을알수있다. 이에반하여무성음구간은고주파영역에서 LSP 파라미터와봉우리가많이존재함을알수있다. 그러므로 3장에서기술한 LSP 파라미터의분포특성을이용한성분분리에의한 EVRC rate 결정이효율적임을알수가있다. 그림 6은묵음구간에서의 LSP 파라미터의분포를나타내고있고, 비교적일정한분포특성을분석할수있다. 그러므로고주파영역에서주로봉우리가나타나는무성음구간의 LSP 파라미터의분포특성과는차이가남을알수가있다. [ 그림 5] 무성음에대한 LSP 파라미터의분포 (a) 무성음파형 (b) 스펙트럼분석 (c) LPC 분석과 LSP 파라미터 [Fig. 5] LSPs distribution of unvoiced speech signal (a) Waveform of unvoiced speech signal (b) Spectrum analysis (c) LPC analysis and LSPs [ 그림 4] 유성음에대한 LSP 파라미터의분포 (a) 유성음파형 (b) 스펙트럼분석 (c) LPC 분석과 LSP 파라미터 [Fig. 4] LSPs distribution of voiced speech signal (a) Waveform of voiced speech signal (b) Spectrum analysis (c) LPC analysis and LSPs [ 그림 6] 묵음구간에대한 LSP 파라미터의분포 (a) 시간영역파형 (b) 스펙트럼분석 (c) LPC 분석과 LSP 파라미터 [Fig. 6] LSPs distribution of silence region (a) Waveform of silence region (b) Spectrum analysis (c) LPC analysis and LSPs 제안한알고리즘의성능평가를위해부호화기를통과한합성음의음질비교와전송률비교를수행하였다. 즉, 음질비교과정에서는객관적인음질평가방법인 SNR (Signal to Noise Ratio) 과선형예측계수에기반을둔음성의오차를측정하는평균스펙트럼왜곡측정 (Average Spectral Distortion Measure) 방법을사용하였으며, EVRC 5846

LSP 파라미터의분포특성을이용한 EVRC 의음질개선에관한연구 기본 rate을사용하는경우와제안하는방법을사용하는경우의전송률을비교하여실험결과를나타내었다. 식 (1) 을사용하여기존 EVRC와제안하는알고리즘이적용된음성부호화기에서의프레임별 SNR을구하였다. 또한식 (2) 를사용하여전체음성의평균 SNR을구하였으며, 여기서 N은총프레임수를의미한다. (1) (2) [ 표 2] 평균스펙트럼왜곡측정실험결과 [Table 2] Experimental results of ASDM EVRC 제안한방법감소율 [%] 발성 1 1.2106 0.8377 30.8 발성 2 1.1152 0.5290 52.6 발성 3 0.8458 0.0925 89.1 발성 4 0.8529 0.3624 57.2 표 3에서는전송률측정결과를나타내었다. 즉, LSP 파라미터의분포특성을통해성분분리과정을거친제안한알고리즘을적용한음성부호화기에서평균 3.82% 가증가하였으며, 이는성분분리과정의오버헤드가추가되었음을의미한다. 평균스펙트럼왜곡측정을위해식 (3) 을사용하였으며. 여기서 는 full rate으로부호화 / 복호화된음성신호의 LPC 스펙트럼이고, 은기본 rate을사용하는 EVRC와제안한알고리즘을적용한부호화 / 복호화된음성스펙트럼에해당하는 LPC 스펙트럼을의미한다. 또한, N은프레임의총개수를의미한다. 표 1과표 2에서는객관적음질평가를수행한결과를나타내었으며, 신호대잡음비의측정결과에서는제안한알고리즘이평균 53% 가증가하였다. 그리고, 평균스펙트럼왜곡의측정결과는약 57% 가감소하여음질향상을가져옴을입증하였다. 제안한알고리즘을사용한음성부호화기에서음질개선효과가큰이유는 LSP 파라미터의분포특성을이용한정확한성분분리를수행하기때문이다. 예를들어, 무성음구간이잡음구간으로판단되는등의오류를줄여정확한 rate 결정을수행하게된다. [ 표 1] SNR 실험결과 [Table 1] Experimental results of SNR EVRC 제안한방법증가율 [%] 발성 1 36.93 50.24 36.04 발성 2 38.95 53.97 38.56 발성 3 33.98 56.31 65.71 발성 4 38.15 66.88 75.31 (3) [ 표 3] 전송률에대한실험결과 [ 단위 :kbps] [Table 3] Experimental results of transmission bit rate EVRC 제안한방법증감율 [%] 발성 1 7.51 7.99 +6.39 발성 2 8.86 9.04 +2.03 발성 3 9.25 9.57 +3.46 발성 4 8.87 9.17 +3.38 5. 결론 EVRC 부호화방식은이동통신시스템에서채널용량을효율적으로사용하기위해세가지의전송률을가변적으로사용한다. 본연구에서는 LSP 파라미터의분포특성을이용하여유성음구간, 무성음구간, 묵음구간을구분하며, 유성음인경우에대해 1 rate, 무성음구간의경우는 1/2 rate, 묵음의경우에는 1/8 rate으로전송하는방법에대하여제안하였다. 즉, EVRC full rate으로보내는부분은그대로적용하며, half rate은유 / 무성음구간을구분하여유성음구간에대해서는 full rate으로바꾸어전송하였다. 실험결과에서신호대잡음비의경우, 제안한방법이약 53% 가증가하고평균스펙트럼왜곡의측정결과는약 57% 가감소하여음질개선의효과가높았지만, 전송률에서는오버헤드가추가되어약 3.8% 증가함을알수있었다. 본논문에서제안한알고리즘의음질개선효과가큰이유는성분분리를효과적으로수행하여무성음구간을잡음구간으로판단되는오류를줄여정확한 rate 결정을하였기때문이라고판단되어진다. 또한, 에너지가낮은 5847

한국산학기술학회논문지제 12 권제 12 호, 2011 유성자음구간의경우에도효율적으로성분분리를수행하였음을알수가있었다. 향후, 성분분리알고리즘에대한다양한연구를통해, 지속적인 EVRC의음질개선과전송률감소를위한연구를수행할계획이다. References [1] TIA/EIA-IS-127 Enhanced Variable Rate Codec, 1997. [2] S. Saito and K. Nakata, Fundamentals of Speech Signal Processing, pp. 126~132, Academic Press, 1985. [3] A.M. Kondoz, Digital Speech, pp. 84~96, John & Sons Ltd, 1994. [4] L.R. Rabiner and R.W. Schafer, Digital Processing of Speech Signals, pp. 367, Prentice Hall, 1978. [5] S.Y. Min and H.C. Kim, "The V/UV Decision Algorithm for a Reduction of the Transmission Bit Rate in the CELP Vocoder," The Journal of Korea Navigation Institute, Vol.11, No.3, pp. 87~92, 2007. [6] S.Y. Min, "Complexity Reduction Algorithm of Speech Coder(EVRC) for CDMA Digital Cellular System," Journal of Korea Multimedia Society, Vol.10, No.12, pp. 1551~1558, 2007. [7] H. Y. Gong, "A Novel AOCG-OFDM Modulation Technique for Variable-high-bit-rate", Journal of The Institute of Webcasting, Internet and Telecommunication, Vol 10, No 2, pp. 152~158, 2010. [8] J. C. Kim, "Channel Capacity of Additional Data Transmission System for Spectrum Efficiency Improvement", Journal of The Institute of Webcasting, Internet and Telecommunication, Vol 10, No 4, pp. 145~150, 2010. 나덕수 (Deok-Su Na) [ 정회원 ] < 관심분야 > 음성합성시스템, 음성신호처리 1998 년 2 월 : 숭실대학교정보통신공학과 ( 공학사 ) 2000 년 2 월 : 숭실대학교정보통신공학과 ( 공학석사 ) 2009 년 2 월 : 숭실대학교정보통신공학과 ( 공학박사 ) 2001 년 11 월 ~ 현재 : ( 주 ) 보이스웨어연구소책임보 민소연 (So-Yeon Min) [ 종신회원 ] 1994 년 2 월 : 숭실대학교전자공학과 ( 공학사 ) 1996 년 2 월 : 숭실대학교일반대학원전자공학과 ( 공학석사 ) 2003 년 2 월 : 숭실대학교일반대학원전자공학과 ( 공학박사 ) 2005 년 3 월 ~ 현재 : 서일대학교정보통신과부교수 < 관심분야 > 통신및신호처리, 임베디드시스템 5848