특허청구의범위 청구항 1. 입력된음성신호에대하여고속푸리에변환 (FFT) 을수행하여주파수영역의음성신호로변환시키는단계와, 상기주파수영역으로변환된음성신호로부터잡음신호의파워를추정하는단계와, 상기추정된잡음신호의파워에기초하여음성의존재와비존재에대하여, 순수음성과잡음의 DFT 계수가

Similar documents
특허청구의범위 청구항 1. 복소수감마통계모델 (complex gamma statistical model) 에기초한음성검출 (VAD; Voice Activity Detection) 방법으로서, 입력된음성신호에대하여고속푸리에변환 (FFT) 을수행하여주파수영역의음성신호로변환

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA

등록특허 (19) 대한민국특허청 (KR) (12) 등록특허공보 (B1) (51) 국제특허분류 (Int. Cl.) G10L 15/14 ( ) G10L 15/10 ( ) G10L 15/18 ( ) (52) CPC 특허분류

DBPIA-NURIMEDIA

특허청구의 범위 청구항 1 복수개의 프리캐스트 콘크리트 부재(1)를 서로 결합하여 연속화시키는 구조로서, 삽입공이 형성되어 있고 상기 삽입공 내면에는 나사부가 형성되어 있는 너트형 고정부재(10)가, 상기 프리캐스 트 콘크리트 부재(1) 내에 내장되도록 배치되는 내부

DBPIA-NURIMEDIA

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt

이 발명을 지원한 국가연구개발사업 과제고유번호 부처명 교육과학기술부 연구사업명 기초사업연구-일반연구자지원사업-기본연구지원사업(유형II) 연구과제명 시공간 부호 협력 통신을 위한 동기 알고리즘 연구 기 여 율 1/1 주관기관 서울시립대학교 산학협력단


DBPIA-NURIMEDIA

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

통신이론 2 장주파수해석 성공회대학교 정보통신공학과 1

Sequences with Low Correlation

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

본 발명은 중공코어 프리캐스트 슬래브 및 그 시공방법에 관한 것으로, 자세하게는 중공코어로 형성된 프리캐스트 슬래브 에 온돌을 일체로 구성한 슬래브 구조 및 그 시공방법에 관한 것이다. 이를 위한 온돌 일체형 중공코어 프리캐스트 슬래브는, 공장에서 제작되는 중공코어 프

(72) 발명자 박세웅 서울특별시관악구신림동산 56-1 서울대학교뉴미디어통신공동연구소 최진구 서울특별시영등포구당산동 2 가대우메종아파트 101 동 909 호 - 2 -

DBPIA-NURIMEDIA

슬라이드 1

½½¶óÀ̵å Á¦¸ñ ¾øÀ½

지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월

서 인코딩한 데이터를 무선으로 송신하기 위한 무선 송신 수단; 및 통화중 상기 입력 수단으로부터의 음원 데이터 전송신 호에 따라 상기 저장 수단에 저장되어 있는 해당 음원 데이터를 상기 디코딩 수단에 의해 디코딩하고, 상기 디코딩한 음원 데이터와 상기 입력 수단을 통해

특허청구의범위청구항 1 복수의영상검출부로부터출력되는영상의히스토그램 (histogram) 을계산하는단계 ; 상기복수의영상검출부로부터출력되는영상을히스토그램평활화 (histogram equalization) 하는단계 ; 상기복수의영상검출부중하나의영상검출부를선택하는단계 ; 및

FGB-P 학번수학과권혁준 2008 년 5 월 19 일 Lemma 1 p 를 C([0, 1]) 에속하는음수가되지않는함수라하자. 이때 y C 2 (0, 1) C([0, 1]) 가미분방정식 y (t) + p(t)y(t) = 0, t (0, 1), y(0)

Ç¥Áö-¸ñÂ÷

슬라이드 1

(72) 발명자 정진곤 서울특별시 성북구 종암1동 이용훈 대전광역시 유성구 어은동 한빛아파트 122동 1301 호 - 2 -

04 Çмú_±â¼ú±â»ç

많이 이용하는 라면,햄버그,과자,탄산음료등은 무서운 병을 유발하고 비만의 원인 식품 이다. 8,등겨에 흘려 보낸 영양을 되 찾을 수 있다. 도정과정에서 등겨에 흘려 보낸 영양 많은 쌀눈과 쌀껍질의 영양을 등겨를 물에 우러나게하여 장시간 물에 담가 두어 영양을 되 찾는다

<363020B9CEBCD2BFAC2D4C535020C6C4B6F3B9CCC5CDC0C720BAD0C6F7C6AFBCBAC0BB20C0CCBFEBC7D12E687770>

Chapter4.hwp

이 발명을 지원한 국가연구개발사업 과제고유번호 A 부처명 지식경제부 연구관리전문기관 연구사업명 IT핵심기술개발 연구과제명 융합형 포털서비스를 위한 이용자 참여형 방송기술개발 기여율 주관기관 전자부품연구원 연구기간 2008년 03월 01일 ~ 2

그룹웨어와 XXXXX 제목 예제

G Power

용역보고서

Microsoft PowerPoint - SBE univariate5.pptx

<445350BCB3B0E820BAB8B0EDBCAD2E687770>

특허청구의 범위 청구항 1 앵커(20)를 이용한 옹벽 시공에 사용되는 옹벽패널에 있어서, 단위패널형태의 판 형태로 구성되며, 내부 중앙부가 후방 하부를 향해 기울어지도록 돌출 형성되어, 전면이 오 목하게 들어가고 후면이 돌출된 결속부(11)를 형성하되, 이 결속부(11

특허청구의 범위 청구항 1 일반전화를 이용한 위험 알림시스템 및 실시간 영상전송 장치에서 CID(콜백넘버) 장치를 포함한 서버 및 그 장 비를 포함하며, 영상서버와 연동한 형태를 상황실에 전송하여 출동하는 시스템을 포함하는 것을 특징으로 하는 일반전화를 이용한 위험 알

특허청구의 범위 청구항 1 복수의 FA(Frequency Allocation)를 사용하는 광대역 무선통신 시스템에서 프리앰블 의사 잡음(Pseudo Noise : PN) 코드 할당 방법에 있어서, 각 FA에 고유의 인덱스를 정의하는 과정과, 기준 FA 인덱스를 사용하는

한것으로스마트단말기에의하여드론조종앱을설치하는제 1 단계 ; 스마트단말기에의하여드론의불루투스통 신부에부여된고유식별번호를입력저장하고드론의불루투스를인식하며드론의블루투스통신부로부터회신되 는신호의수신레벨을분석하여최대통신거리를확인하여저장하는제 2 단계 ; 스마트단말기에의하여최대통

(52) CPC 특허분류 B01D 53/62 ( ) Y02C 10/10 ( ) (72) 발명자 이정현 대전광역시서구대덕대로 246 넥서스밸리 B 동 1417 호 박영철 대전광역시유성구반석동로 33 반석마을 5 단지아파트 505 동 201 호 이발명

<322EBCF8C8AF28BFACBDC0B9AEC1A6292E687770>

statistics

% Rectangular Value 입력 t = -50 : 1 : 50; % 시간영역 for i = 1 : 101 if abs ( t ( i ) ) < 10 x ( i ) = 1; else x ( i ) = 0; % 화면을 2 열 1 행으로나눈후 % 2 열 1 행에 R

특허청구의 범위 청구항 1 알람을 출력하기 위한 출력 인터페이스; 사용자의 안구전도값을 측정하기 위한 안구전도 측정부; 및 상기 안구전도 측정부가 측정한 안구전도값을 이용하여 사용자의 졸음 상태를 감지하고, 그에 따라 상기 출력 인터페이스로 알람을 출력하는 졸음상태 판

실용신안 등록청구의 범위 청구항 1 톤백마대가 설치될 수 있도록 일정간격을 두고 설치되는 한 쌍의 지지프레임과, 상기 지지프레임과 지지프레임의 상부를 서로 연결하는 한 쌍의 연결프레임과, 상기 연결프레임의 상부에 일정간격을 두고 다수 설치되어 상기 톤백마대와 그 투입구

이발명을지원한국가연구개발사업 과제고유번호 NRF-2012R1A1A4A 부처명 교육과학기술부 연구관리전문기관 한국연구재단 연구사업명 지역대학우수과학자지원사업 연구과제명 저주파신호와바이스태틱레이다를동시에이용한스텔스형표적의인식에관한연구 기여율 1/1 주관기관

슬라이드 1

소성해석

28 저전력복합스위칭기반의 0.16mm 2 12b 30MS/s 0.18um CMOS SAR ADC 신희욱외 Ⅰ. 서론 Ⅱ. 제안하는 SAR ADC 구조및회로설계 1. 제안하는 SAR ADC의전체구조

PowerPoint Presentation

第 1 節 組 織 11 第 1 章 檢 察 의 組 織 人 事 制 度 등 第 1 項 大 檢 察 廳 第 1 節 組 대검찰청은 대법원에 대응하여 수도인 서울에 위치 한다(검찰청법 제2조,제3조,대검찰청의 위치와 각급 검찰청의명칭및위치에관한규정 제2조). 대검찰청에 검찰총장,대

Lecture12_Bayesian_Decision_Thoery

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Dec.; 25(12),

(Microsoft PowerPoint - Ch21_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345])

(72) 발명자 오인환 서울 노원구 중계로 195, 101동 803호 (중계동, 신 안동진아파트) 서혜리 서울 종로구 평창14길 23, (평창동) 한훈식 서울 강남구 언주로71길 25-5, 301호 (역삼동, 영 훈하이츠) 이 발명을 지원한 국가연구개발사업 과제고유번호

실험 5

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Mar.; 28(3),

<4D F736F F F696E74202D2035BBF3C6F2C7FC5FBCF8BCF6B9B0C1FA2E BC8A3C8AF20B8F0B5E55D>

1. 스펙트럼분석기 (Spectrum Analyzer) 1 스펙트럼분석기 (Spectrum Analyzer) 란? - 스펙트럼분석기 (Spectrum Analyzer) 는마치프리즘이빛을파장별로분해하여보여주듯이신호의스펙트럼또는주파수를분해하여그크기를화면에표시하여주는계기이다

Probabilistic graphical models: Assignment 3 Seung-Hoon Na June 7, Gibbs sampler for Beta-Binomial Binomial및 beta분포는 다음과 같이 정의된다. k Bin(n, θ):

Chap 6: Graphs

텀블러514


특허청구의범위청구항 1 네트워크를통해외부음악메타데이터제공자로부터음악메타데이터가수신되면상기음악메타데이터를임시음악메타데이터에저장하는단계와, 상기임시저장되는음악메타데이터를파싱처리하여메타데이터요소를분리하는단계와, 상기파싱처리된음악메타데이터중주요필드정보를전처리정제하는단계와, 상

105È£4fš

(72) 발명자 김도규 서울특별시성북구장위 3 동 박준일 서울특별시강서구등촌동 서광아파트 103 동 803 호 유형규 경기도광명시광명 4 동한진아파트 101 동 1801 호 - 2 -

Gray level 변환 및 Arithmetic 연산을 사용한 영상 개선

PART

Part Part

£01¦4Àå-2

½ºÅ丮ÅÚ¸µ3_³»Áö

272*406OSAKAÃÖÁ¾-¼öÁ¤b64ٽÚ

대 표 도 - 2 -

Microsoft Word - SAS_Data Manipulate.docx


DBPIA-NURIMEDIA

KARAAUTO_4¿ù.qxd-ÀÌÆå.ps, page Normalize

특허청구의 범위 청구항 1 소스 컴퓨팅 디바이스로부터 복수의 컴퓨팅 디바이스들 중 적어도 하나의 컴퓨팅 디바이스로의 무선 액세스 포 인트를 통한 데이터 송신들에 대한 (i) 현재 데이터 레이트 및 (ii) 최고 데이터 레이트를 구축하는 단계; 상기 복수의 컴퓨팅 디바이

명세서청구범위청구항 1 갠트리의헤드로부터방사선을조사하는선형가속기에사용되고, 상기헤드에설치되고, 방사선이조사되는환자의치료중심을향해레이저를쏘고환자의체표면에서반사된레이저를감지하여환자의체표면까지의거리를측정하는레이저거리측정기 ; 상기레이저거리측정기의데이터를수신하여 SSD(sou

이 발명을 지원한 국가연구개발사업 과제고유번호 부처명 방송통신위원회 연구사업명 방송통신기술개발사업 연구과제명 안전한 전자파환경 조성 주관기관 한국전자통신연구원 연구기간 ~

도 1 명세서 도면의 간단한 설명 도 1은 본 발명의 일실시예에 따른 비접촉 USB 리더기의 블럭도를 나타낸다. 도 2는 도 1의 비접촉 USB 리더기를 이용한 인프라 구축 시스템의 개략도를 나타낸다. 도 3은 도 1의 비접촉 USB 리더기를 이용한 이용 방법에 대한

PowerPoint Template

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

Microsoft PowerPoint - Ch13

이발명을지원한국가연구개발사업 과제고유번호 부처명 미래창조부 연구관리전문기관 한국산업기술평가관리원 연구사업명 산업융합원천기술개발 연구과제명 단일노드 48TB 이상을지원하는개방형하둡스토리지어플라이언스 (Hadoop Storage Appliance) 개발 기

(71) 출원인 나혜원 대구 달서구 도원동 1438 대곡사계절타운 나혜리 대구 달서구 도원동 1438 대곡사계절타운 (72) 발명자 나혜원 대구 달서구 도원동 1438 대곡사계절타운 나혜리 대구 달서구 도원동 1438 대

이 장에서 사용되는 MATLAB 명령어들은 비교적 복잡하므로 MATLAB 창에서 명령어를 직접 입력하지 않고 확장자가 m 인 text 파일을 작성하여 실행을 한다

상기 DVD 플레이어는 거의 거치형(톱니형)으로 개발되어 텔레비젼, AC3 앰프 및 6개의 스피커 또는 단순 히 스테레오 시스템 등에 연결되어 영화 재생용으로만 특징지워지고, 반면에 상기 DVD-롬 드라이브는 컴 퓨터에 장착되어 소정의 인터페이스 방식을 통해 컴퓨터 테

특허청구의범위청구항 1 투입된음식물을분쇄하는분쇄기 ; 상기분쇄된음식물을가열할수있는마그네트론 ; 및탈취작용을하는저온촉매필터를포함하는음식물처리기에있어서, 상기마그네트론이상기저온촉매필터를일정온도로가열할수있는것을특징으로하는, 청구항 2 제 1 항에있어서, 상기음식물처리기는상기

<5BB0EDB3ADB5B55D B3E2B4EBBAF12DB0ED312D312DC1DFB0A32DC0B6C7D5B0FAC7D02D28312E BAF2B9F0B0FA20BFF8C0DAC0C720C7FCBCBA2D D3135B9AEC7D72E687770>

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

<B3EDB4DC28B1E8BCAEC7F6292E687770>

11 주차 M 진디지털변조 (1) 통과대역신호의표현 (2) Quadrature Phase Shift Keying (QPSK) (3) Minimum Shift Keying (MSK) (4) M-ary Amplitude Shift Keying (M-ASK) (5) M-ar

(72) 발명자 김재훈 대전광역시유성구하기동 김정훈 서울특별시관악구성현로 80, 116 동 603 호 ( 봉천동, 관악드림타운 ) 이발명을지원한국가연구개발사업 과제고유번호 부처명 방송통신위원회 연구사업명 정보통신산업원천기술개발사업 연구과제명

= Fisher, I. (1930), ``The Theory of Interest,'' Macmillan ,

특허청구의 범위 청구항 1 몸체(110)의 일측에는 테스트의 필요성에 따라 여타한 디젤 자동차(100)에서 분리시킨 상태의 분리형 커먼레일 인젝트(110)를 고정할 수 있는 분리형 인젝터 고정부(20)가 구비되고, 그 고정부(20)의 하측에는 분리형 커먼 레일 인젝터(

pissn eissn Vol.10 No.4 pp 말소리와음성과학 합성에의한음질변환에관한연구 Voice qualit

Transcription:

(19) 대한민국특허청 (KR) (12) 등록특허공보 (B1) (51) Int. Cl. G10L 11/02 (2006.01) G10L 15/14 (2006.01) G10L 11/06 (2006.01) (45) 공고일자 (11) 등록번호 (24) 등록일자 2007 년 05 월 16 일 10-0718846 2007 년 05 월 10 일 (21) 출원번호 10-2006-0118920 (65) 공개번호 10-2006-0134882 (22) 출원일자 2006년11월29일 (43) 공개일자 2006년12월28일 심사청구일자 2006년11월29일 (73) 특허권자인하대학교산학협력단 * (72) 발명자장준혁 * (74) 대리인김건우 (56) 선행기술조사문헌 10-2004-56977 10-1999-40215 10-2006-57919 10-2005-5054 10-2004-94642 심사관 : 경연정 전체청구항수 : 총 1 항 (54) 음성검출을위한통계모델을적응적으로결정하는방법 (57) 요약 본발명은음성검출을위한통계모델을적응적으로결정하는방법에관한것으로서, 보다구체적으로는 (1) 과거 m 개의이전프레임에서의잡음이섞인음성에대한 DFT 계수들을포함하는벡터에대하여, KS 테스트통계량을구하는단계와, (2) 상기구해진 KS 테스트통계량을이용하여 KS 테스트통계량에대한평가치를구하는단계와, (3) 각각의통계모델에대해구해진상기평가치들을비교하여, 평가치가최소가되는통계모델을최적통계모델로선택하는단계와, (4) 상기단계 (1) 내지 (3) 를일정구간의프레임마다반복하여해당일정구간의프레임에대한최적통계모델을적응적으로선택하는단계를포함하는방법에관한것이다. 본발명은, 음성검출을위한통계모델을잡음의유형및 SNR 조건에따라서적응적으로결정함으로써, 기존의가우시안통계모델을사용하는경우에비해음성검출성능을향상시킬수있다. 대표도 도 4-1 -

특허청구의범위 청구항 1. 입력된음성신호에대하여고속푸리에변환 (FFT) 을수행하여주파수영역의음성신호로변환시키는단계와, 상기주파수영역으로변환된음성신호로부터잡음신호의파워를추정하는단계와, 상기추정된잡음신호의파워에기초하여음성의존재와비존재에대하여, 순수음성과잡음의 DFT 계수가특정통계모델을따른다고가정함으로써주파수영역에대한우도비 (Likelihood Ratio) 를결정하는단계와, 상기결정된우도비로부터음성검출에대한결정규칙 (Decision Rule) 을계산하는단계로구성되는음성검출방법 (VAD; Voice Activity Detection) 에있어서, 상기특정통계모델을적응적으로결정하는방법으로서, (1) X(t) 가프레임 t 에서의잡음이섞인음성에대한 DFT 계수라고하면, 과거 m 개의이전프레임에서의잡음이섞인음 성에대한 DFT 계수들을포함하는스트통계량 T t (X m ) 을구하는단계 ; 에대하여, 다음수학식을이용하여 KS 테 여기서, F x (X i ) 는아래수학식과같이정의되는경험적인 (empirical) 누적분포함수이며, F(X i ) 는특정통계모델에대한 누적분포함수이다. 여기서, 은데이터 X의순서통계 (order statistics) 로서, X의원소들을분류하고정렬하여 X의가장작은원소인 X (1) 에서부터 X의가장큰원소인 X (N) 까지순서대로배열한것이다. (2) 상기구해진 KS 테스트통계량 T t (X m ) 을이용하여다음수학식에의해 KS 테스트통계량 T t (X m ) 에대한평가치를구 하는단계 ; 여기서, 는평탄화파라미터이다. (3) 각각의통계모델에대해구해진상기평가치들을비교하여, 평가치가최소가되는통계모델을최적통계모델로선택하는단계 ; 및 (4) 상기단계 (1) 내지 (3) 를일정구간의프레임마다반복하여해당일정구간의프레임에대한최적통계모델을적응적으로선택하는단계 를포함하는방법. 명세서 발명의상세한설명 발명의목적 - 2 -

발명이속하는기술및그분야의종래기술 본발명은음성검출을위한통계모델을결정하는방법에관한것으로서, 특히음성검출을위한통계모델을일정프레임구간마다적응적으로결정하는방법에관한것이다. 음성검출 (VAD; Voice Activity Detection) 은, 활성음성 (active speech) 을비음성으로부터구분하는고전적인문제를지칭하는것으로, 음성코딩, 음성인식, 잡음이섞인음성의향상, 핸즈프리회의, 및에코제거와같은다양한음성통신시스템에대한애플리케이션을가지고있다. 특히, VAD 는, 통신대역폭의용량및커버리지를향상시키는가장정밀한방식중하나인가변음성코딩의주요한부분이되어왔다. 이러한이유로, 다양한유형의 VAD 알고리즘이제안되어왔다. VAD 에대한초기알고리즘들은대부분선형예측코딩 (LPC; linear prediction coding) 파라미터들, 에너지레벨들, 포먼트형상, 영교차비율 (ZCR; zero crossing rate), 켑스트럴특성 (cepstral features), 음성신호의적응모델링, 및주기성평가에기초하고있다. 보다최근에는, 패턴인식및 LPC 잔여의고차큐뮬런트 (higher order cumulants) 에기초한 VAD 접근법이새로운전략으로서제안되어왔다. 예를들면, 특히에너지차이, ZCR, 및스펙트럼차이를 ITU-T G.729 Annex B 에적용시켜왔다. 유사한접근법을, 3 세대파트너십프로젝트 2(3GPP2; 3rd Generation Partnership Project2), ITU-T G.723.1 및유럽전화통신표준협회 (European Telecommunications Standards Institutes) 적응형다 - 비율 (AMR; Adaptive Multi-Rate) VAD 옵션 2 에서선택가능한모드보코더에적용하는시도도있었다. 최근에, 일련의가설이적용된우도비테스트 (LRT; Likelihood Ratio Test) 로부터구해지는결정규칙과함께, 통계모델을이용함으로써 VAD 의성능을개선하려는노력이이루어져왔다. VAD 알고리즘에기초한통계모델은 Ephraim 과 Malah 의연구로부터비롯되었다. 일부연구자들은가우시안통계모델을 VAD 에적용하는알고리즘을시도하였는데, 여기서파라미터들의평가가 DD(decision-directed) 접근법에의해수행되었다. 이알고리즘은, 비록관련파라미터들의최적화가요구되기는하였으나, 기존의알고리즘들에비해높은검출정확도를나타내었다. 통계모델에기초한방법은소프트결정스킴 (soft decision scheme) 과결합됨으로써더욱개선되었다. 잘알려진바와같이, DFT 도메인에서주로동작하는기존의 VAD 알고리즘의대부분은순수음성 (clean speech) 과잡음의스펙트럼이가우시안분포에의해특성지어진다고가정한다. 그러나최근의연구결과에따르면, 순수음성과잡음의 DFT 계수들은가우시안분포가아닌감마및라플라시안분포와같은다른확률밀도함수 (probability density function; 이하 'PDF' 라함 ) 에의해보다효과적으로설명된다고보고되고있다. 따라서음성검출성능을향상시키기위하여, 순수음성과잡음의 DFT 계수를모델링할새로운분포모델이요구되고있다. 발명이이루고자하는기술적과제 본발명은상기와같은문제인식에서비롯된것으로서, 순수음성과잡음의 DFT 계수를기존의가우시안통계모델대신에잡음의유형및 SNR 조건에따라서적합한통계모델을적응적으로결정하는방법을제공하는것을그목적으로한다. 발명의구성 상기한목적을달성하기위한본발명의특징에따른, 음성검출을위한통계모델을적응적으로결정하는방법은, 입력된음성신호에대하여고속푸리에변환 (FFT) 을수행하여주파수영역의음성신호로변환시키는단계와, 상기주파수영역으로변환된음성신호로부터잡음신호의파워를추정하는단계와, 상기추정된잡음신호의파워에기초하여음성의존재와비존재에대하여, 순수음성과잡음의 DFT 계수가특정통계모델을따른다고가정함으로써주파수영역에대한우도비 (Likelihood Ratio) 를결정하는단계와, 상기결정된우도비로부터음성검출에대한결정규칙 (Decision Rule) 을계산하는단계로구성되는음성검출방법 (VAD; Voice Activity Detection) 에있어서, 상기특정통계모델을적응적으로결정하는방법으로서, (1) X(t) 가프레임 t 에서의잡음이섞인음성에대한 DFT 계수라고하면, 과거 m 개의이전프레임에서의잡음이섞인음 성에대한 DFT 계수들을포함하는테스트통계량 T t (X m ) 을구하는단계 ; 에대하여, 다음수학식 1 을이용하여 KS - 3 -

수학식 1 여기서, F x (X i ) 는다음수학식 2 와같이정의되는경험적인 (empirical) 누적분포함수이며, F(X i ) 는특정통계모델에대한 누적분포함수이다. 수학식 2 여기서, 은데이터 X의순서통계 (order statistics) 로서, X의원소들을분류하고정렬하여 X의가장작은원소인 X (1) 에서부터 X의가장큰원소인 X (N) 까지순서대로배열한것이다. (2) 상기구해진 KS 테스트통계량 T t (X m ) 을이용하여다음수학식 3 에의해 KS 테스트통계량 T t (X m ) 에대한평가치를 구하는단계 ; 수학식 3 여기서, 는평탄화파라미터이다. (3) 각각의통계모델에대해구해진상기평가치들을비교하여, 평가치가최소가되는통계모델을최적통계모델로선택하는단계 ; 및 (4) 상기단계 (1) 내지 (3) 를일정구간의프레임마다반복하여해당일정구간의프레임에대한최적통계모델을적응적으로선택하는단계 를포함하는것을그특징으로한다. 이하에서는본발명의실시예를도면을참조하여상세히설명한다. 본발명의실시예는다양한잡음조건에서잡음에오염된음성신호의 DFT 계수를 VAD 에적용하기위해주어진조건에적합한통계모델을적응적으로결정하는방법을제안한다. 본발명의실시예에서는먼저다양한잡음에오염된음성조건하에서적합도 (Goodness Of Fit; 이하 'GOF' 라함 ) 테스트를적용함으로써가우시안모델, 복소수라플라시안모델및복소수감마모델을서로비교한후, 우도비테스트 (Likelihood Ration Test; 이하 'LRT' 라함 ) 에기반한결정규칙 (Decision Rule) 을고려한다. 1. 통계적모델 먼저, 잡음신호 N(t) 와음성신호 S(t) 의합이 X(t) 라고가정하고, 이때가설 H 0 과 H 1 이각각음성신호가없는경우와음 성신호가있는경우를나타낸다고하면, 가설 H 0 과 H 1 에서, X(t) 는각각다음의수학식 4 및 5 를만족한다. 수학식 4-4 -

수학식 5 여기서, 는잡음이섞인음성의 DFT 계수, 는순수음성의 DFT 계수이다. 는잡음의 DFT 계수, 상기한통계적모델은적절한 DFT 계수분포를선택함으로써완료된다. 본발명의실시예에서는 DFT 계수의적절한분포로서기존에흔히사용되고있는가우시안확률밀도함수를채택하는대신다중확률밀도함수중하나를잡음의유형및 SNR 조건에따라서적응적으로선택한다. (1) 가우시안통계모델 가우시안 PDF 에서, 양가설 (H0, H1) 에의해결정되는잡음스펙트럼성분 (noisy spectral component) 의분포는다음의수학식 6 및 7 과같이주어진다. 수학식 6 수학식 7 여기서, 와는각각잡음 N k 및순수음성 S k 의분산 (variance) 을나타낸다. (2) 복소수라플라시안통계모델 다음으로, 복소수라플라시안 PDF 에서, DFT 계수 X k 의실수부 (real part) 와허수부 (imaginary part) 를각각 X k(r) 와 X k (I) 로가정하면, X k(r) 와 X k(i) 는다음의수학식 8 및 9와같이분포된다. 수학식 8 수학식 9 여기서, 는 X k 의분산을나타낸다. 만약 X k 의실수부및허수부가서로독립적이라고더가정하면, X k 의분포는다음 수학식 10 과같이될수있다. - 5 -

수학식 10 상기수학식 10 으로부터, 양가설 (H0, H1) 에의해결정되는 DFT 계수의분포는다음수학식 11 및 12 와같이주어질수있다. 수학식 11 수학식 12 (3) 복소수감마통계모델 마지막으로복소수감마 PDF 에대해살펴본다. 각각의 DFT 계수의실수부와허수부 X k(r) 와 X k(i) 는각각다음의수학식 13 및 14 에따라분포된다. 수학식 13 수학식 14 만약실수부와허수부가라플라시안경우에서처럼서로독립적이라고더가정하면, DFT 계수 X k 의분포는다음수학식 15 와같이주어진다. 수학식 15 수학식 15 를 2 개의가설 H 0 과 H 1 에적용하면, DFT 계수의분포는다음수학식 16 및 17 과같이얻어진다. 수학식 16-6 -

수학식 17 성공적인 VAD 동작을위해서, 본발명의실시예에서는 H 0 과 H 1 에의해결정되는잡음스펙트럼요소를위한통계적적합 성테스트 (statistical fitting test) 를수행한다. 확률밀도함수 (PDF) 의선택을위해, 본발명의실시예에서는적합도테스트 (GOF test; Goodness-of-Fit test) 로서잘알려진 Kolomogorov-Sriminov 테스트 ( 이하, 'KS 테스트 ' 라함 ) 를적용한다. KS 테스트를적용함으로써, 각통계적인가정에대한신뢰성있는관측을보장할수있다. KS 테스트는경험적인 (empirical) 누적분포함수 (cumulative distribution function; 이하 'CDF' 라함 ) F x 를소정의분포함수 F 와비교한다. 가잡음이섞인음성의 DFT 계수를나타내는벡터라고가정할때, 앞서언급한수학식 2 로서나타낼수있는함수를경험적 CDF 로서사용하였다 ( 참조를위하여수학식 2 를다시기재함 ). < 수학식 2> 여기서, 은데이터 X의순서통계 (order statistics) 이다. 순서통계를계산하기위해, X의원소들을분류하고정렬하여, X의가장작은원소인 X (1) 에서부터 X의가장큰원소인 X (N) 까지순서대로배열한다. 잡음환경을모의실험하기위해, 서로다른 4 명의남성과여성화자로부터, 64 초구간의음성자료 (speech material) 를수집하였으며, NOISEX-92 데이터베이스로부터추출한백색잡음 (white noise), 차량잡음 (vehicular noise), 및배블잡음 (babble noise) 을신호대잡음비 (SNR) 가 10dB 인순수음성신호에첨가하였다. 수집한상기데이터를사용하여, 표본평균과분산을계산하였으며, 주어진가우시안분포, 라플라시안분포및감마분포에적용하였다. 경험적인 CDF 와주어진분포사이의거리측정을규정하기위해, 본발명의실시예에서는 KS 테스트통계량 (statistic) 을사용한다. KS 테스트통계량 (T) 은앞서언급한수학식 1 과같이정의된다 ( 참조를위하여수학식 1 을다시기재함 ). < 수학식 1> 여기서, 표본포인트 Xi 에서구한 F x (X i ) 와 F(X i ) 사이의최대차이가거리에해당한다. 몇가지분포에대하여데이터를테 스트하는경우, 최소의 KS 통계량을나타내는분포가주어진데이터에가장적합한것으로고려될수있다. 도 1 내지도 3 은각각다양한잡음조건하에서평가된 KS 통계량의결과를도시한다. 결과를요약하면, 다음과같은사항들을발견할수있다. (1) 도 1 은백색잡음조건하에서, SNR = 5, 10, 15, 20 db 에서평가된각각의모델에대한 KS 통계량을나타내는도면으로서, 도 1(a) 및 (b) 는각각가설 H 0 인경우의 DFT 계수의실수부와허수부를, 도 1(c) 및 (d) 는각각가설 H 1 인경우의 DFT 계수의실수부와허수부를나타내는도면이다. 도 1 에따르면, 라플라시안모델이모든 SNR 레벨에서 H 0 에가장적 합하며, 가우시안모델이다음으로적합하다. 백색잡음이가우시안분포되어지는지여부가의문일수있다. 이에대해, 프레임길이가 10ms 로제한되기때문에, 백색잡음에대한 DFT 계수가나머지모델들보다라플라시안에의해보다잘근사화되어진다는것을확인할수있다. 큰프레임길이 (>200ms) 에대해서는, DFT 계수의 PDF 는가우시안으로접근할수있으나, 이러한프레임길이는 (VAD 를포함하는 ) 실시간신호처리애플리케이션에적합하지않다. - 7 -

가설 H 1 에대해서도, 라플라시안모델이 SNR = 20 db 를제외하고는가장적합했다. 특히, 감마 PDF 로부터계산된 KS 통 계치는 SNR 이증가할수록작아지는반면에, 다른모델들은보다큰값들을생성했다. 마지막으로, 감마모델의 KS 통계치는 SNR = 20 db 에서가장최소였다. 이러한이유로, H 1 하에서백색잡음이섞인음성이순수음성스펙트럼에접근할수 록감마모델이점점적합해진다는결론을얻을수있다. 2) 도 2 는차량잡음조건하에서, SNR = 5, 10, 15, 20 db 에서평가된각각의모델에대한 KS 통계량을나타내는도면으로서, 도 2(a) 및 (b) 는각각가설 H 0 인경우의 DFT 계수의실수부와허수부를, 도 2(c) 및 (d) 는각각가설 H 1 인경우의 DFT 계수의실수부와허수부를나타내는도면이다. 도 2 로부터, H 0 이참일경우 SNR = 20 db 를제외하고는모든경우에 서감마모델의 KS 통계량이라플라시안및가우시안모델들의 KS 통계량보다더작다는것을확인할수있다. 차량잡음에대한거의모든경우에서, 가우시안분포가정은잡음이섞인음성의 DFT 스펙트럼을특징짓는데좋지못한선택인것으로관찰되었다. 3) 도 3 은배블잡음조건하에서, SNR = 5, 10, 15, 20 db 에서평가된각각의모델에대한 KS 통계량을나타내는도면으로서, 도 3(a) 및 (b) 는각각가설 H 0 인경우의 DFT 계수의실수부와허수부를, 도 3(c) 및 (d) 는각각가설 H 1 인경우의 DFT 계수의실수부와허수부를나타내는도면이다. 도 3 에서는, 가설 H 1 하에서얻어진결과가가설 H 0 하에서생성된결 과와상당히다른경향을나타내고있다. H 0 에대해서는, 라플라시안모델의 KS 통계량이거의모든 SNR 값들에서최소 였으며, 감마모델의 KS 통계량이항상최대였다. 반면에, H 1 이참일경우에는감마모델이잡음이섞인음성의 DFT 계수 의분포에가장적합한것으로관찰되었다. 또한, 가우시안모델의성능은거의모든조건에서가장나쁜것으로관찰되었다. KS 테스트결과를요약하면, 잡음이섞인음성의 DFT 스펙트럼에대하여잡음의유형및 SNR 조건에따라서로다른통계모델을적용하는것이유리할수있다는것을알수있다. 2. LRT 에기초한결정규칙 본발명의실시예는가정된통계적모델에기초하여, k 번째주파수빈 (bin) 에대한우도비 (likelihood ratio; 이하 'LR' 이라함 ) 를다음수학식 18 과같이정의하였다. 수학식 18 VAD 에대한결정규칙은개별주파수빈에대하여계산된 LR 들의기하평균으로서다음수학식 19 와같이구해질수있다. 수학식 19 여기서, M 은주파수빈의전체수를나타내며, η 은검출임계치를나타낸다. H 0 과 H 1 모두에대하여가우시안 PDF 가음성분포모델링에대하여사용되는경우에, LR 은다음수학식 20 에의해주어 진다. - 8 -

수학식 20 여기서, 이고, 이며, 이들은각각선행 SNR(a priori SNR) 및후행 SNR(a posteriori SNR) 로지칭된다. 한편, 라플라시안 PDF 의경우에는, LR 이다음수학식 21 과같이구해진다. 수학식 21 실질적으로, 수학식 21 을직접적용하는대신에, 하다고알려져있다. 이접근법은순간형태 (instantaneous form) 로서지칭된다. 를순간진폭스펙트럼 X k 로대체하는것이보다유리 LRT 의성능을보다향상시키기위하여, LR 을평탄화된형태 (smoothed form) 로지칭될수있는다음수학식 22 와같은형태로수정하는대안적인방법을제안한다. 수학식 22 여기서, 이며, 은평탄화파라미터 (smoothing parameter) 이다. 평탄화된형태에서는, 진폭스펙트럼에대하여보다평탄한평가치가순간값대신에적용된다. 다수의실험을통하여, 평 탄화된형태가순간형태보다우수하며, 특히 LRT의성능은평탄화파라미터 의선택에크게의존하는데, 의값으 로는 0.9를선택하는것이바람직한결과를준다는것을관찰하였다. 마지막으로, 감마 PDF 에대한 LR 의공식은다음의수학식 23 과같이주어진다. 수학식 23 라플라시안모델의경우와유사하게, 상기수학식 23 을대응하는평탄화된형태인다음의수학식 24 와같이변환할수있다. - 9 -

수학식 24 여기서, 이며, 은감마모델에대한평탄화파라미터로서, 다수의실험을통하여그값을 0.9 로선택하는것이바람직한결과를주는것으로관찰되었다. 3. 온라인 KS 테스트를사용하는다중통계모델에기초한 VAD 앞서살펴본 KS 테스트통계량결과에따르면, 잡음의유형, SNR 조건, 및서로다른가설조건에따라서적합한통계모델이변하는것을확인할수있었다. 그러나가우시안통계모델에기초한기존의 VAD 알고리즘에서는 VAD 의처리전에미리통계모델이선택되었기때문에, 보다적극적으로 VAD 의성능향상을도모할수없었다. 이러한문제점을극복하기위하여, 본발명에서는잡음의유형, SNR 조건, 및가설조건에따라서적합한통계모델을 VAD 처리시적응적으로결정하는방법을제안한다. 제안하는방법은, 비정적방식으로시간이흘러감에따라더해진잡음의통계적특성또는 SNR 이변하는입력신호를다룰때특히유리하다. 이를위해서, 추가적인계산상의부하를허용가능한레벨아래로유지하면서주어진조건에가장적합한모델을추적하기위한강인한방법이필요하다. 본발명의일실시예에서는, 매 p 프레임마다최근입력데이터 ( 과거 m개의이전프레임을포함 ) 을이용하여, 앞서언급한수학식 3과같이주어지는온라인 KS 평가치 T를평가함으로써주어진조건에가장적합한모델을적응적으로선택한다 ( 참조를위하여수학식 3을다시기재함 ). < 수학식 3> 여기서, 는평탄화파라미터이다. 도 4 는잡음이섞인음성샘플과관련하여주어진통계모델들에대하여온라인 KS 통계량 을도시한다. 보다구체적 으로는, 도 4(a) 는도 4(b) 와같이주어지는음성샘플에대하여각각의통계모델에기초한온라인 KS 통계량을도시하고있다. 도 4로부터, 제안된온라인 KS 테스트통계량이실제의통계특성을효과적으로따라갈수있다는것을확인할수있다. 특히, 도 4에서도시된배블잡음의경우에, 음성세그먼트동안온라인 KS 통계량에의해라플라시안모델이감마모델및가우시안모델보다우수한성능을보이는것을확인할수있다. 4. 실험결과 우선, 다양한잡음조건하에서검출성능을조사함으로써, LRT 를적용하기위한각각의파라미터모델에대한임계치의집합을선택하였다. LRT 의임계치를선택된값으로고정시킨후, 본발명에서제안된 VAD 알고리즘의성능을평가하였으며, 그결과를 ITU-T G.729B 알고리즘의성능및가우시안모델, 라플라시안모델, 감마모델각각에기초한알고리즘의성능과비교하였다. 성능의비교대상으로서는, 거짓경고확률 ( 순수음성이아닌데순수음성으로잘못검출하는확률 ) 및순수음성을놓칠확률 ( 순수음성인데순수음성으로검출하지못하는확률 ) 의합인음성검출오차확률 (P E ) 을평가하였다. 도 5 내지도 7 은각각백색, 자동차및배블잡음하에서의검출결과를도시한다. 도 5 내지도 7 로부터, 다음과같은사항들을관찰할수있다. 1) 가우시안, 라플라시안, 감마중어느하나의통계모델에기초한 VAD 알고리즘의경우에, 거의모든평가된조건하에서 G.729B 보다더나은성능을보였다. - 10 -

2) 다양한조건에서의결과에따르면, 나머지통계모델에기초한 VAD 알고리즘에비하여라플라시안에기초한 VAD 알고리즘이우수한성능을나타내었다. 3) 본발명에따른 MSM 에기초한 VAD 알고리즘은모든테스트조건에서라플라시안에기초한 VAD 알고리즘보다우수하거나대등한성능을나타내었다. 결론적으로, MSM 이 VAD 에대하여잡음이섞인음성의 DFT 계수들에대한통계분포를특징짓기위한보다바람직한방식이라는점을결과로부터명백하게확인할수있다. 이상설명한본발명은본발명이속한기술분야에서통상의지식을가진자에의하여다양한변형이나응용이가능하며, 본발명에따른기술적사상의범위는아래의특허청구범위에의하여정해져야할것이다. 발명의효과 본발명은, 기존의가우시안통계모델대신에잡음의유형, SNR 조건, 가설조건에따라서다중통계모델중어느하나를 VAD 처리중적응적으로선택하는음성검출방법을제안함으로써, 음성검출의성능을향상시킬수있다. 도면의간단한설명 도 1 은백색잡음조건하에서, SNR = 5, 10, 15, 20 db 에서평가된각각의모델에대한 KS 통계량을나타내는도면으로서, 도 1(a) 및 (b) 는각각가설 H 0 인경우의 DFT 계수의실수부와허수부를, 도 1(c) 및 (d) 는각각가설 H 1 인경우의 DFT 계수의실수부와허수부를나타내는도면. 도 2 는차량잡음조건하에서, SNR = 5, 10, 15, 20 db 에서평가된각각의모델에대한 KS 통계량을나타내는도면으로서, 도 2(a) 및 (b) 는각각가설 H 0 인경우의 DFT 계수의실수부와허수부를, 도 2(c) 및 (d) 는각각가설 H 1 인경우의 DFT 계수의실수부와허수부를나타내는도면. 도 3 은배블잡음조건하에서, SNR = 5, 10, 15, 20 db 에서평가된각각의모델에대한 KS 통계량을나타내는도면으로서, 도 3(a) 및 (b) 는각각가설 H 0 인경우의 DFT 계수의실수부와허수부를, 도 3(c) 및 (d) 는각각가설 H 1 인경우의 DFT 계수의실수부와허수부를나타내는도면. 도 4 는잡음이섞인음성샘플과관련하여주어진통계모델들에대하여온라인 KS 통계량을도시하는도면. 도 5 는백색잡음조건하에서, SNR = 5, 10, 15, 20 db 에서평가된각각의모델에대한음성검출오차확률을나타내는도면. 도 6 은차량잡음조건하에서, SNR = 5, 10, 15, 20 db 에서평가된각각의모델에대한음성검출오차확률을나타내는도면. 도 7 은배블잡음조건하에서, SNR = 5, 10, 15, 20 db 에서평가된각각의모델에대한음성검출오차확률을나타내는도면. < 도면중주요부분에대한부호의설명 > Gaussian : 가우시안통계모델 Laplacian : 복소수라플라시안통계모델 Gamma : 복소수감마통계모델 MSM : 다중통계모델 - 11 -

도면 도면 1 도면 2-12 -

도면 3 도면 4-13 -

도면 5 도면 6-14 -

도면 7-15 -