특허청구의범위 청구항 1. 복소수감마통계모델 (complex gamma statistical model) 에기초한음성검출 (VAD; Voice Activity Detection) 방법으로서, 입력된음성신호에대하여고속푸리에변환 (FFT) 을수행하여주파수영역의음성신호로변환

Similar documents
특허청구의범위 청구항 1. 입력된음성신호에대하여고속푸리에변환 (FFT) 을수행하여주파수영역의음성신호로변환시키는단계와, 상기주파수영역으로변환된음성신호로부터잡음신호의파워를추정하는단계와, 상기추정된잡음신호의파워에기초하여음성의존재와비존재에대하여, 순수음성과잡음의 DFT 계수가

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA

등록특허 (19) 대한민국특허청 (KR) (12) 등록특허공보 (B1) (51) 국제특허분류 (Int. Cl.) G10L 15/14 ( ) G10L 15/10 ( ) G10L 15/18 ( ) (52) CPC 특허분류

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA

특허청구의 범위 청구항 1 복수개의 프리캐스트 콘크리트 부재(1)를 서로 결합하여 연속화시키는 구조로서, 삽입공이 형성되어 있고 상기 삽입공 내면에는 나사부가 형성되어 있는 너트형 고정부재(10)가, 상기 프리캐스 트 콘크리트 부재(1) 내에 내장되도록 배치되는 내부

DBPIA-NURIMEDIA

통신이론 2 장주파수해석 성공회대학교 정보통신공학과 1

슬라이드 1

이 발명을 지원한 국가연구개발사업 과제고유번호 부처명 교육과학기술부 연구사업명 기초사업연구-일반연구자지원사업-기본연구지원사업(유형II) 연구과제명 시공간 부호 협력 통신을 위한 동기 알고리즘 연구 기 여 율 1/1 주관기관 서울시립대학교 산학협력단

Sequences with Low Correlation

본 발명은 중공코어 프리캐스트 슬래브 및 그 시공방법에 관한 것으로, 자세하게는 중공코어로 형성된 프리캐스트 슬래브 에 온돌을 일체로 구성한 슬래브 구조 및 그 시공방법에 관한 것이다. 이를 위한 온돌 일체형 중공코어 프리캐스트 슬래브는, 공장에서 제작되는 중공코어 프


Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

DBPIA-NURIMEDIA

지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월

(72) 발명자 박세웅 서울특별시관악구신림동산 56-1 서울대학교뉴미디어통신공동연구소 최진구 서울특별시영등포구당산동 2 가대우메종아파트 101 동 909 호 - 2 -

서 인코딩한 데이터를 무선으로 송신하기 위한 무선 송신 수단; 및 통화중 상기 입력 수단으로부터의 음원 데이터 전송신 호에 따라 상기 저장 수단에 저장되어 있는 해당 음원 데이터를 상기 디코딩 수단에 의해 디코딩하고, 상기 디코딩한 음원 데이터와 상기 입력 수단을 통해

½½¶óÀ̵å Á¦¸ñ ¾øÀ½

특허청구의범위청구항 1 복수의영상검출부로부터출력되는영상의히스토그램 (histogram) 을계산하는단계 ; 상기복수의영상검출부로부터출력되는영상을히스토그램평활화 (histogram equalization) 하는단계 ; 상기복수의영상검출부중하나의영상검출부를선택하는단계 ; 및

DBPIA-NURIMEDIA

Chapter4.hwp

이 발명을 지원한 국가연구개발사업 과제고유번호 A 부처명 지식경제부 연구관리전문기관 연구사업명 IT핵심기술개발 연구과제명 융합형 포털서비스를 위한 이용자 참여형 방송기술개발 기여율 주관기관 전자부품연구원 연구기간 2008년 03월 01일 ~ 2

많이 이용하는 라면,햄버그,과자,탄산음료등은 무서운 병을 유발하고 비만의 원인 식품 이다. 8,등겨에 흘려 보낸 영양을 되 찾을 수 있다. 도정과정에서 등겨에 흘려 보낸 영양 많은 쌀눈과 쌀껍질의 영양을 등겨를 물에 우러나게하여 장시간 물에 담가 두어 영양을 되 찾는다

Ç¥Áö-¸ñÂ÷

Chap 6: Graphs

특허청구의 범위 청구항 1 앵커(20)를 이용한 옹벽 시공에 사용되는 옹벽패널에 있어서, 단위패널형태의 판 형태로 구성되며, 내부 중앙부가 후방 하부를 향해 기울어지도록 돌출 형성되어, 전면이 오 목하게 들어가고 후면이 돌출된 결속부(11)를 형성하되, 이 결속부(11

(72) 발명자 정진곤 서울특별시 성북구 종암1동 이용훈 대전광역시 유성구 어은동 한빛아파트 122동 1301 호 - 2 -

그룹웨어와 XXXXX 제목 예제

이발명을지원한국가연구개발사업 과제고유번호 NRF-2012R1A1A4A 부처명 교육과학기술부 연구관리전문기관 한국연구재단 연구사업명 지역대학우수과학자지원사업 연구과제명 저주파신호와바이스태틱레이다를동시에이용한스텔스형표적의인식에관한연구 기여율 1/1 주관기관

(52) CPC 특허분류 B01D 53/62 ( ) Y02C 10/10 ( ) (72) 발명자 이정현 대전광역시서구대덕대로 246 넥서스밸리 B 동 1417 호 박영철 대전광역시유성구반석동로 33 반석마을 5 단지아파트 505 동 201 호 이발명

G Power

% Rectangular Value 입력 t = -50 : 1 : 50; % 시간영역 for i = 1 : 101 if abs ( t ( i ) ) < 10 x ( i ) = 1; else x ( i ) = 0; % 화면을 2 열 1 행으로나눈후 % 2 열 1 행에 R

Python과 함께 배우는 신호 해석 제 5 강. 복소수 연산 및 Python을 이용한 복소수 연산 (제 2 장. 복소수 기초)

statistics

<363020B9CEBCD2BFAC2D4C535020C6C4B6F3B9CCC5CDC0C720BAD0C6F7C6AFBCBAC0BB20C0CCBFEBC7D12E687770>

특허청구의 범위 청구항 1 알람을 출력하기 위한 출력 인터페이스; 사용자의 안구전도값을 측정하기 위한 안구전도 측정부; 및 상기 안구전도 측정부가 측정한 안구전도값을 이용하여 사용자의 졸음 상태를 감지하고, 그에 따라 상기 출력 인터페이스로 알람을 출력하는 졸음상태 판

<322EBCF8C8AF28BFACBDC0B9AEC1A6292E687770>

한것으로스마트단말기에의하여드론조종앱을설치하는제 1 단계 ; 스마트단말기에의하여드론의불루투스통 신부에부여된고유식별번호를입력저장하고드론의불루투스를인식하며드론의블루투스통신부로부터회신되 는신호의수신레벨을분석하여최대통신거리를확인하여저장하는제 2 단계 ; 스마트단말기에의하여최대통

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Mar.; 28(3),

(Microsoft PowerPoint - Ch21_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345])

슬라이드 1

04 Çмú_±â¼ú±â»ç

PowerPoint Presentation

특허청구의범위청구항 1 투입된음식물을분쇄하는분쇄기 ; 상기분쇄된음식물을가열할수있는마그네트론 ; 및탈취작용을하는저온촉매필터를포함하는음식물처리기에있어서, 상기마그네트론이상기저온촉매필터를일정온도로가열할수있는것을특징으로하는, 청구항 2 제 1 항에있어서, 상기음식물처리기는상기

특허청구의 범위 청구항 1 일반전화를 이용한 위험 알림시스템 및 실시간 영상전송 장치에서 CID(콜백넘버) 장치를 포함한 서버 및 그 장 비를 포함하며, 영상서버와 연동한 형태를 상황실에 전송하여 출동하는 시스템을 포함하는 것을 특징으로 하는 일반전화를 이용한 위험 알

특허청구의 범위 청구항 1 복수의 FA(Frequency Allocation)를 사용하는 광대역 무선통신 시스템에서 프리앰블 의사 잡음(Pseudo Noise : PN) 코드 할당 방법에 있어서, 각 FA에 고유의 인덱스를 정의하는 과정과, 기준 FA 인덱스를 사용하는

Microsoft PowerPoint - SBE univariate5.pptx

第 1 節 組 織 11 第 1 章 檢 察 의 組 織 人 事 制 度 등 第 1 項 大 檢 察 廳 第 1 節 組 대검찰청은 대법원에 대응하여 수도인 서울에 위치 한다(검찰청법 제2조,제3조,대검찰청의 위치와 각급 검찰청의명칭및위치에관한규정 제2조). 대검찰청에 검찰총장,대

특허청구의범위청구항 1 네트워크를통해외부음악메타데이터제공자로부터음악메타데이터가수신되면상기음악메타데이터를임시음악메타데이터에저장하는단계와, 상기임시저장되는음악메타데이터를파싱처리하여메타데이터요소를분리하는단계와, 상기파싱처리된음악메타데이터중주요필드정보를전처리정제하는단계와, 상

(72) 발명자 김도규 서울특별시성북구장위 3 동 박준일 서울특별시강서구등촌동 서광아파트 103 동 803 호 유형규 경기도광명시광명 4 동한진아파트 101 동 1801 호 - 2 -

Microsoft PowerPoint - C++ 5 .pptx

(72) 발명자 오인환 서울 노원구 중계로 195, 101동 803호 (중계동, 신 안동진아파트) 서혜리 서울 종로구 평창14길 23, (평창동) 한훈식 서울 강남구 언주로71길 25-5, 301호 (역삼동, 영 훈하이츠) 이 발명을 지원한 국가연구개발사업 과제고유번호

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Dec.; 25(12),

Chap 6: Graphs

실험 5

용역보고서

<445350BCB3B0E820BAB8B0EDBCAD2E687770>

1. 스펙트럼분석기 (Spectrum Analyzer) 1 스펙트럼분석기 (Spectrum Analyzer) 란? - 스펙트럼분석기 (Spectrum Analyzer) 는마치프리즘이빛을파장별로분해하여보여주듯이신호의스펙트럼또는주파수를분해하여그크기를화면에표시하여주는계기이다

한국통계학회논문집 2009, 16권, 4호, 영상에서 윈도우 배치에 따른 통계적 에지검출 비교 임동훈 1,a a 경상대학교 정보통계학과 요약 본 논문에서는 영상의 에지검출을 하는데 사용되는 여러 가지 윈도우 배치(window configurations)하

28 저전력복합스위칭기반의 0.16mm 2 12b 30MS/s 0.18um CMOS SAR ADC 신희욱외 Ⅰ. 서론 Ⅱ. 제안하는 SAR ADC 구조및회로설계 1. 제안하는 SAR ADC의전체구조

실용신안 등록청구의 범위 청구항 1 톤백마대가 설치될 수 있도록 일정간격을 두고 설치되는 한 쌍의 지지프레임과, 상기 지지프레임과 지지프레임의 상부를 서로 연결하는 한 쌍의 연결프레임과, 상기 연결프레임의 상부에 일정간격을 두고 다수 설치되어 상기 톤백마대와 그 투입구

텀블러514

FGB-P 학번수학과권혁준 2008 년 5 월 19 일 Lemma 1 p 를 C([0, 1]) 에속하는음수가되지않는함수라하자. 이때 y C 2 (0, 1) C([0, 1]) 가미분방정식 y (t) + p(t)y(t) = 0, t (0, 1), y(0)

<5BB0EDB3ADB5B55D B3E2B4EBBAF12DB0ED312D312DC1DFB0A32DC0B6C7D5B0FAC7D02D28312E BAF2B9F0B0FA20BFF8C0DAC0C720C7FCBCBA2D D3135B9AEC7D72E687770>

대 표 도 - 2 -

105È£4fš

Gray level 변환 및 Arithmetic 연산을 사용한 영상 개선

소성해석

PART

Part Part

£01¦4Àå-2

½ºÅ丮ÅÚ¸µ3_³»Áö

272*406OSAKAÃÖÁ¾-¼öÁ¤b64ٽÚ

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

DBPIA-NURIMEDIA

특허청구의 범위 청구항 1 제1 내지 제6 암이 각각의 관절부를 가지며 형성되며, 상기 제1 내지 제6 암 각각은 제1 내지 제6 링크에 의해 링크되고, 상기 제1 내지 제6 암 내부에는 각각의 암을 구동하는 구동모듈이 각각 내장되며, 상기 구동모듈 각각의 선단에는 1

이발명을지원한국가연구개발사업 과제고유번호 부처명 서울특별시 연구사업명 서울시산학연협력사업 (2005년도보유기술사업화지원사업 ) 연구과제명 디지털콘텐츠의안전한유통을위한불법복제추적기술 주관기관 서울시립대학교산학협력단 연구기간 2005년 12월 1일 ~ 2007년

특허청구의 범위 청구항 1 소스 컴퓨팅 디바이스로부터 복수의 컴퓨팅 디바이스들 중 적어도 하나의 컴퓨팅 디바이스로의 무선 액세스 포 인트를 통한 데이터 송신들에 대한 (i) 현재 데이터 레이트 및 (ii) 최고 데이터 레이트를 구축하는 단계; 상기 복수의 컴퓨팅 디바이

도 1 명세서 도면의 간단한 설명 도 1은 본 발명의 일실시예에 따른 비접촉 USB 리더기의 블럭도를 나타낸다. 도 2는 도 1의 비접촉 USB 리더기를 이용한 인프라 구축 시스템의 개략도를 나타낸다. 도 3은 도 1의 비접촉 USB 리더기를 이용한 이용 방법에 대한

이 발명을 지원한 국가연구개발사업 과제고유번호 부처명 방송통신위원회 연구사업명 방송통신기술개발사업 연구과제명 안전한 전자파환경 조성 주관기관 한국전자통신연구원 연구기간 ~

KARAAUTO_4¿ù.qxd-ÀÌÆå.ps, page Normalize

Microsoft PowerPoint - Ch13

Probabilistic graphical models: Assignment 3 Seung-Hoon Na June 7, Gibbs sampler for Beta-Binomial Binomial및 beta분포는 다음과 같이 정의된다. k Bin(n, θ):

슬라이드 1

슬라이드 1

(71) 출원인 나혜원 대구 달서구 도원동 1438 대곡사계절타운 나혜리 대구 달서구 도원동 1438 대곡사계절타운 (72) 발명자 나혜원 대구 달서구 도원동 1438 대곡사계절타운 나혜리 대구 달서구 도원동 1438 대

PowerPoint Template

<4D F736F F F696E74202D2035BBF3C6F2C7FC5FBCF8BCF6B9B0C1FA2E BC8A3C8AF20B8F0B5E55D>

<B0A3C3DFB0E828C0DBBEF7292E687770>

특허청구의 범위 청구항 1 몸체(110)의 일측에는 테스트의 필요성에 따라 여타한 디젤 자동차(100)에서 분리시킨 상태의 분리형 커먼레일 인젝트(110)를 고정할 수 있는 분리형 인젝터 고정부(20)가 구비되고, 그 고정부(20)의 하측에는 분리형 커먼 레일 인젝터(

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

11 주차 M 진디지털변조 (1) 통과대역신호의표현 (2) Quadrature Phase Shift Keying (QPSK) (3) Minimum Shift Keying (MSK) (4) M-ary Amplitude Shift Keying (M-ASK) (5) M-ar

Chapter 11 Rate of Reaction

InsertColumnNonNullableError(#colName) 에해당하는메시지출력 존재하지않는컬럼에값을삽입하려고할경우, InsertColumnExistenceError(#colName) 에해당하는메시지출력 실행결과가 primary key 제약에위배된다면, Ins


= Fisher, I. (1930), ``The Theory of Interest,'' Macmillan ,

Transcription:

(19) 대한민국특허청 (KR) (12) 등록특허공보 (B1) (51) Int. Cl. G10L 19/04 (2006.01) G10L 11/06 (2006.01) G10L 21/02 (2006.01) G10L 19/00 (2006.01) (45) 공고일자 (11) 등록번호 (24) 등록일자 2007 년 05 월 15 일 10-0718749 2007 년 05 월 09 일 (21) 출원번호 10-2006-0118896 (65) 공개번호 10-2006-0131705 (22) 출원일자 2006년11월29일 (43) 공개일자 2006년12월20일 심사청구일자 2006년11월29일 (73) 특허권자인하대학교산학협력단 * (72) 발명자장준혁 * (74) 대리인김건우 (56) 선행기술조사문헌 KR 1020000056399 KR 1020040079773 KR 1020040056977 심사관 : 장호근 전체청구항수 : 총 6 항 (54) 복소수감마통계모델에기초한음성검출방법및음성검출기 (57) 요약 본발명은복소수감마통계모델을이용한음성검출기및음성검출방법에관한것으로서, 보다구체적으로는입력된음성신호에대하여고속푸리에변환 (FFT) 을수행하여주파수영역의음성신호로변환시키는단계와, 상기주파수영역으로변환된음성신호로부터잡음신호의파워를추정하는단계와, 상기추정된잡음신호의파워에기초하여음성의존재와비존재에대하여, 순수음성과잡음의 DFT 계수가복소수감마확률통계모델을따른다고가정함으로써주파수영역에대한우도비 (Likelihood Ratio) 를결정하는단계와, 상기결정된우도비로부터음성검출에대한결정규칙 (Decision Rule) 을계산하는단계를포함하는음성검출방법및이를구현한음성검출기에관한것이다. 본발명은, 복소수감마통계모델을음성검출에이용함으로써, 잡음의유형및 SNR 조건에따라서기존의가우시안통계모델을사용하는경우에비해더좋은성능을제공할수있다. 대표도 도 7-1 -

특허청구의범위 청구항 1. 복소수감마통계모델 (complex gamma statistical model) 에기초한음성검출 (VAD; Voice Activity Detection) 방법으로서, 입력된음성신호에대하여고속푸리에변환 (FFT) 을수행하여주파수영역의음성신호로변환시키는단계 ; 상기주파수영역으로변환된음성신호로부터잡음신호의파워를추정하는단계 ; 상기추정된잡음신호의파워에기초하여음성의존재와비존재에대하여, 순수음성과잡음의 DFT 계수가복소수감마확률통계모델을따른다고가정함으로써주파수영역에대한우도비 (Likelihood Ratio) 를결정하는단계 ; 및 상기결정된우도비로부터음성검출에대한결정규칙 (Decision Rule) 을다음수학식을이용하여계산하는단계 - 여기서, 가설 H 0 은각각음성신호가없는경우와음성신호가있는경우를나타내며, X k 는 k 번째이산푸리에계 수, 와 는각각잡음 N k 및순수음성 S k 의분산,, X k(r) 와 X k(i) 는 X k 의실수부와허수부를나 타냄 - 를포함하는방법. 청구항 2. 제 1 항에있어서, 상기음성검출에대한결정규칙을계산하는단계에서, 상기수학식대신에다음수학식을이용하여계산하는방법. - 여기서, 이며, 은복소수감마통계모델에대한평탄화파라미터 (smoothing parameter) 임 - 청구항 3. 제 2 항에있어서, 상기평탄화파라미터을 0.9 로설정한방법. - 2 -

청구항 4. 복소수감마통계모델 (complex gamma statistical model) 에기초한음성검출기 (Voice Activity Detector) 로서, 입력된음성신호에대하여고속푸리에변환 (FFT) 을수행하여주파수영역의음성신호로변환시키는고속푸리에변환기 ; 상기고속푸리에변환기에의해주파수영역으로변환된상기음성신호로부터잡음신호의파워를추정하는잡음파워추정부 ; 상기잡음파워추정부에의해추정된상기잡음신호의파워에기초하여음성의존재와비존재에대하여, 순수음성과잡음의 DFT 계수가복소수감마확률통계모델을따른다고가정함으로써주파수영역에대한우도비 (Likelihood Ratio) 를결정하는우도비결정부 ; 및 상기우도비결정부에의해결정된상기우도비로부터음성검출에대한결정규칙 (Decision Rule) 을다음수학식을이용하여계산하는결정규칙계산부 - 여기서, 가설 H 0 은각각음성신호가없는경우와음성신호가있는경우를나타내며, X k 는 k 번째이산푸리에계 수, 와 는각각잡음 N k 및순수음성 S k 의분산,, X k(r) 와 X k(i) 는 X k 의실수부와허수부를나 타냄 - 를포함하는음성검출기. 청구항 5. 제 4 항에있어서, 상기음성검출에대한결정규칙을계산하는결정규칙계산부에서, 상기수학식대신에다음수학식을이용하여계산하는음성검출기. - 여기서, 이며, 은복소수감마통계모델에대한평탄화파라미터 (smoothing parameter) 임 - 청구항 6. 제 5 항에있어서, - 3 -

상기평탄화파라미터을 0.9 로설정한음성검출기. 명세서 발명의상세한설명 발명의목적 발명이속하는기술및그분야의종래기술 본발명은음성검출방법및음성검출기에관한것으로서, 특히복소수감마통계모델에기초한음성검출기및음성검출방법에관한것이다. 음성검출 (VAD; Voice Activity Detection) 은, 활성음성 (active speech) 을비음성으로부터구분하는고전적인문제를지칭하는것으로, 음성코딩, 음성인식, 잡음이섞인음성의향상, 핸즈프리회의, 및에코제거와같은다양한음성통신시스템에대한애플리케이션을가지고있다. 특히, VAD 는, 통신대역폭의용량및커버리지를향상시키는가장정밀한방식중하나인가변음성코딩의주요한부분이되어왔다. 이러한이유로, 다양한유형의 VAD 알고리즘이제안되어왔다. VAD 에대한초기알고리즘들은대부분선형예측코딩 (LPC; linear prediction coding) 파라미터들, 에너지레벨들, 포먼트형상, 영교차비율 (ZCR; zero crossing rate), 켑스트럴특성 (cepstral features), 음성신호의적응모델링, 및주기성평가에기초하고있다. 보다최근에는, 패턴인식및 LPC 잔여의고차큐뮬런트 (higher order cumulants) 에기초한 VAD 접근법이새로운전략으로서제안되어왔다. 예를들면, 특히에너지차이, ZCR, 및스펙트럼차이를 ITU-T G.729 Annex B 에적용시켜왔다. 유사한접근법을, 3 세대파트너십프로젝트 2(3GPP2; 3rd Generation Partnership Project2), ITU-T G.723.1 및유럽전화통신표준협회 (European Telecommunications Standards Institutes) 적응형다 - 비율 (AMR; Adaptive Multi-Rate) VAD 옵션 2 에서선택가능한모드보코더에적용하는시도도있었다. 최근에, 일련의가설이적용된우도비테스트 (LRT; Likelihood Ratio Test) 로부터구해지는결정규칙과함께, 통계모델을이용함으로써 VAD 의성능을개선하려는노력이이루어져왔다. VAD 알고리즘에기초한통계모델은 Ephraim 과 Malah 의연구로부터비롯되었다. 일부연구자들은가우시안통계모델을 VAD 에적용하는알고리즘을시도하였는데, 여기서파라미터들의평가가 DD(decision-directed) 접근법에의해수행되었다. 이알고리즘은, 비록관련파라미터들의최적화가요구되기는하였으나, 기존의알고리즘에비해높은검출정확도를나타내었다. 통계모델에기초한방법은소프트결정스킴 (soft decision scheme) 과결합됨으로써더욱개선되었다. 잘알려진바와같이, DFT 도메인에서주로동작하는기존의 VAD 알고리즘의대부분은순수음성 (clean speech) 과잡음의스펙트럼이가우시안분포에의해특성지어진다고가정한다. 그러나순수음성과잡음의 DFT 계수를가우시안분포를사용하여모델링할경우잡음의유형과레벨에따라정확성에일정정도한계가있었기때문에, DFT 계수를모델링할새로운분포모델이요구되고있다. 발명이이루고자하는기술적과제 본발명은상기와같은문제인식에서비롯된것으로서, 순수음성과잡음의 DFT 계수를기존의가우시안통계모델대신에복소수감마통계모델을사용하여모델링한음성검출방법및음성검출기를제공하는것을그목적으로한다. 발명의구성 상기한목적을달성하기위한본발명의특징에따른복소수감마통계모델에기초한음성검출방법은, (1) 입력된음성신호에대하여고속푸리에변환 (FFT) 을수행하여주파수영역의음성신호로변환시키는단계 ; (2) 상기주파수영역으로변환된음성신호로부터잡음신호의파워를추정하는단계 ; (3) 상기추정된잡음신호의파워에기초하여음성의존재와비존재에대하여, 순수음성과잡음의 DFT 계수가복소수감마확률통계모델을따른다고가정함으로써주파수영역에대한우도비 (Likelihood Ratio) 를결정하는단계 ; 및 - 4 -

(4) 상기결정된우도비로부터음성검출에대한결정규칙 (Decision Rule) 을다음수학식 1 을이용하여계산하는단계 수학식 1 - 여기서, 가설 H 0 은각각음성신호가없는경우와음성신호가있는경우를나타내며, X k 는 k 번째이산푸리에계 수,, X k(r) 와 X k(i) 는 X k 의실수부와허수부를나타냄 - 를포함하는것을그특징으로한다. 본발명의또다른특징에따른복소수감마통계모델에기초한음성검출방법은, 상기음성검출에대한결정규칙을계산하는단계에서, 상기수학식 1 대신에다음수학식 2 를이용하여계산하는것을그특징으로한다. 수학식 2 - 여기서, 이며, 은복소수감마통계모델에대한평탄화파라미터 (smoothing parameter) 임 - 본발명의또다른특징에따른복소수감마통계모델에기초한음성검출방법은, 상기평탄화파라미터을 0.9 로설정한것을그특징으로한다. 한편, 상기한목적을달성하기위한본발명의특징에따른복소수감마통계모델에기초한음성검출기는, (1) 입력된음성신호에대하여고속푸리에변환 (FFT) 을수행하여주파수영역의음성신호로변환시키는고속푸리에변환기 ; (2) 상기고속푸리에변환기에의해주파수영역으로변환된상기음성신호로부터잡음신호의파워를추정하는잡음파워추정부 ; (3) 상기잡음파워추정부에의해추정된상기잡음신호의파워에기초하여음성의존재와비존재에대하여, 순수음성과잡음의 DFT 계수가복소수감마확률통계모델을따른다고가정함으로써주파수영역에대한우도비 (Likelihood Ratio) 를결정하는우도비결정부 ; 및 (4) 상기우도비결정부에의해결정된상기우도비로부터음성검출에대한결정규칙 (Decision Rule) 을다음수학식 1 을이용하여계산하는결정규칙계산부 < 수학식 1> - 5 -

- 여기서, 가설 H 0 은각각음성신호가없는경우와음성신호가있는경우를나타내며, X k 는 k 번째이산푸리에계 수,, X k(r) 와 X k(i) 는 X k 의실수부와허수부를나타냄 - 를포함하는것을그특징으로한다. 본발명의또다른특징에따른복소수감마통계모델에기초한음성검출기는, 상기음성검출에대한결정규칙을계산하는결정규칙계산부에서, 상기수학식 1 대신에다음수학식 2 를이용하여계산하는것을그특징으로한다. < 수학식 2> - 여기서, 이며, 은복소수감마통계모델에대한평탄화파라미터 (smoothing parameter) 임 - 본발명의또다른특징에따른복소수감마통계모델에기초한음성검출기는, 상기평탄화파라미터을 0.9 로설정한것을그특징으로한다. 이하에서는본발명의실시예를도면을참조하여상세히설명한다. 본발명의실시예는다양한잡음조건에서잡음에오염된음성신호의 DFT 계수를 VAD 에적용하기위해복소수감마모델에기초한방법을제안한다. 본발명의실시예에서는먼저다양한잡음에오염된음성조건하에서적합도 (Goodness Of Fit; 이하 'GOF' 라함 ) 테스트를적용함으로써복소수감마모델을가우시안모델및복소수라플라시안모델과비교한후, 우도비테스트 (Likelihood Ration Test; 이하 'LRT' 라함 ) 에기반한결정규칙 (Decision Rule) 을고려한다. 1. 통계적모델 먼저, 잡음신호 N(t) 와음성신호 S(t) 의합이 X(t) 라고가정하고, 이때가설 H 0 이각각음성신호가없는경우와음 성신호가있는경우를나타낸다고하면, 가설 H 0 에서, X(t) 는각각다음의수학식 3 및 4 를만족한다. 수학식 3 수학식 4-6 -

여기서,,, 는각각잡음이섞인음성, 잡음, 순수음성의 DFT 계수이다. 상기한통계적모델은적절한 DFT 계수분포를선택함으로써완료된다. 본발명의실시예에서는 DFT 계수의적절한분포로서가우시안확률밀도함수 (probabilistic density function, 이하 'PDF" 라함 ) 를채택하는대신복소수감마확률밀도함수를채택하였다. (1) 가우시안통계모델 가우시안 PDF 에서, 양가설 (H0, H1) 에의해결정되는잡음스펙트럼성분 (noisy spectral component) 의분포는다음의수학식 5 및 6 과같이주어진다. 수학식 5 수학식 6 여기서, 와는각각잡음 N k 및순수음성 S k 의분산 (variance) 을나타낸다. (2) 복소수라플라시안통계모델 다음으로, 복소수라플라시안 PDF 에서, DFT 계수 X k 의실수부 (real part) 와허수부 (imaginary part) 를각각 X k(r) 와 X k (I) 로가정하면, X k(r) 와 X k(i) 는다음의수학식 7 및 8과같이분포된다. 수학식 7 수학식 8 여기서, 는 X k 의분산을나타낸다. 만약 X k 의실수부및허수부가서로독립적이라고더가정하면, X k 의분포는다음 수학식 9 와같이될수있다. 수학식 9 상기수학식 9 로부터, 양가설 (H0, H1) 에의해결정되는 DFT 계수의분포는다음수학식 10 및 11 과같이주어질수있다. - 7 -

수학식 10 수학식 11 (3) 복소수감마통계모델 마지막으로복소수감마 PDF 에대해살펴본다. 각각의 DFT 계수의실수부와허수부 X k(r) 와 X k(i) 는각각다음의수학식 12 및 13 에따라분포된다. 수학식 12 수학식 13 만약실수부와허수부가라플라시안경우에서처럼서로독립적이라고더가정하면, DFT 계수 X k 의분포는다음수학식 14 와같이주어진다. 수학식 14 수학식 14 를 2 개의가설 H 0 에적용하면, DFT 계수의분포는다음수학식 15 및 16 과같이얻어진다. 수학식 15 수학식 16 성공적인 VAD 동작을위해서, 본발명의실시예에서는 H 0 에의해결정되는잡음스펙트럼요소를위한통계적적합 성테스트 (statistical fitting test) 를수행한다. 확률밀도함수 (PDF) 의선택을위해, 본발명의실시예에서는적합도테스트 (GOF test; Goodness-of-Fit test) 로서잘알려진 Kolomogorov-Sriminov 테스트 ( 이하, 'KS 테스트 ' 라함 ) 를적용한다. KS 테스트를적용함으로써, 각통계적인가정에대한신뢰성있는관측을보장할수있다. KS 테스트는경험적인 (empirical) 누적분포함수 (cumulative distribution function; 이하 'CDF' 라함 ) F x 를소정의분포함수 F 와비교한다. - 8 -

가잡음이섞인음성의 DFT 계수를나타내는벡터라고가정할때, 다음의수학식 17 로서나타낼수있는함수를경험적 CDF 로서사용하였다. 수학식 17 여기서, 은데이터 X의순서통계 (order statistics) 이다. 순서통계를계산하기위해, X의원소들을분류하고정렬하여, X의가장작은원소인 X (1) 에서부터 X의가장큰원소인 X (N) 까지순서대로배열한다. 잡음환경을모의실험하기위해, 서로다른 4 명의남성과여성화자로부터, 64 초구간의음성자료 (speech material) 를수집하였으며, NOISEX-92 데이터베이스로부터추출한백색잡음 (white noise), 차량잡음 (vehicular noise), 및배블잡음 (babble noise) 을신호대잡음비 (SNR) 가 10dB 인순수음성신호에첨가하였다. 수집한상기데이터를사용하여, 표본평균과분산을계산하였으며, 주어진감마분포, 라플라시안분포및가우시안분포에적용하였다. 경험적인 CDF 와주어진분포사이의거리측정을규정하기위해, 본발명의실시예에서는 KS 테스트통계량 (statistic) 을사용한다. KS 테스트통계량 (T) 은다음의수학식 18 과같이정의된다. 수학식 18 여기서, 표본포인트 Xi 에서구한 F x (X i ) 와 F(X i ) 사이의최대차이가거리에해당한다. 몇가지분포에대하여데이터를테 스트하는경우, 최소의 KS 통계량을나타내는분포가주어진데이터에가장적합한것으로고려될수있다. 도 1 내지도 3 은각각다양한잡음조건하에서평가된 KS 통계량의결과를도시한다. 결과를요약하면, 다음과같은사항들을발견할수있다. (1) 도 1 은백색잡음조건하에서, SNR = 5, 10, 15, 20 db 에서평가된각각의모델에대한 KS 통계량을나타내는도면으로서, 도 1(a) 및 (b) 는각각가설 H 0 인경우의 DFT 계수의실수부와허수부를, 도 1(c) 및 (d) 는각각가설 H 1 인경우의 DFT 계수의실수부와허수부를나타내는도면이다. 도 1 에따르면, 라플라시안모델이모든 SNR 레벨에서 H 0 에가장적 합하며, 가우시안모델이다음으로적합하다. 백색잡음이가우시안분포되어지는지여부가의문일수있다. 이에대해, 프레임길이가 10ms 로제한되기때문에, 백색잡음에대한 DFT 계수가나머지모델들보다라플라시안에의해보다잘근사화되어진다는것을확인할수있다. 큰프레임길이 (>200ms) 에대해서는, DFT 계수의 PDF 는가우시안으로접근할수있으나, 이러한프레임길이는 (VAD 를포함하는 ) 실시간신호처리애플리케이션에적합하지않다. 가설 H 1 에대해서도, 라플라시안모델이 SNR = 20 db 를제외하고는가장적합했다. 특히, 감마 PDF 로부터계산된 KS 통 계치는 SNR 이증가할수록작아지는반면에, 다른모델들은보다큰값들을생성했다. 마지막으로, 감마모델의 KS 통계치는 SNR = 20 db 에서가장최소였다. 이러한이유로, H 1 하에서백색잡음이섞인음성이순수음성스펙트럼에접근할수 록감마모델이점점적합해진다는결론을얻을수있다. 2) 도 2 는차량잡음조건하에서, SNR = 5, 10, 15, 20 db 에서평가된각각의모델에대한 KS 통계량을나타내는도면으로서, 도 2(a) 및 (b) 는각각가설 H 0 인경우의 DFT 계수의실수부와허수부를, 도 2(c) 및 (d) 는각각가설 H 1 인경우의 DFT 계수의실수부와허수부를나타내는도면이다. 도 2 로부터, H 0 이참일경우 SNR = 20 db 를제외하고는모든경우에 서감마모델의 KS 통계량이라플라시안및가우시안모델들의 KS 통계량보다더작다는것을확인할수있다. 차량잡음에대한거의모든경우에서, 가우시안분포가정은잡음이섞인음성의 DFT 스펙트럼을특징짓는데좋지못한선택인것으로관찰되었다. - 9 -

3) 도 3 은배블잡음조건하에서, SNR = 5, 10, 15, 20 db 에서평가된각각의모델에대한 KS 통계량을나타내는도면으로서, 도 3(a) 및 (b) 는각각가설 H 0 인경우의 DFT 계수의실수부와허수부를, 도 3(c) 및 (d) 는각각가설 H 1 인경우의 DFT 계수의실수부와허수부를나타내는도면이다. 도 3 에서는, 가설 H 1 하에서얻어진결과가가설 H 0 하에서생성된결 과와상당히다른경향을나타내고있다. H 0 에대해서는, 라플라시안모델의 KS 통계량이거의모든 SNR 값들에서최소 였으며, 감마모델의 KS 통계량이항상최대였다. 반면에, H 1 이참일경우에는감마모델이잡음이섞인음성의 DFT 계수 의분포에가장적합한것으로관찰되었다. 또한, 가우시안모델의성능은거의모든조건에서가장나쁜것으로관찰되었다. KS 테스트결과를요약하면, 잡음이섞인음성의 DFT 스펙트럼에대하여잡음의유형및 SNR 레벨에따라서로다른통계모델을적용하는것이유리할수있다는것을알수있다. 특히, 본발명에서관심을갖고있는감마모델에주목해보면, 1) 백색잡음이섞인음성이순수음성스펙트럼에접근하는경우, 2) 차량잡음이섞인음성의거의모든경우, 및 3) 배블잡음이섞인음성에서가설 H 1 이참인경우에감마모델이가우시안모델및라플라시안모델보다더적합한것으로관찰 되었다. 2. LRT 에기초한결정규칙 본발명의실시예는가정된통계적모델에기초하여, k 번째주파수빈 (bin) 에대한우도비 (likelihood ratio; 이하 'LR' 이라함 ) 를다음수학식 19 와같이정의하였다. 수학식 19 VAD 에대한결정규칙은개별주파수빈에대하여계산된 LR 들의기하평균으로서다음수학식 20 과같이구해질수있다. 수학식 20 여기서, M 은주파수빈의전체수를나타내며, η 은검출임계치를나타낸다. H 0 모두에대하여가우시안 PDF 가음성분포모델링에대하여사용되는경우에, LR 은다음수학식 21 에의해주어 진다. 수학식 21 여기서, 이고, 이며, 이들은각각선행 SNR(a priori SNR) 및후행 SNR(a posteriori SNR) 로지칭된다. 한편, 라플라시안 PDF 의경우에는, LR 이다음수학식 22 와같이구해진다. - 10 -

수학식 22 실질적으로, 수학식 22 를직접적용하는대신에, 하다고알려져있다. 이접근법은순간형태 (instantaneous form) 로서지칭된다. 를순간진폭스펙트럼 X k 로대체하는것이보다유리 LRT 의성능을보다향상시키기위하여, LR 을평탄화된형태 (smoothed form) 로지칭될수있는다음수학식 23 과같은형태로수정하는대안적인방법을제안한다. 수학식 23 여기서, 이며, 은평탄화파라미터 (smoothing parameter) 이다. 평탄화된형태에서는, 진폭스펙트럼에대하여보다평탄한평가치가순간값대신에적용된다. 다수의실험을통하여, 평탄화된 형태가순간형태보다우수하며, 특히 LRT의성능은평탄화파라미터 의선택에크게의존하는데, 의값으로는 0.9 를선택하는것이바람직한결과를준다는것을관찰하였다. 마지막으로, 감마 PDF 에대한 LR 의공식은앞서언급한수학식 1 과같이주어진다 ( 참조를위하여수학식 1 을다시기재함 ). < 수학식 1> 라플라시안모델의경우와유사하게, 상기수학식 1 을대응하는평탄화된형태인앞서언급한수학식 2 와같이변환할수있다 ( 참조를위하여수학식 2 를다시기재함 ). < 수학식 2> 여기서, 이며, 은감마모델에대한평탄화파라미터로서, 다수의실험을통하여그값을 0.9 로선택하는것이바람직한결과를주는것으로관찰되었다. 3. 실험결과 본발명의실시예에서는감마모델의성능을라플라시안모델의성능및가우시안모델의성능과비교하기위해, 각통계적모델에대한음성검출확률 (P d ) 과거짓경고 (false alarm) 확률 (P f ) 을조사하였다. - 11 -

도 4 내지도 6 은각각다양한잡음조건및 SNR 조건하에서의각각의통계모델에대한수신기동작특성 (ROC) 곡선을나타내는도면으로서, 각그래프에서가로축은음성검출확률 (P d ) 을, 세로축은거짓경고확률 (P f ) 을나타낸다. 도 4 내지 6 으로부터다음과같은사항들을관찰할수있다. (1) 도 4 는백색잡음조건하에서각각의모델에대한수신기동작특성 (ROC) 곡선을나타내는도면으로서, 4(a) 내지 (d) 는각각 SNR 이 5, 10, 15, 20 db 에해당하는경우를나타낸다. 도 4 로부터알수있는바와같이, 백색잡음의경우에는라플라시안모델에기초한 VAD 알고리즘이다른통계모델에기초한 VAD 알고리즘보다우수하였다. 또한, 감마모델에기초한 VAD 알고리즘도테스트된조건들의대부분에서가우시안모델의 VAD 알고리즘보다더좋은성능을보였다. (2) 도 5 는차량잡음조건하에서각각의모델에대한수신기동작특성 (ROC) 곡선을나타내는도면으로서, 5(a) 내지 (d) 는각각 SNR 이 5, 10, 15, 20 db 에해당하는경우를나타낸다. 도 5 에서확인할수있는바와같이, 차량잡음의경우에는 ROC 곡선이서로상대적으로인접한결과를보였다. 그러나 P f < 0.02 의경우에는감마모델에기초한 VAD 알고리즘이 다른모델들보다다소우수한성능을나타내는것으로관찰되었다. 또한, SNR 이증가함에따라검출정확도에서의차이가더커지는것으로관찰되었다. (3) 도 6 은배블잡음조건하에서각각의모델에대한수신기동작특성 (ROC) 곡선을나타내는도면으로서, 6(a) 내지 (d) 는각각 SNR 이 5, 10, 15, 20 db 에해당하는경우를나타낸다. 도 6 으로부터, 라플라시안모델을결합한 VAD 알고리즘이감마및가우시안모델을결합한 VAD 알고리즘보다우수한성능을보이는것을확인할수있다. SNR 이작아질수록성능의차이는더커졌다. 이상에서설명한바와같이, 잡음조건및 SNR 조건에따라서복소수감마모델에기초한 VAD 알고리즘이가장좋은성능을나타내는경우가있는것으로관찰되었다 ( 적어도기존에흔히사용되고있는가우시안모델에기초한 VAD 알고리즘보다는대부분의경우에서좋은성능을나타내고있다 ). 다음은본발명의실시예에따른복소수감마모델을적용한음성검출기에대하여설명한다. 도 7 은본발명의실시예에따른음성검출기의구성을나타내는도면이다. 도 7 에도시한바와같이, 본발명의실시예에따른음성검출기는고속푸리에변환기 (10, Fast Fourier Transformer; FFT), 잡음파워추정부 (20), 우도비결정부 (30), 및결정규칙계산부 (40) 를포함한다. 고속푸리에변환기 (10) 는입력된음성신호에대하여고속푸리에변환 (FFT) 을수행하여주파수영역의음성신호로변환시킨다. 잡음파워추정부 (20) 는상기고속푸리에변환기 (10) 에의해주파수영역으로변환된상기음성신호로부터잡음신호의파워를추정한다. 우도비결정부 (30) 는상기잡음파워추정부 (20) 에의해추정된상기잡음신호의파워에기초하여음성의존재와비존재에대하여, 순수음성과잡음의 DFT 계수가복소수감마확률통계모델을따른다고가정함으로써주파수영역에대한우도비를결정한다. 마지막으로, 결정규칙계산부 (40) 는상기우도비결정부 (30) 에의해결정된상기우도비로부터음성검출에대한결정규칙을상기수학식 1 을이용하여계산한다. 본발명의실시예에따른음성검출기의또다른구성으로서, 상기음성검출에대한결정규칙을계산하는결정규칙계산부 (40) 에서, 상기수학식 1 대신에상기수학식 2 를이용하여계산하는음성검출기의구성도가능하며, 특히평탄화파라 미터을 0.9 로설정하도록더욱한정한형태의음성검출기도고려할수있다. 이상설명한본발명은본발명이속한기술분야에서통상의지식을가진자에의하여다양한변형이나응용이가능하며, 본발명에따른기술적사상의범위는아래의특허청구범위에의하여정해져야할것이다. 발명의효과 본발명은, 기존의가우시안통계모델대신에복소수감마통계모델을사용하는음성검출방법및음성검출기를제안함으로써, 잡음의유형및 SNR 조건에따라서음성검출성능을향상시킬수있다. 도면의간단한설명 - 12 -

도 1 은백색잡음조건하에서, SNR = 5, 10, 15, 20 db 에서평가된각각의모델에대한 KS 통계량을나타내는도면으로서, 도 1(a) 및 (b) 는각각가설 H 0 인경우의 DFT 계수의실수부와허수부를, 도 1(c) 및 (d) 는각각가설 H 1 인경우의 DFT 계수의실수부와허수부를나타내는도면. 도 2 는차량잡음조건하에서, SNR = 5, 10, 15, 20 db 에서평가된각각의모델에대한 KS 통계량을나타내는도면으로서, 도 2(a) 및 (b) 는각각가설 H 0 인경우의 DFT 계수의실수부와허수부를, 도 2(c) 및 (d) 는각각가설 H 1 인경우의 DFT 계수의실수부와허수부를나타내는도면. 도 3 은배블잡음조건하에서, SNR = 5, 10, 15, 20 db 에서평가된각각의모델에대한 KS 통계량을나타내는도면으로서, 도 3(a) 및 (b) 는각각가설 H 0 인경우의 DFT 계수의실수부와허수부를, 도 3(c) 및 (d) 는각각가설 H 1 인경우의 DFT 계수의실수부와허수부를나타내는도면. 도 4 는백색잡음조건하에서각각의모델에대한수신기동작특성 (ROC) 곡선을나타내는도면으로서, 4(a) 내지 (d) 는각각 SNR 이 5, 10, 15, 20 db 에해당하는경우를나타내는도면. 도 5 는차량잡음조건하에서각각의모델에대한수신기동작특성 (ROC) 곡선을나타내는도면으로서, 5(a) 내지 (d) 는각각 SNR 이 5, 10, 15, 20 db 에해당하는경우를나타내는도면. 도 6 은배블잡음조건하에서각각의모델에대한수신기동작특성 (ROC) 곡선을나타내는도면으로서, 6(a) 내지 (d) 는각각 SNR 이 5, 10, 15, 20 db 에해당하는경우를나타내는도면. 도 7 은본발명의실시예에따른음성검출기의구성을나타내는도면. < 도면의주요부분에대한부호의설명 > 10 : 고속푸리에변환기 20 : 잡음파워추정부 30 : 우도비결정부 40 : 결정규칙계산부 도면 - 13 -

도면 1 도면 2-14 -

도면 3 도면 4-15 -

도면 5 도면 6 도면 7-16 -