DBPIA-NURIMEDIA

Similar documents
DBPIA-NURIMEDIA

Microsoft Word doc

영어교육연구제 22 권 4 호 2010 년겨울 대학생들의영어모음발음과지각 ( ) Yang, Byunggon. (2010). College students production and perception of English vowels. English Language Te

DBPIA-NURIMEDIA

[ 영어영문학 ] 제 55 권 4 호 (2010) ( ) ( ) ( ) 1) Kyuchul Yoon, Ji-Yeon Oh & Sang-Cheol Ahn. Teaching English prosody through English poems with clon

DBPIA-NURIMEDIA

<3520BDC5BDC2C8C62E687770>

Software Requirrment Analysis를 위한 정보 검색 기술의 응용

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA


<C7D1B1B9B1B3C0B0B0B3B9DFBFF85FC7D1B1B9B1B3C0B05F3430B1C733C8A35FC5EBC7D5BABB28C3D6C1BE292DC7A5C1F6C6F7C7D42E687770>

step 1-1

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 29, no. 10, Oct ,,. 0.5 %.., cm mm FR4 (ε r =4.4)

07_Àü¼ºÅÂ_0922

DBPIA-NURIMEDIA

À±½Â¿í Ãâ·Â

03 장태헌.hwp

433대지05박창용

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA

KCC2011 우수발표논문 휴먼오피니언자동분류시스템구현을위한비결정오피니언형용사구문에대한연구 1) Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion

DBPIA-NURIMEDIA

Analysis of objective and error source of ski technical championship Jin Su Seok 1, Seoung ki Kang 1 *, Jae Hyung Lee 1, & Won Il Son 2 1 yong in Univ

???? 1


DBPIA-NURIMEDIA

878 Yu Kim, Dongjae Kim 지막 용량수준까지도 멈춤 규칙이 만족되지 않아 시행이 종료되지 않는 경우에는 MTD의 추정이 불가 능하다는 단점이 있다. 최근 이 SM방법의 단점을 보완하기 위해 O Quigley 등 (1990)이 제안한 CRM(Continu

Æ÷Àå82š

인문사회과학기술융합학회

DBPIA-NURIMEDIA

(JBE Vol. 21, No. 1, January 2016) (Regular Paper) 21 1, (JBE Vol. 21, No. 1, January 2016) ISSN 228

삼성955_965_09

DBPIA-NURIMEDIA

에너지경제연구 제13권 제1호

슬라이드 1

한국현대치의학의발전 년논문, 증례보고, 종설및학술강연회연제를중심으로 Development of modern dentistry in Korea 저자저널명발행기관 NDSL URL 신유석 ; 신재의大韓齒科醫師協會誌 = The journal of the Ko

<B8F1C2F72E687770>

에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 -

09권오설_ok.hwp

부문별 에너지원 수요의 변동특성 및 공통변동에 미치는 거시적 요인들의 영향력 분석

ASR ISSN / Audiol Speech Res 2017;13(4): / RESEARCH PAPER Korean Speech Dynamic Range Acco

PowerPoint 프레젠테이션

歯kjmh2004v13n1.PDF

High Resolution Disparity Map Generation Using TOF Depth Camera In this paper, we propose a high-resolution disparity map generation method using a lo

02À±¼ø¿Á

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Sep.; 26(10),

DBPIA-NURIMEDIA

Microsoft Word - 국제중재

Analyses the Contents of Points per a Game and the Difference among Weight Categories after the Revision of Greco-Roman Style Wrestling Rules Han-bong

DBPIA-NURIMEDIA

06_ÀÌÀçÈÆ¿Ü0926


DBPIA-NURIMEDIA

232 도시행정학보 제25집 제4호 I. 서 론 1. 연구의 배경 및 목적 사회가 다원화될수록 다양성과 복합성의 요소는 증가하게 된다. 도시의 발달은 사회의 다원 화와 밀접하게 관련되어 있기 때문에 현대화된 도시는 경제, 사회, 정치 등이 복합적으로 연 계되어 있어 특

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

°í¼®ÁÖ Ãâ·Â

Microsoft Word - Westpac Korean Handouts.doc

09È«¼®¿µ 5~152s


<353420B1C7B9CCB6F52DC1F5B0ADC7F6BDC7C0BB20C0CCBFEBC7D120BEC6B5BFB1B3C0B0C7C1B7CEB1D7B7A52E687770>

에너지경제연구제 16 권제 1 호 Korean Energy Economic Review Volume 16, Number 1, March 2017 : pp. 35~55 학술 전력시장가격에대한역사적요인분해 * 35

1

[ReadyToCameral]RUF¹öÆÛ(CSTA02-29).hwp

서론 34 2

레이아웃 1

DBPIA-NURIMEDIA

14.531~539(08-037).fm

ÅëÁõ¼Ò½ÄÁö50È£

에너지경제연구 Korean Energy Economic Review Volume 9, Number 2, September 2010 : pp. 19~41 석유제품브랜드의자산가치측정 : 휘발유를 중심으로 19

08김현휘_ok.hwp

65 말소리와음성과학제 1 권제 3 호 (2009) pp. 65~72 미국인남성이발음한영어모음의포먼트궤적 Formant Trajectories of English Vowels Produced by American Males 양병곤 ABSTRACT Formant valu

03-서연옥.hwp

Page 2 of 5 아니다 means to not be, and is therefore the opposite of 이다. While English simply turns words like to be or to exist negative by adding not,

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Nov.; 26(11),

Journal of Educational Innovation Research 2019, Vol. 29, No. 1, pp DOI: (LiD) - - * Way to

03이경미(237~248)ok

①국문지리학회지-주성재-OK

<31325FB1E8B0E6BCBA2E687770>

<333820B1E8C8AFBFEB2D5A B8A620C0CCBFEBC7D120BDC7BFDC20C0A7C4A1C3DFC1A42E687770>

Lumbar spine

¹é¼ŁÇ¥Áö 11³âš


본문01

. 45 1,258 ( 601, 657; 1,111, 147). Cronbach α=.67.95, 95.1%, Kappa.95.,,,,,,.,...,.,,,,.,,,,,.. :,, ( )

ISO17025.PDF

Journal of Educational Innovation Research 2018, Vol. 28, No. 1, pp DOI: A study on Characte

Journal of Educational Innovation Research 2017, Vol. 27, No. 1, pp DOI: * The

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Feb.; 28(2),

저작자표시 - 동일조건변경허락 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 이차적저작물을작성할수있습니다. 이저작물을영리목적으로이용할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원

Journal of Educational Innovation Research 2017, Vol. 27, No. 3, pp DOI: (NCS) Method of Con

DBPIA-NURIMEDIA

012임수진

<35335FBCDBC7D1C1A42DB8E2B8AEBDBAC5CDC0C720C0FCB1E2C0FB20C6AFBCBA20BAD0BCAE2E687770>

(Exposure) Exposure (Exposure Assesment) EMF Unknown to mechanism Health Effect (Effect) Unknown to mechanism Behavior pattern (Micro- Environment) Re

278 경찰학연구제 12 권제 3 호 ( 통권제 31 호 )

歯5-2-13(전미희외).PDF

03-ÀÌÁ¦Çö

230 한국교육학연구 제20권 제3호 I. 서 론 청소년의 언어가 거칠어지고 있다. 개ㅅㄲ, ㅆㅂ놈(년), 미친ㅆㄲ, 닥쳐, 엠창, 뒤져 등과 같은 말은 주위에서 쉽게 들을 수 있다. 말과 글이 점차 된소리나 거센소리로 바뀌고, 외 국어 남용과 사이버 문화의 익명성 등


Transcription:

한국어대용량발화말뭉치의단모음분석 Monophthong Analysis on a Large-scale Speech Corpus of Read-Style Korean 저자 (Authors) 출처 (Source) 발행처 (Publisher) URL 윤태진, 강윤정 Yoon, Tae-Jin, Kang, Yoonjung 말소리와음성과학 6(3), 2014.09, 139-145 (7 pages) Phonetics and Speech Sciences 6(3), 2014.09, 139-145 (7 pages) 한국음성학회 The Korean Association of Speech Sciences http://www.dbpia.co.kr/article/node02479993 APA Style 윤태진, 강윤정 (2014). 한국어대용량발화말뭉치의단모음분석. 말소리와음성과학, 6(3), 139-145. 이용정보 (Accessed) University of Toronto( 토론토대학교 ) 142.150.***.39 2017/09/30 00:07 (KST) 저작권안내 DBpia에서제공되는모든저작물의저작권은원저작자에게있으며, 누리미디어는각저작물의내용을보증하거나책임을지지않습니다. 그리고 DBpia에서제공되는저작물은 DBpia와구독계약을체결한기관소속이용자혹은해당저작물의개별구매자가비영리적으로만이용할수있습니다. 그러므로이에위반하여 DBpia에서제공되는저작물을복제, 전송등의방법으로무단이용하는경우관련법령에따라민, 형사상의책임을질수있습니다. Copyright Information Copyright of all literary works provided by DBpia belongs to the copyright holder(s)and Nurimedia does not guarantee contents of the literary work or assume responsibility for the same. In addition, the literary works provided by DBpia may only be used by the users affiliated to the institutions which executed a subscription agreement with DBpia or the individual purchasers of the literary work(s)for non-commercial purposes. Therefore, any person who illegally uses the literary works provided by DBpia by means of reproduction or transmission shall assume civil and criminal responsibility according to applicable laws and regulations.

139 말소리와음성과학제 6 권제 3 호 (2014.09.30) ISSN 2005-8063, pp. 139~145 www.speechsciences.or.kr http://dx.doi.org/10.13064/ksss.2014.6.3.139 한국어대용량발화말뭉치의단모음분석 Monophthong Analysis on a Large-scale Speech Corpus of Read-Style Korean 윤태진 1) 강윤정 2) Yoon, Tae-Jin Kang, Yoonjung ABSTRACT The paper describes methods of conducting vowel analysis from a large-scale corpus with the aids of forced alignment and optimal formant ceiling methods. Read Style Corpus of Standard Korean is used for building the forced alignment system and a subset of the corpus for the processing and extraction of features for vowel analysis based on optimal formant ceiling. The results of the vowel analysis are reliable and comparable to the results obtained using traditional analytical methods. The findings indicate that the methods adopted for the analysis can be extended and be used for more fine-grained analysis without time-consuming manual labeling without losing accuracy and reliability. Keywords: large-scale spoken corpus, forced alignment, optimal formant ceiling, monophthongs 1. 서론 근래에들어음성말뭉치를이용한음성학연구가급속하게 팽창하는연구분야로떠오르고있다. 하지만, 자동음향분석 을할수있는적절한도구가널리이용되고있지않다는점 에서, 말뭉치기반의음성학연구가널리이용되고있지는않 다. 본연구는강제음성정렬장치와최적의상한선 (optimal ceiling) 을이용한포먼트추출방식을이용한연구방법을이 용하여대용량음성자료에서의모음연구를수행하는방법을 제시하고자한다. 음성자료는 서울말낭독체발화말뭉치 를 이용하였다. 말소리중모음의포먼트 (Formant) 는턱과혀의 움직임에따른성도모양 (vocal tract configuration) 의변화를 반영하며, 모음을발화하고인지하는데중요한역할을한다 (cf. Adank, 2003; Yang, 2008). 이렇듯모음의연구는 F1 과 F2 1) 청주대학교, tyoon@cju.ac.kr, 교신저자 2) University of Toronto at Scarborough, kang@utsc.utoronto.ca 이논문은제 1 저자가 2013 년도정부 ( 교육부 ) 의재원으로한국연구재단의지원을받고 (NRF-2013S1A5A8022540), 제 2 저저가캐나다의 SSHRC 로부터지원을받아연구되었음 (SSHRC-Partnership Grant #890-2012-25). 접수일자 : 2014 년 8 월 18 일수정일자 : 2014 년 9 월 23 일게재결정 : 2014 년 9 월 24 일 의포먼트를중심으로많은연구자들에의해지속적으로연구되어오고있다. Language 에실린 Labov, Rosendfelder, and Fruehwald (2013: 34-35) 는모음분석과관련한방법론에대해다음과같은논평을하고있다 : 1972년에수행된필라델피아지역의언어변화와변이프로젝트 (Linguistic Variation and Change; LVC) 에서모음연구를위해포먼트를측정한적이있는데, 당시의모음측정은개별화자에게서각각의모음범주들에서수작업을통해 5개에서 10개정도씩토큰을선택한후 LPC (Linear Predictive Coding) 분석을했다. 모음체계를처리하는데한모음당약 40시간이걸렸고, 모음토큰의수는각모음유형에따라약 300에서 350개정도남짓했다. 모음측정을자동으로할수있는소프트웨어기술은그후로많은발전을이루어, Praat 또는 ESPS (Entropic Signal Processing System) 같은소프트웨어를사용하면된다. 하지만특정한모음을포함하고있는단어를선택하고포먼트측정을하기위해모음의측정지점을고르는것은자동음성정렬을위한프로그램 (e.g. Yuan & Liberman 2008) 과자동으로포먼트측정을할수있는프로그램 (Evanini 2009) 이개발되기전까지는여전히상당히많은시간을소모하는작업으로남아있었다. 이처럼영어는말뭉치기반의음성학 (corpus phonetics) 혹은말뭉치기반의음운론 (corpus phonology) 라는학제간연구에서강제음성정렬 (forced alignment) 과자동포먼트측정을토대

140 말소리와음성과학제 6 권제 3 호 (2014) 로한음성말뭉치연구가이루어지고있다. 본논문의연구목적은한국어를대상으로강제음성정렬장치와 LPC 기반의포먼트추출에서필요한최적의포먼트상한선 (optimal ceiling) 설정을자동화하여모음연구를하는데필요한방법론적인연구를하는것이다. Linear Predictive Coding( 선형예측코딩 ; LPC) 을이용한포먼트추출방식은현재가장많이이용되고있는방식이다. 그런데, 이 LPC를이용한포먼트추출에는근본적인문제점이있다. LPC를이용해포먼트를추출할때, LPC 차수 (order) 는보통포먼트개수의두배가되도록지정한다. 일반적으로남성화자들의포먼트를신뢰성있게추출하기위해서는여성화자들보다더많은 LPC 차수 (order) 를지정해야한다. Praat의매뉴얼에 LPC를구하기위해서, 평균성인여성의경우 5500Hz 를그리고평균성인남성의경우 5000Hz 를최고의포먼트값으로정하는것이적절하다고지적되어왔다 (Boersma & Weenink, 2014). LPC 차수는성별뿐만아니라, 모음의종류에따라영향을받는다. 일반적으로후설모음은높은 LPC차수가필요하고, 전설모음은낮은 LPC차수가필요하다 (Yao et al., 2010). 물론이외에도개인의생리학적인특징도 LPC 차수에영향을미칠것이다. 이러한복잡한상호작용으로인해, 보다정확한모음분석을원하는음성학자들은수작업을통해 LPC 차수를기입하고결과를확인하면서포먼트를추출하였다. 본논문에서는정확성을유지하면서모음분석작업을자동화시킬수있는방법을사용하는것을제안한다. 일반적으로각각의모음은성별에따라 4000Hz 에서 6000Hz 사이의주파수를 LPC를기반으로한최적으로포먼트를추출할수있는최고값이라고할수있으므로, 4000Hz 에서 6000Hz 중성별과모음에따라포먼트측정치의변이 (variation) 를최소화하는주파수값을설정할수있다면, 그최소의변이를가져오는주파수값을최적의포먼트상한선 (optimal formant ceiling) 이라고할수있을것이다 (Escudero et al., 2009). 본논문에서는자동추출한최적의포먼트상한선을토대로강제음성정렬된음성신호에서포먼트를추출하여대용량말뭉치의방대한자표를이용해모음정보를추출하고자한다. 2. 연구방법 2.1 말뭉치본논문에서자료로이용할말뭉치는 서울말낭독체발화말뭉치 이다. 이 서울말낭독체발화말뭉치 는국립국어원에서 2002년에개발하고 2005년도경에공개및분배한말뭉치이다. 이말뭉치는 20대에서 70대사이의서울경기지역화자로, 부모역시서울경기지역화자인 120명의낭독체자료이다. 이 120명의화자들은남자 60명과여자 60명으로구성되어있다. < 표 > 1은연령대별남녀화자의수를보여준다. 표 1. 연령대별남녀화자수 Table 1. Number of speakers by gender and age 연령 20 대 30 대 40 대 50 대 60 대 ~70 대 남성 20 20 11 9 여성 20 20 18 2 서울말낭독체발화말뭉치 는 120 명의남녀화자들이각 각초등학교에서부터고등학교에이르기까지국어시간에배 운동화, 수필, 소설등다양한형태의글들을방음처리된음 성실험실에서편안하게읽은음성자료들을모아놓은말뭉치 이다. 낭독한텍스트와한사람이각텍스트를읽는데소요된 시간을 < 표 > 2 에서보여준다 (Yoon, 2013). 참고로 20 대부터 40 대까지는 19 개의작품을약 1 시간에서 1 시간 20 분정도의 시간을들여모두녹음하였고, 50 대이상은 9 번부터 19 번까지 의작품만녹음하였다. 표 2. 서울말낭독체발화말뭉치의내용 Table 2. Contents of the Reading Style Corpus of Standard Korean 낭독체내용문장수발화시간 1. 요람기 51 5 분 37 초 2. 소나기 87 4 분 3. 아름다움에대하여 69 5 분 20 초 4. 방망이를깎던노인 62 4 분 59 초 5. 문학의세계와삶의세계 47 5 분 35 초 6. 독서와인생 54 4 분 92 초 7. 수난이대 62 5 분 29 초 8. 메밀꽃필무렵 94 7 분 10 초 9. 토끼와자라 60 3 분 09 초 10. 선녀와나무꾼 73 4 분 92 초 11. 호랑이와곶감 42 2 분 67 초 12. 해님달님 28 2 분 07 초 13. 그리운시내가 36 4 분 61 초 14. 광화문지하도아주머니 27 2 분 47 초 15. 막지은밥 17 1 분 77 초 16 눈오던날 35 2 분 46 초 17. 숭늉의지혜 19 1 분 58 초 18. 까만눈동자들앞에서 27 3 분 43 초 19. 내고향개울물에서 40 2 분 72 초 합계 930 73 분 61 초 이말뭉치를연구의대상으로삼은이유는비록수년동안 국립국어원에서수집한공개음성자료이긴하지만, 이음성

한국어대용량발화말뭉치의단모음분석 141 자료를활용한음성혹은언어학적인연구가많지않다는것과기존에수행된세대별서울말연구에대한보완책으로서활용될수있다는것이다. 또한통제된환경에서추출된발화에서는경험하지못한대용량음성말뭉치특유의분석상의어려움을파악하고극복하는데도움이되기때문이다. 2.2 강제음성정렬장치강제음성정렬 (forced alignment) 은음성인식장치 (Automatic Speech Recognition System) 에제약을가하여주어진발화체들의단어및단어를구성하는음소들의연쇄만을찾도록하는장치이다 (Hosom, 2000). 본연구는대용량말뭉치에서모음을추출하고분석하는작업을수행하기위해발화체들을구성하는단어와음소들을강제음성정렬 (forced aligned) 시키는작업을우선적으로수행하였다. 이작업을위해은닉마르코프모형 (Hidden Markov Model; HMM) 기반의자동강제음성정렬장치를개발하였다. 일반적으로 HMM은음성인식시스템을구현하는데사용된다. 음성신호에담긴정보는짧은구간의파워스펙트럼 (power spectrum) 으로표현된다. 이정보를해석하기위해서는파워스펙트럼과시간에따른변화를추적해야하는기술이필요한데, 여러기술중통계적모델링방법인 Hidden Markov Model(HMM) 이가장성공적인학습기술로알려져있다. 음성인식구축을위한공개소프트웨어인 HTK(HMM Tool Kit, Version 3.4.1, Young et al., 2006) 과 HTK을운용하기위해스크립팅언어인 Python (version 2.7) 를사용하여강제음성정렬시스템을구축하였다. 강제음성정렬장치를구축하기위해서는음향모형과발음사전이반드시필요하다. 이두모형을만들기위해음성파일로는 100시간이넘고, 어절타입수로는 5500어절이넘는 서울말낭독체발화말뭉치 를사용하였다. 우선음향모형을만든방법은다음과같다 : 42개의음성단위 (phone unit) 를설정하고, HMM의상태수 (number of states) 3의연속음성훈련을수행하도록설계되었다. 사용된음향매개변수는 12개의 MFCC(Mel Frequency Cepstral Coefficients) 와 1 개의 Energy 를기본매개변수로하여, 이들의일차도함수 13 개및이차도함수 13개를도출하여, 총 39개의음향매개변수를사용하였다. 기본적인음성모델링을진행한후, 문장발화에서단어 (word) 와단어사이, 구 (phrase) 나구사이, 혹은발화문 (utterance) 의시작점과종결점에서발생할수도있는짧은휴지 (short pause) 를인식할수있는휴지모형 (silence model) 을설정하였다. 그리고정형화된발음열을가진발음사전을사용하여각각의음성단위에대한정규분포의결합 (Gaussian Mixture) 을증가시키면서음향모형을재훈련시키는방법을사용하여강제음성정렬시스템의성능을향상시켰다 (Yoon, 2013). 발음사전을만들기위해서 서울말낭독체발화말뭉치 에 서관찰된어절을추출한후, 어절당하나씩의정형화된발 음열을가진기본사전을구축하였다. 발화말뭉치에는약 5,500 개의변별적인어절유형이 19 개의낭독체텍스트에분 포되어있다. 한글자모를토대로음절화시킨후, 음절화된자 모를유니코드의기준에맞추어로마자표기 (Romanization) 를 하였다. 국어에서는음절사이의자음들이위치동화 (place assimilation), 비음화 (nasalization), 설측음화 (lateralization) 등과 같은음운변화를겪는다는점을반영하여 (Ahn, 1996), 어절내 의음절간에일어나는음운규칙을일부적용시켰다 (Yoon, 2013). < 그림 > 1 은강제음성정렬시킨발화의예를보여준다. 이상 HTK 와 Python 를기반으로하여 서울말낭독체발화 말뭉치 를훈련시켜개발한강제음성정렬장치는 Korean Phonetic Aligner 라는이름으로웹기반에서이용할수있도록 하였다 3). 이온라인강제음성정렬장치에는서울말낭독체발 화말뭉치에서나타나는 5500 여개의어절만이발음사전으로 탑재되어있어서, 새로운단어들을처리하는데한계가있다. 하지만, 새로운어절이나단어도발음사전을생성하는장치를 통해처리할수있도록개발되었다. 그림 1. 강제음성정렬시킨예. Figure 1. Example of the output of forced-aligned utterance 2.3 포먼트추출 현재널리사용되고있는음성분석프로그램인 Praat 에서일 반적으로권장되는포먼트측정방식은 To Formant(burg) 이다. 물론 Burg 방식을사용한측정방식외에도 Split-Levinson 알 고리듬이나자기상관방식 (autocorrelation) 을이용해포먼트를 측정할수있는방법들이있다. 하지만, Praat manual 에서 Burg 방식을권장한다. 양병곤 (2008: 50) 에의하면, 합성음의 포먼트분석에서 Praat 의 Burg 방식에서가장적은측정에러 가나온다. 따라서본논문에서는 Burg 방식에의한포먼트추 출을따르기로한다. 우선 Burg 방식에따른포먼트방식에대해살펴보고, 대 용량의음성자료에자동처리방식을적용하여결과를추출하 였을때어떠한이론적및실용적문제점을지니는지살펴보 도록하겠다. 모음분석을위해서는말뭉치의자료중 호랑 3) korean.utsc.utoronto.ca/kpa/

142 말소리와음성과학제 6 권제 3 호 (2014) 이와곶감 에서나타난단모음만을대상으로하였다. 분석화 자의수는음성파일에이상이없고강제음성정렬에서도오류 를나타내지않은 88 명을대상으로하였다. < 표 > 3 은 호랑이 와곶감 에나오는모음의분포를화자 1 명이발화한것이다. 표 3. 호랑이와곶감 에나타난단모음의분포 Table 3. Number of monophthongal vowel tokens in the story The Tiger and the Dried Persimmon 하였다. 이 26 개의후보값중에서, F1과 F2 측정치의변이 (variance) 가가장적게나타나는포먼트상한선값을최적형으로선택하였다 (Escudero et al. 2009). < 그림 > 3은각모음별로, 포먼트상한선값 (x-축) 에따라 F1, F2의평균값과변이 (y-축) 가어떻게달라지는지를나타낸다. 수직선으로표시된부분은최소의변이를보이는포먼트상한선값을보여주는부분이다. 모음 한글 IPA 화자당토큰수 a ( ) [ɑ] 2540 ae ( ) [ɛ] 421 e ( ) [e] 427 eo ( ) [ʌ] 1224 eu ( ) [ɨ] 1555 i ( ) [i] 1683 o ( ) [o] 1165 u ( ) [u] 724 9739 < 그림 > 2는한여성화자의음성자료에서 F1과 F2를 Burg 방식을이용하여추출한모음도 (vowel chart) 이다. 일반적인관행을따라, 여성화자이므로포먼트상한선 (Formant ceiling) 을 5500Hz 으로한후, 모음측정의오류를줄이기위해모음의중앙 20% 구간의평균 F1과 F2 값을측정한결과임에도불구하고, 측정상의에러 (measurement error) 를보여주는토큰들이다수있다는것을알수있다. 그림 3. 최소의변이형을보여주는최적의최고값 Figure 3. Optimal ceiling that reveals minimal variation 이상과같은방식을통하여, 88 명의화자들에게서각단모 음에대한최적의포먼트상한선을결정하였다. < 그림 > 4 는 20 대여성화자중한명 (FV03) 에게서추출한최적의포먼트 상한선을모음별로도식화한것을보여주고있다. 그림 2. 5500Hz 의포먼트상한선 (formant ceiling) 을토대로구성한여성화자의모음분포도 Figure 2. Vowel formant chart of a female speaker drawn from the formant values with the 5500Hz formant ceiling 최적의포먼트상한선을찾기위해서는다음과같은방식 이사용되었다. 4000Hz 에서시작하여 100Hz 씩증가시켜 6500Hz 까지최적의포먼트상한선의후보값이될수있도록 그림 4. 한여성화자 (FV03) 의모음별최적의포먼트상한선 Figure 4. Optimal formant ceilings of vowels for a female speaker (FV03)

한국어대용량발화말뭉치의단모음분석 143 성별에따라최적의포먼트상한선 (formant ceiling) 이달리나타나는이유는여성과남성의성도의길이가차이가나기때문이다. 그리고모음에따라포먼트상한선이다르게나타나는이유는후설모음 [o] 와 [u] 같은경우 LPC 차수가낮으면두개의포먼트가가까이접근하여하나의포먼트로인식되는오류가발생할수있기때문이다. < 그림 > 5는 20대여성화자들의단모음에따른 optimal ceiling 의분포를보여주고있다. < 그림 > 5를통해후설모음일경우의최적의포먼트상한선값이전설모음일경우의최적의포먼트상한선값보다다소낮아지는경향이있다는것을관찰할수있다. < 표 > 4 는 < 그림 > 6 에표시된포먼트들의평균값과표준편차 를수치화한것이다. 표 4. 한남성화자 (mz08) 의 F1 과 F2 평균및표준편차 Table 4. Mean and standard deviation of F1 and F2 of the male speaker (mz08) mz08 F1 (Hertz) F2 (Hertz) mean std. dev. mean std. dev. i 329 46 1911 207 e 485 48 1725 96 ae 475 37 1689 128 a 667 75 1264 109 eo 500 42 1050 167 o 445 47 943 173 u 331 37 1017 208 eu 407 46 1911 207 표 5. 남성화자들의 F1 과 F2 평균및표준편차 Table 5. Mean and standard deviation of F1 and F2 by all male speakers 그림 5. 20 대여성화자들의모음별최적의포먼트상한선분포 Figure 5. Distribution of optimal ceiling values for all female speakers in their 20 s. 이상의 LPC 차수의최적의포먼트상한선 (optimal formant ceiling) 을이용하여추출한각단모음에해당하는 F1 과 F2 를 가지고, 평균과표준편차를구하였다. 평균에서 2x 표준편차 내에 95% 이상의토큰들이분포를이루고있으므로, 2x 표준편 차이상으로벗어나는토큰들의포먼트값은이상치 (outliers) 로 간주하고분석에서제외하였다. < 그림 > 6 은이와같은방식을 통해얻은한남성화자의모음도이다. 그림 6: 한남성 (mz08) 의최적의포먼트상한선에의한모음도 Figure 6. Vowel chart of a male speaker (mz08) obtained by the optimal ceiling method. 남성 표 6. 여성화자들의 F1 과 F2 평균및표준편차 Table 6. Mean and standard deviation of F1 and F2 by all female speakers 여성 F1 (Hertz) F1 (Hertz) F2 (Hertz) mean std. dev. mean. std. dev. i 325 29 1960 159 e 448 42 1739 124 ae 444 46 1717 113 a 638 58 1333 105 eo 486 42 1100 64 o 412 38 984 60 u 333 34 1066 70 ɨ (eu) 374 40 1381 98 F2 (Hertz) mean std. dev. mean std. dev. i 360 35 2442 147 e 500 38 2168 124 ae 480 47 2173 138 a 825 65 1688 80 eo 595 56 1286 84 o 450 44 1103 98 u 357 36 1203 120 ɨ (eu) 410 42 1706 141

144 말소리와음성과학제 6 권제 3 호 (2014) 이상 88명의화자들이 호랑이와곶감 라는작품을낭독한음성자료를가지고자동음성정렬장치와최적의포먼트상한선을선택하는방식을통해대용량의음성자료를처리할수있는방법을실증하였다. 다음의 < 표 > 5과 < 표 > 6은모든남성과여성의 F1과 F2의평균과표준편차를각각보여준다. < 그림 > 7은모든화자들의 F1과 F2의평균값을성별로나누어그려놓은모음도이다. 파란색은여성화자, 그리고빨간색은남성화자들의평균값을나타낸다. 러연구에서검증된바있다. 한국어모음 /o/ 와 /u/ 가 F1과 F2 의평균값에서서로큰차이를보이지않고하나의집단으로분류되는경향이지속적으로보고되고있다 (cf. Chae, 2005; Yun and Seung, 2013; Kang, 2013). < 그림 > 7에서도다른모음들간의거리보다모음 /o/ 와 /u/ 의거리가가깝다는것을보여준다. 4. 결론 그림 7. 남녀화자들의평균 F1 및 F2 값을나타내는모음도 Figure 7. Vowel chart with mean F1 and F2 of male and female speakers, respectively 본논문에서제시한화자들의포먼트평균값은통제된음 성실험을통해추출한모음의포먼트값과비슷한결과를보 여주고있다 (cf. Yang, 1996) 4). 이는본논문에서시도한포 먼트자동측정방식이신뢰할만한정도의정확성을가지고 있음을나타내는것이다. < 그림 > 7 을보면, /ɛ/ 와 /æ/ 의경우, F1-F2 모음공간상에서이미합병 (merger) 이되었다는것을 알수있다. 현대한국어의표준말단모음체계는연구자에 따라 7 모음체계로보는경우와 10 모음체계로보는경우도있 다. 7 모음체계를주장하는분석은 /i, ɛ, ʌ, ɑ, ɨ, u, o/ 와같은 단모음들을설정하고있다. 10 모음체계는 7 모음체계에 /y, ø, æ/ 를음소목록에첨가한경우이다. /y/ 와 /ø/ 모음의경우는 현재대부분의한국어화자들이두모음을각각 /wi/ 와 /wɛ/ 와 같이이중모음으로조음하고있다 (Han and Kim, 2014). /ɛ/ 와 /æ/ 의경우합병 (merger) 이되었다는것을 < 그림 > 7 을통해서 알수있다. /ɛ/ 와 /æ/ 의합병 (merger) 은 Hong (1988) 등의여 4) 본논문에서의모음분석의결과가기존의통제된음성실험에서보고된결과와유사하다는것은넓은의미에서해석할필요가있다. 유사성이각모음의평균값이오차범위내에있다는의미보다는조음과포먼트의관계에비추어보았을때우리가예측할수있는기대치에근접한모음도혹은기존의통제된음성실험에서보고된모음도 (vowel chart) 에유사한형태로구해졌다는의미로해석할수있다. 음성말뭉치 (spoken corpus) 를이용한음성분석을위해서는음성말뭉치에서음성정보를추출할수있는도구가있어야한다. 음성말뭉치를이용하는데있어서우리가넘어야할산은크게두가지가있다. 첫째는음성신호의변이성 (variability) 이다. 문자로된말뭉치 (written corpus) 와달리음성말뭉치는여러환경의영향으로인해보다많은변이를보인다. 또한, 음성말뭉치는일반적으로다양한화자들에게서녹음한음성자료를포함하고있다. 이러한이유로인해화자간의생리학적차이, 사회적요소및개별화자의특성등화자간의변이 (inter-speaker variation) 도분석에있어서커다란난제라고할수있다 (Adank, 2003). 음성말뭉치를사용할때주의해야할또다른문제점은 측정상의오류 (measurement error) 이다 (Yao et al., 2010). 최근사용되는자동음성분석방식중많은방식들이자동음성인식이나음성합성을위해개발된것들이다. 그런데음성인식이나음성합성은일반적으로음성분석에필요한정도의정확성보다는전반적인인식혹은합성의정확성에신경을쓰는경우가있다. 본논문은이러한측정상의오류를극복하고대용량의음성자료를처리할수있는방법을실증해보여주었다. 다시말해, 본논문은대용량의음성말뭉치를사용하여강제음성정렬장치와최적의포먼트측정을통한한국어단모음의분석방법을제시하였다. 우선, 강제음성정렬장치를통해음성신호에서단어및유사음소단위정렬을하였다. 강제음성정렬된정보를이용하여단모음들을파악한후, F1과 F2를각각의단모음들이가지고있는음향음성학적특성과각각의화자들이가지고있는특성에맞추어추출하기위해최적의포먼트상한선을설정하는작업을수행하였다. 그리고마지막으로각화자들이가지고있는평균포먼트값에서 2x표준편차이상으로벗어나서추출된포먼트값은이상치 (outlier) 라고판단하여분석대상에서제외하였다. 강제음성정렬장치에서도오류가발생할수있고, 고정된매개변수를상정하여포먼트를추출하는과정에서도오류가발생할수있다. 포먼트의분포에제약을가함으로써분석상의오류들을최소화할수있으며, 이는대용량의음성자료를생태학적으로유효한결과를도출하고기존의통제된환경에서도출한모음분석결과와비교할

한국어대용량발화말뭉치의단모음분석 145 수있는유효성을가져다주는효과를가지고있다. 참고문헌 [1] Adank, P. (2003). Vowel normalization: A perceptual-acoustic study of Dutch vowels. Ph.D. thesis, University of Nijmegen. [2] Ahn, S.-C. (1996). An Introduction to Korean Phonology. Seoul: Hanshin Publishing Co. [3] Boersma, P. & Weenink, D. (2014). Praat: doing phonetics by computer [Computer program]. Version 5.3.85, retrieved 19 September 2014 from http://www.praat.org. [4] Chae, S.-Y. (2005). External Constraints on Sound Change: The Raising of /o/ in Seoul Korean. Doctoral Dissertation, University of Pennsylvania. [5] Escudero, P., Boersma, P., Rauber, A. S., & Bion, R. A. H. (2009). A cross-dialect acoustic description of vowels: Brazilian and European Portuguese. Journal of Acoustical Society of America, 126, 1379-1393. [6] Evanini, K. (2009). The permeability of dialect boundaries: a case study of the region surrounding Erie, Pennsylvania. Doctoral Dissertation, University of Pennsylvania. [7] Han, J.-I. & Kim, J.-Y., (2014). A phonetic investigation of Korean monophthongs in the early twentieth century. Phonetics and Speech Sciences, 6(1), 31-38. ( 한정임 & 김주연. (2014). 20세기초한국어단모음의음향음성학적연구. 말소리와음성과학 6(1), 31-38.) [8] Hong, Y. (1988) A sociolinguistic study of Seoul Korean. Unpublished Ph.D. thesis, University of Pennsylvania. [9] Hosom, J.-P. (2000). Automatic Time Alignment of Phonemes Using Acoustic-Phonetic Information. Ph.D. thesis, Oregon Graduate Institute. [10] Kang, Y. (2013). A corpus-based study of positional variation in Seoul Korean vowels. Paper presented at Japanese Korean Linguistics Conference 23. October 11-13. [11] Labov, W., I. Rosenfelder, & J. Fruehwald. (2013) One hundred years of sound change in Philadelphia: Linear incrementation, reversal, and reanalysis. Language, 89(1), 30-65. [12] Yang, B. (2008). Formant measurement of complex waves and vowels produced by students. Korean Journal of Phonetic Sciences 15(3), 39-52. ( 양병곤 (2008). 복합음과대학생이발음한모음포먼트측정. 음성과학 15(3), 39-52) [13] Yang, B. (1996) A comparative study of American English and Korean vowels produced by male and female speakers. Journal of Phonetics, 24, 245-261. [14] Yao, Y., S. Tilsen, R. L. Sprouse, & K. Johnson. (2010). Automatic Measurement of Vowel Formant in the Buckeye Corpus. UC Berkeley Phonology Lab Annual Report. [15] Yoon, T.-J. (2013). Large-scale Studies of Phonetic Data using Forced Alignment System. Studies in Linguistics, 29, 207-227. ( 윤태진 (2013). 강제음성정렬장치를이용한대용량음성자료 연구. 언어학연구, 29, 207-227.) [16] Young, S. J., G. Evermann, M. J. F. Gales, T. Hain, D. Kershaw, G. Moore, J. Odell, D. Ollason, D. Povey, V. Valtchev, & P. C. Woodland. (2006). The HTK Book (version 3.4), Cambridge University Engineering Department [17] Yuan, J. & M. Liberman (2008). Speaker identification on the SCOTUS corpus, Proceedings of Acoustics 2008, 5687-5690. [18] Yun, J. & Seung, C. (2013). Effects of F1/F2 manipulation on the perception of Korean vowels /o/ and /u/. Speech Sciences, 5(3), 39-45. ( 윤지현, 성철재. (2013). F1/F2 의변화가한국어 / 오 /, / 우 / 모 음의지각판별에미치는영향. 말소리와음성과학, 5(3), 39-45.) 윤태진 (Yoon, Tae-Jin) 청주대학교영어영문학과충북청주시청원구대성로 298, 360-764 Tel: 043-299-7573 Fax: 043-229-8310 Email: tyoon@cju.ac.kr 관심분야 : 음성학, 음운론 강윤정 (Kang, Yoonjung) Centre for French and Linguistics, University of Toronto Scarborough 1265 Military Trail, HW314, Toronto ON M1C 1A4, Canada Tel: 416-287-7172 Fax: 416-208-2669 Email: kang@utsc.utoronto.ca 관심분야 : 음성학, 음운론