39 1) 복합음과대학생이발음한모음포먼트측정 * Formant Measurements of Complex Waves and Vowels Produced by Students 양병곤 ** Byunggon Yang ABSTRACT Formant measurements are one of the most important factors to objectively test cross-linguistic differences among vowels produced by speakers of any given languages. However, many speech analysis softwares present erroneous estimates and some researchers use them without any verification procedures. The purposes of this paper are to examine formant measurements of complex waves which were synthesized from the average formant values of five Korean vowels using three default methods in Praat and to verify the measured values of the five vowels produced by 20 students using one of the methods. Variances along the time axis are discussed after determining absolute difference sum from the 1/3 vowel duration point. Results show that there were smaller measurement errors by the burg method. Also, greater errors were observed in the sl or lpc methods mostly caused by the inappropriate formant settings. Formant measurement deviations were greater in those vowels produced by the female students than those of the male students, which were mostly attributed to the settings for the vowels /o, u/. Formant settings can best be corrected by changing the number of formants to the number of visible dark bands on the spectrogram. Those results suggest that researchers should check the validity of the estimates from the speech analysis software. Further studies are recommended on the perception test of the original sound with the synthesized sound by the estimated formant values. Keywords: speech analysis, acoustic measurements, vowel formants 1. 머리말 최근에많은연구자들이음성분석소프트웨어를이용하여모음의포먼트값을측정하여언어간비교나사전사후학습효과등을객관적으로제시해왔다. 일부연구자들은분석과정에대한별다른검토없이, 기존의연구논문에서제시한결과와큰값차이를보이는잘못측정된결과를논문초고에기록하여제출하는경우가종종있었다. 이에본논문에서는포먼트값을바르게 * 이논문은부산대학교자유과제학술연구비 (2 년 ) 에의하여연구되었음. ** 부산대학교영어교육학과교수
40 음성과학제 15 권제 3 호 (2008. 9) 구할수있는방법을찾아보기위해, 합성음과대학생이발음한모음의포먼트값을구하는과정에서발생할수있는문제점을살펴보고자한다. 이러한연구는보다정확한포먼트측정에대한자료를제공함으로써앞으로국어를비롯한외국어모음연구에타당성을부여하여의미있는결과를도출하는데기여할수있을것으로기대된다. 포먼트값은성도의공명특성을음향적인수치로구한값을말한다 (Fant, 1960). 포먼트는스펙트로그램에서에너지가밀집된검은띠의중심점을말하는데, 좀더자세히측정하기위해서는스펙트럼을구하여에너지정점을찾기도한다. 모음스펙트럼에서포먼트가차지하는강도는보통대역 (bandwidth) 값으로나타내는데, 이값이클수록포먼트가넓게퍼져있게되어에너지정점의진폭값은낮게되고포먼트값으로추정될확률이낮아지게된다. 실제측정된모음의포먼트는안면의쑥들어간입안에서방출된음성을얼굴표면이반사시켜확대시키는방사특성에의해옥타브당 6 db정도로고주파영역의에너지가증폭되지만, 고주파로갈수록에너지가급격히낮아지기때문에음성분석소프트웨어에서도고주파대역증폭 (preemphasis) 을시켜서음성분석소프트웨어에서고주파대역의에너지는실제보다훨씬더높게표시된다. 일반적으로모음의포먼트는여러개가나타나지만가장낮은것부터 3 4 개를사용하는데, 제1 포먼트 (F1) 는턱을내리거나올려서입안의공간인구강을넓히면높아지고그반대로좁히면낮아진다 (Picket, 1987). 제2 포먼트 (F2) 는주로혀의움직임을나타내는데, 혀가앞쪽으로밀려갔을때는높아지고뒤쪽으로밀려갔을때는낮아지는경향이있다. 제3 포먼트 (F3) 는입술을둥글게하여성도의길이가늘어나거나혀를말아올려 /r/ 을발음할때낮아진다. 포먼트값은모음연구의매우중요한부분을차지한다. Kent와 Read(2002) 에서는가장전통적인연구인 Peterson과 Barney(1952) 를비롯하여 Hillenbrand 외 (1995), Yang(1996) 을포함하여그당시까지발표된 8 개의연구에서밝혀진영어모음의포먼트측정값을제시하고이값들의평균과표준편차를표로나타내었다 ( 강석한, 2007:132-133, 표 4-1과 4-2 참고 ). 이렇게측정된값들의표준편차를보면, 남성의 F1은모음 /ɑ/ 에서 54 Hz로가장크고다른모음에서는 17 Hz에서 37 Hz에이르지만, F2에서는가장변화가큰모음이 /u/ 로 241 Hz정도로매우높고, 인접한후설모음 /ʊ, o, ɔ/ 등에서는 130 Hz로 /æ/ 를제외한전설모음에비해두배이상의편차를보이고있다. 이에반해 F3에서는 /æ/ 에서 102 Hz로최고값을보이고다른모음에서는대체로 44 Hz에서 80 Hz 범위에걸쳐있다. 여성화자의 F1의편차는모음 /æ, ɔ/ 가각각 115 Hz, 114 Hz 를보이고, 나머지는 14 Hz에서 80 Hz까지퍼져있으나대체로편차가적은편이다. F2에서는모음 /u/ 가무려 295 Hz의편차를보이고, 인접한후설모음 /ʊ, o, ɔ/ 는각각 204 Hz, 183 Hz, 150 Hz로다른모음에비해상대적으로많은편차가있다. F3의표준편차값은모음 /ɑ/ 에서 141 Hz 로최고값을보이고나머지모음의편차값은 39 Hz에서 82 Hz로분포되어있다. 이런경향의주된원인은모음 /o, u/ 와같이 F1과 F2가서로근접하는모음에서두개의포먼트를한개로잘못추정하거나, hard라는목표어에서모음 /ɑ/ 를측정한위치가연구마다달랐기때문일수있다. 보통 /r/ 발음을미국영어에서는혀앞부분을입천장을향해말아올려발음함으로써 F3값이아래로움푹내려오는모양을보인다 (Edward, 2003:207). 일부방언을사용하는화자에서는영국영어의방식으로이런혀의움직임을보이지않았을수도있다. 덧붙여, 모음 /ɔ/ 는목표어를 hawed 로주었는데, 이발음을할때입술을둥글게한경우와그렇지않은경우에는포먼트값의차이
복합음과대학생이발음한모음포먼트측정 41 를가져왔을것으로생각된다. 일반적으로포먼트값은발음한사람이목표음을바르게발음했는가? 발화음의환경은어떠한가? 발화음의어느시간지점에서측정했는가? 어떤방식으로분석했는가? 일관성있는기준을적용했는가? 등에따라같은음성파일에대한측정값이라도달라질수있다. 만약피험자가다른목표모음으로발음했다면, 분석된포먼트값의결과에근거한일반화는문제가될수있다. 이런오류를줄이기위해서는녹음된음성을여러명이들어서옳은목표모음인지판단한다음분석을하면된다. 두번째로발화음의환경은공동조음현상으로가장빠른이동거리로조음이되므로앞뒤에오는자음의영향이모음발화에영향을주게된다. Lindblom(1963) 은모음 /u/ 만발음할때는 F2가 F1에아주가까이접근하였으나 /dud/ 와같이자음 d 사이에넣어발음했을때 F2값은 F1에서많이떨어져발음되었는데이를목표음미달 (undershoot) 의예로제시했다. 이렇게녹음환경에따라포먼트측정값이달라질수있고다른환경에서측정한값들은서로비교하는데어려움이있다. 덧붙여, 발화음의측정지점이어디인가에따라포먼트값이많이달라진다. 또한사람의발성기관은발성중끊임없이움직이기때문에측정위치에따라값들이달라질수있다. Yang(1996) 은발화속도에따라측정지점이이동하고있으므로모음의전체지속시간을기준으로일정한비율지점에서측정하면화자마다어느정도일관성이있음을보고했다. 많은기존의연구들이모음의시작부나끝부분보다는안정구간을측정위치로많이사용하는데 Strange (1987) 는모음안정구간보다는시작부분과끝부분에더중요한정보가들어있음을지적했다. 실제안정구간을묵음으로하고시작부분과끝부분만들려준결과많은사람들이정확히모음을지각했음을밝힌바있다. 2. 합성음에대한포먼트측정 2.1 합성음제작방법분석소프트웨어가포먼트값을바르게측정하는지판단하기위해서는사람의목소리보다는기계로만든합성음을이용하는것이편리하다. 합성음은프라트의기본메뉴가운데 Create sound from formula를이용하여 1 초분량의 44.1 khz로된표본속도의음성을다음공식을입력하여만들었다. 1/3*sin(2*pi*500*x)+1/5*sin(2*pi*1500*x)+1/7*sin(2*pi*2500*x)+1/9*sin(2*pi*3500*x)+ 1/11*sin(2*pi*4500*x) 위의공식은기본적으로 500 Hz, 1500 Hz, 2500 Hz, 3500 Hz, 4500 Hz으로된정현파를하나의소리로만든복합음으로 5 개의포먼트를가진모음과비슷한구조를보여준다. 합성음을사람의음성과비슷하게만들기위해고주파로갈수록진폭값이낮아지도록각항의분수값을점점낮추었다. 이합성음의확대한음성파형과스펙트로그램은 < 그림 1> 과같다. < 그림 2> 는합성음의스펙트럼을프라트로분석하여 5000 Hz까지확대하여보여준다.
42 음성과학제 15 권제 3 호 (2008. 9) 그림 1. 500 Hz 의홀수배음으로된 5 개의정현파로 만든합성음의음성파형과스펙트로그램 그림 2. 500 Hz의홀수배음으로된 5개의정현파로만든합성음의스펙트럼 2.2 실험자료실험자료는앞절에서제시한합성음제작방법을이용하여 10 명의남자가발음한국어모음 이, 에, 우, 오, 아 의평균포먼트값 (Yang, 1996:251, Table 3 참고 ) 을가지는소리를만들었다. 연구자가합성음을직접들어봤을때해당모음을듣는것같은청각적인인상을받았다. SenSyn, SpeechStation, SFS 등과같은기존의포먼트합성기를이용할때수많은변수값을제대로지정해야하고, 서로인접한포먼트값의상호충돌로인한잡음이많이생겨서음성분석기의성능을점검하는데이용하기가불편한점을감안하면이러한합성음은음성분석시스템점검을하는데편리할것으로생각된다.
복합음과대학생이발음한모음포먼트측정 43 2.3 포먼트측정및논의프라트의포먼트측정방식에는청각척도로변환하는것을제외하고는 To Formant(burg), To Formant(sl)... 과 To LPC(autocorrelation)... 의세가지방식으로나눌수있다. To Formant(burg) 의처리과정은먼저최대포먼트값의두배에해당하는표본추출속도로변경한뒤고주파대역강조를적용하고, 가우시안창을적용하여 LPC 계수를 Burg방식으로계산한다 (Press 외, 1992). 이알고리즘은 50 Hz이하에해당하는포먼트값은제거한다. To Formant(sl)... 메뉴는 Split-Levinson의처리방식으로되는데지정한주파수범위에강제로일정한개수의포먼트를찾아내도록처리해준다 (Willems, 1986). To LPC(autocorrelation)... 는자기상관방식으로처리한뒤선형예측계수를지정한시간간격마다구하여포먼트에해당하는정점값을차례로나타내주며, 실험자는선형예측계수를구하기위한차수를지정해야한다. 차수는보통포먼트갯수의두배가되도록지정한다. 차수가높을수록보다더많은포먼트값을보여주기때문에한개의포먼트가나타날위치에두개이상을구해주게된다 ( 양병곤, 2003). 차수가낮으면모음 우, 오 와같이두개의포먼트값이가까이접근한경우에하나의포먼트로처리하는오류가발생하기도한다. 이논문에서는기본형인 16차를분석설정으로하였다. 모든포먼트값은 1초의음성구간의중간점인 0.5초지점에서구했다. < 표 1> 은원래합성음에사용한포먼트주파수와합성음의포먼트를재분석한 burg방식, sl방식, 16차의선형예측계수로분석한 lpc방식으로구한포먼트값을보여주고있다. 원래의합성음에사용한포먼트값과구해진값의절대차이값을모두더했다. 전체적인차이합계는 27505 Hz에달한다. burg 방식의차이합을모두더하면 107 Hz이고, sl 방식의차이는 128 Hz이며, lpc방식에서 27270 Hz가나와서세가지방식중에서는 lpc방식에서차이가가장큼을알수있다. 물론 lpc 방식의차수를다르게지정하거나, sl방식에서포먼트갯수를원래예측값보다더작거나큰수를지정하면차이합계는훨씬더많아질것으로예상할수있다. 포먼트값에서는 F1에서 F3으로갈수록차이합계가증가하고있는데이값의주된원인은 lpc방식이주도하고있다. 실제 burg나 sl 방식에서는그반대로 F1에서는 75 85 Hz차이를보이고, F2에서는 13 44 Hz이나 F3은두가지방식모두 9 Hz의차이밖에나타나지않아반대경향을보여주고있다. 모음별로는전설모음 이, 에 가 5554 Hz의차이합계를보인반면후설모음 우, 오 에서는그것의세배인 16786 Hz 를보여후설모음에서 lpc 방식이전체적인변화량을보임을알수있다. 이는 lpc분석방식에서두개의포먼트가가까이있는경우에는두개의포먼트를한개로처리함으로써편차가많이나게된것으로추정된다. 이렇게포먼트분석값은분석방식과파라미터설정방법에따라항상달라질수있음을알수있다. 이연구에서는프라트의 burg방식을이용하여대학생들이발음한모음목록에서어느측정지점에서포먼트값의변화가가장많은지를살펴보고, 스펙트럼정보에서본포먼트측정값의정확성을확인하며실제포먼트위치를찾으려면어떻게해야할지조사해보고자한다.
44 음성과학제 15 권제 3 호 (2008. 9) 표 1. 합성음의포먼트값과프라트의기본포먼트분석방법 (burg, sl, lpc) 을이용한포먼트값과 절대차이합계 ( 단위 : Hz) 모음 분석방법 F1 F2 F3 차이합계 합성음 341 2219 3047 0 이 burg 342 2218 3044 5 sl 342 2218 3044 5 lpc 1915 3754 5473 5535 이차이합계 1576 1537 2432 5545 합성음 591 1849 2597 0 에 burg 591 1849 2599 2 sl 591 1849 2599 2 lpc 592 1850 2600 5 에차이합계 1 1 7 9 합성음 369 981 2565 0 우 burg 300 974 2566 77 sl 413 999 2566 63 lpc 1980 4631 7063 9759 우차이합계 1724 3675 4500 9899 합성음 453 945 2674 0 오 burg 466 944 2675 15 sl 481 965 2675 49 lpc 1823 3658 5414 6823 오차이합계 1411 2734 2742 6887 합성음 738 1372 2573 0 아 burg 740 1376 2575 8 sl 740 1377 2575 9 lpc 1120 3319 5392 5148 아차이합계 386 1956 2823 5165 이에차이합계 1577 1538 2439 5554 우오차이합계 3135 6409 7242 16786 전체합계 5098 9903 12504 27505 3. 대학생발화모음에대한포먼트측정 2.1 피험자와음성수집이연구에참여한피험자는대학교에재학중인남학생 10 명과여학생 10 명이다. 이들은조용한연구실에서삼성 DB-P73컴퓨터에 Sennheiser(PC151) 헤드셋마이크를연결하여자신의이름을말하고모음 아, 에, 우, 오, 이, 으 를보통속도로또렷하게발음한것을 GoldWave(v.
복합음과대학생이발음한모음포먼트측정 45 5.25) 를이용해 44.1 khz의표본속도로저장했다. 마지막발음 으 는분석에포함하지않고다만앞에오는모음 우 와동일하게발음한피험자를실험에서제외하는데사용했다. 2.2 자료분석방법자료분석은피험자가발음한모음다섯개 ( 아, 에, 우, 오, 이 ) 를 To Formant(burg) 의기본설정값으로주어진 5500 Hz까지 5 개의포먼트를찾는방식을이용해분석했다. 서론에서도살펴보았듯이측정지점에따라포먼트값이달라지기때문에, 이논문에서는 Yang(1996) 에서모음의전체지속시간의 1/3지점에해당하는값을구했던점을응용하여균일한간격의 7 개지점마다포먼트값 3 개 (F1, F2, F3) 씩을구했다. 구체적으로는다음의프라트스크립트를이용하여피험자의음성을불러온다음모음구간을마우스로선택하고, 선택된구간시작에서 30 ms, 끝에서 40 ms를제외한모음의전체지속시간을 6 등분한간격으로시작점을포함하여 7 개지점의포먼트값을구했다. 20 명의화자마다다섯개의모음을발음했고, 측정지점 7 개에서각각 3 개의포먼트값을구하여모두 2100 개의자료를구했다. clearinfo print Subject_1_ 이 'newline$' name$=selected$("sound") Edit editor Sound 'name$' pause 분석할모음구간을선택하세요... cursorstart=get start of selection cursorend=get end of selection Select... 'cursorstart'-0.03 'cursorend'+0.03 Extract sound selection (time from 0) Close endeditor Rename... vowel dur=get duration start=0.06 end='dur'-0.07 voweldur='end'-'start' step='voweldur'/6 To Formant (burg)... 0 5 5500 0.025 50 for i from 0 to 6 timer='start'+'i'*'step' f1=get mean... 1 timer timer+0.02 Hertz f2=get mean... 2 timer timer+0.02 Hertz f3=get mean... 3 timer timer+0.02 Hertz p='i'+1 print 'p''tab$''f1:0''tab$''f2:0''tab$''f3:0''newline$' endfor fappendinfo D:\result\formant.txt select Sound vowel plus Formant vowel Remove select Sound 'name$'
46 음성과학제 15 권제 3 호 (2008. 9) 선택구간의시작과끝부분을피한이유는사전연구로검토해본결과 25 ms로된포먼트분석창에묵음구간이포함되어측정값의편차가너무많았기때문이다. 덧붙여각측정지점에따른변화를줄이기위해 20 ms 구간을선택하여평균포먼트값을구했다. 7 개지점에서측정된포먼트값은마이크로소프트엑셀을이용하여 3 번째측정지점값을중심으로절대차이합계를구하여남녀, 모음, 측정위치등에따른변화정도를먼저분석하였다. 3 번째지점은모음구간의지속시간을 3 등분했을때앞의 1/3 부분해당한다. 참고로프라트의 To Pitch(ac)... 로구한남학생 10 명의평균피치값은 134.5 Hz이었고, 여학생의평균피치값은 226.8 Hz이었다. 남학생의피치값의범위는 111 Hz 153 Hz이었고, 여학생의범위는 201 Hz 254 Hz이었다. 남녀각각의피치의표준편차는 15.2 Hz와 15.9 Hz로거의비슷한집단을이루고있었다. 2.3 분석결과와논의 < 표 2> 는성별, 모음별, 포먼트별모음포먼트값의절대차이합계를보여준다. 표 2. 남 (m) 녀 (f), 모음별, 포먼트별모음포먼트값의절대차이합계의분포 ( 단위 : Hz) 모음 F1m F2m F3m 합계 (m) F1f F2f F3f 합계 (f) 이 690 2420 2983 6093 932 8122 8620 17674 에 1151 2354 2580 6085 1644 8101 12372 22117 오 2092 14434 5720 22246 1020 2050 5409 8479 우 3176 13984 9257 26417 2116 7983 5169 15268 아 2490 3506 3894 9890 2766 2911 12944 18621 합계 9599 36698 24434 70731 8478 29167 44514 82159 < 표 2> 에서보면남학생 10 명에서측정한절대차이합계는 70731 Hz인데비해여성화자 10 명의절대차이합계는 82159 Hz로서남성보다많다. 이는여성포먼트값이대체로높기때문에 3 번째지점값을중심으로절대차이합계가높아졌기때문으로추정된다. 모음별로는남성에서는모음 우 가가장높은값을차지하고있고모음 에 가가장적은차이합계를보였고, 여성에서는오히려모음 오 에서변화량이적고, 모음 에 에서가장높은절대차이합계를보였다. 이는포먼트갯수가 5 개로지정됨으로써여학생이발음한모음 오 를분석하는데는적절하지만, 남녀학생의모음 우 에서는더많은갯수로처리해야할것으로여겨진다. 포먼트별로보았을때, 남성에서는모음 오, 우 에서두개의포먼트를하나로측정하는오류가많아서 F3을 F2로측정하여차이합계가높아졌으며, 여성에서는 F1의 8478 Hz에비해 F2는 3 배이상, F3는 5 배이상의절대차이합계를보였다. 이는여성화자의 F3나 F4가매우낮은강도의포먼트대역을가지고있어서프라트에서 F4를 F3 값으로잘못추정한경우가많았기때문으로여겨진다.
복합음과대학생이발음한모음포먼트측정 47 표 3. 3 번째측정위치를기준으로본모음포먼트측정지점별절대차이합계의분포 ( 단위 : Hz) 측정위치 F1m F2m F3m 합계 (m) F1f F2f F3f 합계 (f) 1 1736 7375 4610 13721 1299 5037 5403 11739 2 1503 6977 3215 11695 1084 6080 6972 14136 3 0 0 0 0 0 0 0 0 4 938 4741 4375 10054 700 4192 7879 12771 5 1374 3682 2923 7979 1045 4073 6450 11568 6 1731 5401 4170 11302 1649 4714 8633 14996 7 2317 8522 5141 15980 2701 5071 9177 16949 < 표 3> 은포먼트측정지점별로구한절대차이합계를보여준다. 3 번째측정지점값을기준으로남학생들에서는 5 번째측정지점에서절대차이합계가 7979 Hz로낮고, 7 번째모음이끝나는지점가까이에서가장높은절대차이합계를보였다. 여학생에서는 5 번째측정지점에서가장낮은절대차이합계를보였고, 남학생들과같이 7 번째가장자리의측정값의절대차이합계가가장높았다. 이런차이는주로어디서발생하는것일까? 이문제의해답을찾기위해개별남녀학생들의분석자료를살펴보았다. 그림 3. 한남학생이발음한모음의포먼트분석결과 < 그림 3> 은 9079 Hz의절대차이합계를보인남학생이발음한모음의포먼트분석결과를보여준다. 이학생은모음 이 에서는 495 Hz의차이를보였고, 에 에서는 1180 Hz, 모음 우 에서는 4009 Hz, 모음 오 에서는 646 Hz, 모음 아 에서는 2749 Hz의절대차이합계를보였다. 그림에서보듯이모음 우 에서는처음과끝부분이매우변화가심한것을볼수있고, 끝부분의 F2 는실제 F3값임을알수있다. 아 에서도음성파형에작은진폭을보였던끝의세개지점에서변화가많음을알수있다. 실제포먼트의변화는성도의모양이바뀌는것을반영하는데, 그림의 우, 아 와같이혀의모양을반영하는 F2가갑작스레변하기는어렵기때문에측정오류로판단해야할것이다.
48 음성과학제 15 권제 3 호 (2008. 9) 그림 4. 한여학생이발음한모음의포먼트분석결과 < 그림 4> 는 10069 Hz의절대차이합계를보인여학생이발음한모음의포먼트분석결과를보여준다. 이학생은모음 이 에서 1677 Hz의차이를보였고, 에 에서는 6361 Hz, 모음 우 에서는 524 Hz, 모음 오 에서는 632 Hz, 모음 아 에서는 875 Hz의절대차이합계를보였다. < 그림 4> 에서모음 우, 오 는포먼트값이매우안정적으로측정되었음을알수있고, 모음 에 의 F2 값이측정지점 5 번과 6 번에서갑자기떨어지는모양을보이고있는데이는측정상의에러라고보아야할것이다. 이렇게연속적으로변하는포먼트궤적을보면갑작스런변화지점에서구한포먼트값이맞는지확인하는데도움이될것이다. 그림 5. 한남학생이발음한모음 오 의스펙트로그램과 포먼트궤적. 포먼트갯수를 5 개로지정했음. < 그림 5> 는모음 오 에서가장많은오류를보인남학생의스펙트로그램과포먼트궤적을보여준다. burg분석설정에서포먼트갯수를 5개로했기때문에 F1과 F2 모두가매우가까이접근하는모양을보여주고있다. < 그림 6> 은이학생의음성에대한분석설정에서포먼트갯수를 6개로바꾸어포먼트궤적을추적한그림이다. 스펙트로그램에나타난검은포먼트띠중심부로정확하게 F1과 F2가분리되어표시되었다.
복합음과대학생이발음한모음포먼트측정 49 그림 6. 한남학생이발음한모음 오 의펙트로그램과 포먼트궤적. 포먼트갯수를 6 개로지정했음. < 그림 7> 은모음 이 의 F2에서 5363 Hz로가장많은오류를보인여학생의스펙트로그램과포먼트궤적을보여준다. 이런지점은비록원래의음성에대해고주파증폭을하긴했지만, F5부분의스펙트럼에너지가너무낮고, 그림에표시된지점의강도값이상대적으로높기때문에 F2 값으로선택한것으로생각된다. 그래서 F2값이스펙트로그램상포먼트궤적이전혀없는데도불구하고오르내리는모양을보여준다. 그림 7. 한여학생이발음한모음 이 의스펙트로그램과 포먼트궤적. 포먼트갯수를 5 개로지정했음. 이여학생의포먼트분석설정에서포먼트갯수를 4개로바꾸면 < 그림 8> 과같이 F2값과 F3 값을제대로구해준다. 결국포먼트갯수는스펙트로그램의검은띠로나타난포먼트띠의갯수를화자마다확인하고적절하게조절해야만바른측정값을구할수있다.
50 음성과학제 15 권제 3 호 (2008. 9) 그림 8. 한여학생이발음한모음 이 의스펙트로그램과 포먼트궤적. 포먼트갯수를 4 개로지정했음. 지금까지두남녀학생의포먼트분석에서나타난오류의예와같이, 포먼트의적절한갯수를판단하기위해서는 < 그림 5> 와같이두개의포먼트가너무가까이근접하거나측정값들이변화량이심한경우또는 < 그림 7> 과같이스펙트로그램상포먼트가없는곳에나타난경우들을찾아분석설정을바꾸거나, 항상스펙트로그램을바탕에놓고측정값을확인할필요가있다. 앞으로프라트로모음을측정했을때개별화자들에대한분석오류의비율이얼마나많을지에대한연구가필요하고, 포먼트갯수설정을적절히하기위해화자별피치값이나포먼트값의범위등음향적특징을이용하는방법에대한연구가필요할것으로생각된다. 4. 맺음말 이연구에서는포먼트값측정상의문제점을검토해보기위해프라트의합성음생성기로모음과유사하게만든합성음을프라트의세가지포먼트분석방식을적용하여측정하고원래의값과의절대적인차이값을구하여어떤문제점이있는지살펴보고, 20 명의대학생남녀학생들이발음한모음의포먼트값을 burg방식으로분석하여, 전체지속시간의 1/3 지점을기준으로모음구간앞, 뒤의 7 개측정지점에서구한포먼트값과의절대차이합을계산해변화량을측정하였고, 조음동작으로생각할수없는포먼트측정상의오류를수정하기위해서는어떻게해야할지살펴보았다. 그결과는다음과같다. 첫째, 합성음의포먼트분석에서프라트의 burg 방식에서가장적은측정에러가나왔다. sl방식이나 l pc방식에서는인접한포먼트를가지는모음이나포먼트갯수에따른오류가크게나타났는데, 프라트에서제공하는이두가지방식을이용하여포먼트분석을할때는주의가필요함을알수있었다. 둘째, 20 명이발음한다섯개모음의절대차이합계를구해본결과포먼트값이대체로높게나타나는여성에게서높은변화량을보였다. 모음가운데서도남학생과여학생모두의모음 우,
복합음과대학생이발음한모음포먼트측정 51 오 에서높은변화량을보였고, 주된원인으로는두개의포먼트를하나로추정하는오류나, F4 를 F3으로추정한경우였다. 셋째, 남여화자마다적절한포먼트갯수를지정해야만정확한포먼트를구할수있음을알수있었다. 개인별자료를살펴본결과남학생이발음한모음 오 에서는포먼트갯수를더많이지정했을때 F1과 F2를바르게측정해주었으며, 여학생이발음한모음 이 에서는오히려포먼트갯수를더적게지정했을때 F2의에러를줄일수있었다. 포먼트갯수는개인별로스펙트로그램에서볼수있는검은띠의중심선으로제대로추정되었는지, 또주위의값에비해갑작스런포먼트변화가일어나지않았는지를통해확인할필요가있다. 이러한결과들은모음포먼트측정을할때음성분석소프트웨어에서구해진값이정확한지반드시검토해야한다는결론을내릴수있다. 가능하면잘못된측정값에근거를두고일반화를하는오류를피해야할것이다. 앞으로이렇게측정된포먼트값을합성하여원음과어떤부분에서청각적으로차이가나는지또적절한포먼트갯수를화자의음향적특징에따라지정하는방안을연구해볼필요가있다. 참고문헌 강석한역. 2007. 음향음성분석론. 서울 : Thomson Learning Korea, 박학사. 양병곤. 2003. 프라트 (Praat) 를이용한음성분석의이론과실제. 부산 : 만수출판사. Edward, H. 2003. (3rd ed.) Applied phonetics: The sounds of American English. New York: Delmar Learning. Fulop, S. 2007. What's wrong with these formants?. J. Acoust. Soc. Am. 121, 3099. Kent, R. & Read, C. 2002. (2nd ed.) Acoustic analysis of speech. San Diego, CA: Singular Publishing Group. Lindblom, B. 1963. Spectrographic study of vowel reduction. J. Acoust. Soc. Am. 35, 1773-1781. Olive, J.P., Greenwood, A. & Coleman, J. 1993. Acoustics of American English speech: A 요 namic approach. New York: Springer-Verlag. Peterson, G. & Barney, H. 1952. Control methods used in a study of vowels. J. Acoust. Soc. Am. 24, 175-184. Picket, J. 1987. The sounds of speech communication: a primer of acoustic phonetics and speech perception. Austin, Texas: pro-ed. Press, W., Teukolsky, S., Vetterling, W. & Flannery, B. 1992. Numerical recipes in C: the art of scientific computing. Cambridge, MA: Cambridge University Press. Stevens, K. 1998. Acoustic phonetics. Cambridge, MA: The MIT Press. Willems, L. 1986. Robust formant analysis. IPO report 529, 1-25. Eindhoven. Institute for Perception Research. Yang, B. 2002. An acoustical study of English word stress produced by Americans and Koreans. Speech Sciences 9(1), 77-88.
52 음성과학제 15 권제 3 호 (2008. 9) 접수일자 : 2008. 7. 24 수정일자 : 2008. 8. 26 게재결정 : 2008. 9. 10 양병곤 부산광역시금정구장전동산 30 ( 우 : 609-735) 부산대학교사범대영어교육과교수 H.P.: 010-9618-7636 E-mail: bgyang@pusan.ac.kr Website: http://fonetiks.info/bgyang