제 5 회세계한국학대회 한국어구어의억양단위와발화경계의상관에관한고찰 서상규 ( 연세대학교국어국문학과교수 ) 백해파 ( 연세대학교대학원박사과정 ) 1. 서론 문어에서문장에대한정의는논란의여지가있지만문장의경계는대체적으로확립되어있는데비해, 문어의 문장 에대응하는구어에서의통사적단위는아직명시적인기준이확립되지않고있다. 발표자가 21 세기세종계획 의일환으로대량으로구축해온한국어구어 ( 전사 ) 말뭉치에서는발화에서 억양이바뀌기이전까지를하나의연속된발화단위로 보아, 그기본단위를설정한바있다. 이때의기본단위는이른바 억양단위 를기준으로하고있다고할수있다. 그런데이기준은문법연구에서통사적구조를규명하거나특정어휘의용법을연구하는데에는적합하지못한여러가지문제점이드러나고있으며, 최근이에대한연구들이발표되고있다한국어문법에서문장은문어에서의문장으로서 우리말본 (1937) 에서의정의를대체적으로따르고있다. 우리말본 에서는문장 ( 월 ) 에대한정의를아래와같이하고있다. 월갈에서월 ( 文 ) 이란것은한통일된말로들어낸것이니 : 뜻으로나꼴 ( 形式 ) 로나온전히다른것과따로선 ( 獨立한 ) 것이니라. 즉, 월이되기위해서는낱말이모여서그속에통일된생각이들어있어야된다는것과다만하나의끝남을소용한따로섬이있어야한다는것이다. 문장의이런정의에서전자는 의미적완결성 으로후자는 형식적자립성 으로정의할수있는바문어에서의문장은서술어를중심으로 의미적완결성 을이루는단어들로이루어지며종결어미로종결된다. 문어에서문장은마침표나, 느낌표, 물음표와같은문장부호로그경계를확인하기어렵지않지만구어에서는문장부호나종결어미와같은형식적인특징에의하여문장의경계를확인하기어렵다. 전영옥 (1993) 의연구결과는이런사실을입증할수있는데이논문에의하면한국어에서의발화는비어말어미의실현이 65.5% 로서어말어미 (34.5%) 보다더많이실현된다고하였다. 따라서이연구에서사용한 21 세기세종계획 의구어말뭉치는 억양단위 를기본단위로하여구축되어있다. 그러나이런 억양단위 는 의미적완결성 을이루고있다고할수없다. 비록서은아, 남길임, 서상규 (2004) 에서제기한 문장을구성하는여러성분가운데한성분으로문장을끝맺지만의사소통에는전혀지장을주지않는구어의문장 인 조각문 은독립적으로볼때 의미적완결성 이없다고할수없지만많은발화상황에서는 의미적완결성 이있다고볼수없는발화가많다. 예를들어 : 1. <P2_M30s>: 근데이호선으로딱넘어가면은, 2. <P2_M30s>: 운이좋아야지앉아갈수있지.
위발화에서발화 1 과발화 2 는 P2 라는한사람이한말로서 약한상승이나하락억양, 에의하여두개의발화로나뉘어져있다. 그러나 P2 는두가지의미를담아발화한것으로보이지않는다. 한가지의미를표현함에있어서하나의 억양 에의하여두개의발화로나누어진것이다. 이런발화를하나의단위로묶어놓지않으면문법연구에어려운점이많다. 따라서이연구는이런 억양단위 들이 의미적완결성 에의하여하나의단위로묶이는데어떤특징이있는지를살펴보고이렇게묶인 문장 에서 억양단위 들사이의관계를고찰하여 억양단위 와 문장 과의상관관계에대하여살펴보고자한다. 제 2 장에서는대화 ( 사적 / 공적 ) 와독백 ( 사적 / 공적 ) 에서 억양단위 로나누어진발화들이한단위로묶일때의특징에대하여살펴보고제 3 장에서는이렇게묶여진 문장 에서 억양단위 특징에대하여살펴보기로한다. 2. 말뭉치의재주석 이연구에서는 21세기세종계획 에서배포한구어말뭉치에서대화 ( 사적 / 공적 ) 와 독백 ( 사적 / 공적 ) 의 4개의샘플에대하여분석하였다. 그말뭉치의구성을보이면아 래와같다. 파일명 어절수 발화수 " 문장 " 수 사적대화 5CT_0013 3,730 1,069 876 공적대화 4CT_0001 5,063 1,322 875 사적독백 6CT_0010 2,435 493 333 공적독백 5CT_0046 3,783 529 197 총계 15,011 3,413 2,281 2.1. 말뭉치의재주석과정 < 표 1>: 말뭉치의구성 21 세기세종계획 의구어말뭉치에서발화는 차례맡기 와 억양단위 에따라나누고있다. 차례맡기 는발화자의발화순서에따라 <u> 태그로묶어주고있고, 억양단위 는 <s> 태그로묶어주고있다. <u who=p2><s n=00057> 그아저씨가딱내리고나면,</s> <s n=00058> 자리가많이비잖아,</s></u> <u who=p1><s n=00059> 어.</s></u> <u who=p2><s n=00060> 거기딱앉아서편안하게가는거야,</s></u> <u who=p1><s n=00061> 그렇구나,</s></u> <u who=p2><s n=00062> 나만의로하우야.</s> <s n=00063> 근데어쩌다가실패하는경우가있어.</s> <s n=00064> 어쩌다실패하면학생인데안내리고끝까지가는거야이게,</s></u> <u who=p1><s n=00065><vocal desc=' 웃음 '></s></u> < 표 2>: 말뭉치의예 이런말뭉치를 Python 스크립트언어를사용하여프로그램을만들어재주석에용이한형태로변환하여엑셀에서작업하였다.
< 그림 >: 말뭉치의재주석과정 그림 1 에서보면 B 열은발화자의정보이고 C 열은 역양단위 에의한발화의일련번호이고 D 열은 문장 의일련번호인데작업은의미적으로연결성을가지는발화들은같은일련번호를부여하는방식으로진행하였다 ( 그림 1 의네모상자를참조 ). 이렇게만들어진말뭉치는또프로그램을만들어서말뭉치의 <s> 태그에 GR 속성을추가하여일련번호를부여하는것으로재주석작업을진행하였다. 그결과를보이면아래의표 3 과같다. <u who="p1_f30s"><s n="00135" GR="00108"> 사람이딱일어났는데,</s></u> <u who="p2_m30s"><s n="00136" GR="00110"> 음.</s></u> <u who="p1_f30s"><s n="00137" GR="00108"> 나그옆에아가씨가한명서있었고,</s> <s n="00138" GR="00108"> 내가서있었고, </s> <s n="00139" GR="00108"> 내오른쪽에아줌마가서있었거던? </s></u> < 표 3>: 말뭉치재주석결과 이런처리과정을거친말뭉치는 GR 속성의일련번호를통하여특정어휘가쓰인 문장 을추출하여문법연구에사용할수있다. 2.2. 억양단위 가 문장 으로묶이는경우 이절에서는위의 2.1 에서재주석과정에서발화가 문장 으로묶이는데나타나는현상을살펴보기로한다. 발화가 문장 으로묶는것은크게발화중에다른발화자가끼어들어 발화 가나누어진경우와발화중억양이바뀌면서 발화 가나누어진경우가있다. 먼저발화중에다른발화자가끼어든경우를살펴보면, 발화중에다른발화자가웃거나, 간투사를발하는경우이다. 예 1:
1.1 <P1_F30s>: 그래서, 2.2 <P2_M30s>: 음. 3.1 <P1_F30s>: 거기애들내리고나면자리가생기는데, 4.3 <P2_M30s>: 음. 5.1 <P1_F30s>: 그래도막이렇게굳이막앉을려고노력을안하니까별로앉는일은없는것같애, 예 2: 1.1 <P1_F50s>: 뭐 ~ 순간순간으루미운사람은있어두, 2.2 <P3_F50s>: <vocal desc=' 웃음 '> 3.1 <P1_F50s>: 한한시간두시간지나믄, 4.1 <P1_F50s>: 그냥잊어버리거든요? 위의예 1 은 P1 이말하고있는과정에 P2 가연속적으로간투사 음. 을발하는예이고, 예 2 는 P1 이말하는과정에 P3 이웃음으로서발화가나누어진경우이다. 이런경우는대화에서많이생기는현상으로서독백에서는거의나타나지않는다. 또발화중에다른발화자가미리짐작하고끼어들어먼저말하는경우가있다. 예 3: 1.1 <P2_M30s>: 그러면나는, 2.2 <P1_F30s>: 눈치를보면서, 3.1 <P2_M30s>: 어눈치를보면서인제 ~ 탈려고그래, 위예 3 에서 P1 은 P2 의말할내용을미리짐작하고끼어들어먼저발화하고 P2 는계속해서발화를마치는경우이다. 그러나발화자가발화중에다른발화자의질문을받아먼저간단하게답하고계속원래발화를계속하는경우에는서로다른문장으로하였다. 예 4: 1.1 <P1_F20s>: 그래서, 2.1 <P1_F20s>: 너무당황스러워서 3.2 <P2_F30s>: 너네학교가어딘데? 4.3 <P1_F20s>: 동덕여대요. 5.4 <P1_F20s>: 그랬는데, 6.4 <P1_F20s>: 그얘기를딱듣고난다음에, 7.4 <P1_F20s>: 너무황당해서, 8.4 <P1_F20s>: 내가대뭐라고말을해야되나, 9.4 <P1_F20s>: 이럴때내가뭐라고말을해야되나, 10.4 <P1_F20s>: 나정말아무생각이안스치드라구요, 위예 4 에서와같이 P1 은발화중에 P2 의질문을받아그질문에답하고계속하여원래발화를계속하는경우인데이런경우에는두 문장 으로처리하였다. 다음, 발화중에억양이바뀌어 억양단위 로나누어진경우를살펴보면, 일반적으로앞발화가연결어미로끝나는경우가많다. 예 5: 1.1 <P2_M30s>: 아니면은이건정말잘골라야되는데, 2.1 <P2_M30s>: 한번도박을하는거야. 예 6:
1.1 <P1_F30s>: 그담에또 :: 번개치며달리는물이기도쉽고, 2.1 <P1_F30s>: 바다를메꾸고, 3.1 <P1_F30s>: 그담에강을메꾸고, 4.1 <P1_F30s>: 그담에또남으면우물이되고, 5.1 <P1_F30s>: 그래도남으면, 6.1 <P1_F30s>: 뭐가돼요, 또한, 질문을반복하여질문하는경우가있는데일반적으로두번째발화는첫번째발화에서특정내용을반복하여강조하여질문한다. 이런경우는하나의문장으로하였다. 예 7: 1.1 <P2_M40s>: 그런얘기많이하시지않아요? 2.1 <P2_M40s>: 주주변분들이? 예 8: 1.1 <P1_F30s>: 근데어떻게토할수가있어? 2.1 <P1_F30s>: 버스 <phon> 뻐스 </phon> 에서? 그러나한발화자의발화에질문이연속하여나오는경우에도아래와같은경우도있다. 예 9: 1.1 <P1_F30s>: 아니커서, 2.2 <P2_M30s>: 최근에? 3.3 <P2_M30s>: 그래? 예 9 에서 P2 는연속하여두개의질문을하는데발화 2 와발화 3 사이에 P1 이 머리끄덕임 과같은비언어적인제스처를취한것으로보인다. 이런경우에는두개의문장으로처리하였다. 또한아래와같은예문들도하나의문장으로처리하였다. 예 10: 1.1 <P3_F50s>: 지금두가수한것, 2.1 <P3_F50s>: <vocal desc=' 들이마시는숨, 스 '> 3.1 <P3_F50s>: 참잘했다그래요. 예 11: 1.1 <P1_F50s>: 제아주직계선배십니다, 2.1 <P1_F50s>: 중고등학교대학교, 예 12: 1.1 <P1_F20s>: 그래서그냥그렇게얘기하는게, 2.1 <P1_F20s>: 조금 :: 뭐라고해야되지, 3.1 <P1_F20s>: 위선은아닌데위선이라고해야되나, 4.1 <P1_F20s>: 아니면가진자들이부리는뭐 :: 라고해야되나, 5.1 <P1_F20s>: 그냥정확하게딱용어는모르겠는데, 6.1 <P1_F20s>: 좀그런생각이들었어요. 예 13: 1.1 <P1_F50s>: 그리고,
2.1 <P1_F50s>: 저희고등학교일학년때? 3.1 <P1_F50s>: 어 ~ 고등학교삼학녀아니야, 4.1 <P1_F50s>: 중학교삼학년때고등학교삼학년이셨어요. 예 14: 1.1 <P2_M40s>: 예. 2.1 <P2_M40s>: 그렇게열심히그 ~ 가수활동도인제하시구요또, 3.1 <P2_M40s>: <vocal desc=' 목청가다듬는소리 '> 4.1 <P2_M40s>: 죄송합니다. 5.1 <P2_M40s>: 프로그램, 6.1 <P2_M40s>: 열심히진행하셔가지고최근에뭐 ~ 큰상도받으셨다구요. 예 10 은발화중에비언어적요소가개입되면서발화가끊긴경우이고, 예 11 은소위말하는도치문의경우이고, 예 12~14 는발화중에다른문장이삽입된경우인데예 12 는다음에말할단어가생각나지않아서더듬으면서말하는경우이고, 예 13 은앞에말한말의내용을고쳐서다시얘기하는경우이고, 예 14 는발화과정이매끄럽지않아사과하고계속하여말하는경우이다. 이상의경우의발화는모두하나의문장으로묶었다. 이상구어말뭉치재주석작업에서 의미적완결성 을고려할때 억양단위 가 문장 으로묶이는경우에대하여살펴보았다. 아래 3 장에서는이렇게주석된말뭉치에서 문장 에포함된 억양단위 의특징에대하여살펴보기로한다. 3. 억양단위 과 문장 3.1. 문장 에포함된 억양단위 먼저, 제 2 장에서재주석을거친말뭉치에서 문장 에포함된 억양단위 의개수를살펴보면아래의표 4 와같다. 공적대화 사적대화 공적독백 사적독백 총계 빈도 정유율 빈도 점유율 빈도 점유율 빈도 점유율 빈도 점유율 s1 620 70.8% 733 83.7% 225 67.6% 74 38% 1652 72.4% s2 159 18.2% 107 12.2% 73 21.9% 38 19% 377 16.5% s3 52 5.9% 25 2.9% 25 7.5% 33 17% 135 5.9% s4 22 2.5% 8 0.9% 5 1.5% 16 8% 51 2.2% s5 8 0.9% 3 0.3% 3 0.9% 17 9% 31 1.4% s6 8 0.9% 0 0.0% 2 0.6% 9 5% 19 0.8% s7 4 0.5% 0 0.0% 0 0.0% 4 2% 8 0.4% s8 3 0.3% 0 0.0% 0 0.0% 2 1% 5 0.2% s9 0 0.0% 0 0.0% 0 0.0% 1 1% 1 0.0% s10 0 0.0% 0 0.0% 0 0.0% 1 1% 1 0.0% s11 0 0.0% 0 0.0% 0 0.0% 1 1% 1 0.0% 총계 876 100% 876 100.0% 333 100.0% 196 100% 2281 100.0% < 표 4>: 문장 에포함된 억양단위 의개수의빈도표 위표 4 를보면 억양단위 를 1 개만포함한 문장 이대부분을차지한다. 장르별로보면 대화 에서 1 개의 억양단위 를포함한 문장은 70% 이상을차지하고 독백 에서는 공적독백 인경우에는 67.6% 를차지하지만 사적독백 은 38% 밖에차
지하지않는다. 남길임 (2007) 에서는 억양단위 와통사단위와의관련성에대하여살펴본결과 억양단위 의통사적층위는절이상이 82.5% 를차지한다는결론을제기하였다. 남길임 (2007) 에서사용한말뭉치는 공적독백 에속하는 강의전사말뭉치 를사용한결과로서 대화 와 공적독백 의결과와비슷한결과를보인다. 대화 에서는 차례맡기 에따라자기의차례에가급적하나의 억양단위 에 완결된의미 를전달하려고하는노력에서 억양단위 가바로 문장 으로되는경우가많이나타나는것같다. 독백에서는 공적독백 은발화자가강연을하는동안거의끼어들지않아 억양단위 가바로 문장 으로되는경우가많은반면 사적독백 은발화자가자신의경험담을이야기하는동안청자는수시로간투사를연발하여여러개의 억양단위 가하나의 문장 으로되는경우가많이나타나는것같다. 하나의 억양단위 로이루어진 문장 의특징을살펴보면, 하나의어절로된것은 724 번으로 44% 차지하고둘이상의어절로된것은 928 번으로 56% 를차지한다. 한어절로된것은아래와같은것들이다. 그중 <vocal> 는 웃음 과같이비언어적인요소를가리킨다. 음 (182), <vocal>(112), 어 (90), 예 (52), 네 (46), 응 (27), 그래 (26), 아 (14)... 이외에둘이상의어절로이루어진 문장 은아래와같은문형들이많이쓰인다. 동사문 (157), 형용사문 (82), 기타 (58), 동사문 + 동사문 (52), 동사 + 보조용언문 (35), 지정사 ( 긍정 ) 문 (33), 동사문 + 형용사문 (24), 형용사문 + 동사문 (18), 동사 + 지정사 ( 긍정 ) 문 (16), 명사 + 동사파생접미사문 (16), 형용사 + 지정사 ( 긍정 ) 문 (14), 동사문 + 동사문 + 동사문 (12), 명사 + 동사파생접미사문 + 동사문 (10), 형용사 + 보조용언문 (10) 예 : [ 동사문 ] 1. P1_F50s: 확실히는몰라요. <4CT_0001_GR:00343> 2. P2_M30s: 갑자기넓어지는군. <5CT_0013_GR:00705> 3. P1_F30s: 김윤정어딨어요? <5CT_0046_GR:00279> 4. P1_F20s: 그냥알고지내라고. <6CT_0010_GR:00058> [ 형용사문 ] 5. P2_M40s: 실천이어렵다구요? <4CT_0001_GR:00016> 6. P2_M30s: 저런황망스러웠겠구나, <5CT_0013_GR:00360> 7. P1_F20s: 나정말바쁘다. <6CT_0010_GR:00159> 8. P2_M40s: 저저는참기분이묘해요. <4CT_0001_GR:00041> [ 동사문 + 동사문 ] 9. P3_F50s: 일본에서발매되고그다음에엘레이로가고. <4CT_0001_GR:00582> 10. P2_M30s: 나는이제신문을볼려고노력을해. <5CT_0013_GR:00062> [ 동사 + 보조용언 ] 11. P1_F30s: 이런말들어보셨어요? <5CT_0046_GR:00052> 12. P2_M30s: 그러다가요행히자리를차지하고앉어. <5CT_0013_GR:00069> [ 지정사 ( 긍정 ) 문 ] 13. P1_F30s: 그게이젠정해진코스지, <5CT_0013_GR:00495> 14. P2_M40s: 어저딸만둘이에요. <4CT_0001_GR:00527>
[ 기타 ] 15. P2_M30s: 음역시아줌마, <5CT_0013_GR:00111> 16. P2_M40s: 요즘요즘신세대분들이 <4CT_0001_GR:00213> 둘이상의 억양단위 를포함하는 문장 이쓰이는예는아래와같다. [ 부사 + 절 ] 17. P1_F50s: 그런데, @ 그때대대장을하셨어요. <4CT_0001_GR:00118> 18. P1_F20s: 그래서, @ 너무당황스러워서 <6CT_0010_GR:00165> [ 간투사 + 절 ] 19. P2_M40s: 네, @ 만우절이지요? <4CT_0001_GR:00051> 20. P1_F30s: 어, @ 들켰어? <5CT_0013_GR:00077> [ 절 + 절 ] 21. P1_F50s: 마음예쁘고, @ 얼굴예쁘고. <4CT_0001_GR:00571> 22. P1_F30s: 계속자? @ 앉아서? <5CT_0013_GR:00061> [ 절 + 보충어 ] 23. P2_M40s: 그런얘기많이하시지않아요? @ 주주변분들이? <4CT_0001_GR:00064> 24. P1_F30s: 너무안타까워. @ 학원에서특히, <5CT_0013_GR:00254> [ 인용문 + 절 ] 25. P2_M30s: 아그래? @ 하는사람이있단얘기네, <5CT_0013_GR:00751> 26. P1_F20s: 너삐졌지? @ 그러는거예요 ::. <6CT_0010_GR:00039> 3.2. 문장 에서동사의쓰임 위 2 장에서재주석을한말뭉치에출현한 359 개의동사의전체빈도는 2,686 번으로전체 ( 형태소전체 : 10,158) 의약 8.91% 를차지하였다. 그중출현빈도가 10 이상인 40 개동사의전체빈도는 1,982 로서전체동사출현빈도의 73.8% 를차지한다. 그동사의목록을보이면아래와같다. 하다 (505), 되다 (194), 가다 (136), 그러다 (132), 보다 (115), 알다 (60), 만나다 (55), 쓰다 (53), 오다 (49), 나오다 (45), 모르다 (44), 들다 (43), 가지다 (40), 나다 (40), 타다 (37), 읽다 (37), 먹다 (33), 듣다 (32), 맞다 (26), 앉다 (25), 들어가다 (22), 내리다 (20), 살다 (20), 주다 (17), 찾다 (17), 받다 (17), 다니다 (15), 대하다 (15), 서다 (14), 뛰다 (14), 관하다 (13), 이러다 (12), 만들다 (12), 생기다 (12), 내다 (11), 보이다 (10), 떨어지다 (10), 넘다 (10), 지나다 (10), 벌다 (10) 이상의동사를 연세한국어사전 에서제시한격틀정보를참조하여사용된갈래뜻에따라필수로하는논항의출현여부에근거하여격틀정보에서필수로하는논항의수에따라 3 자리동사, 2 자리동사, 1 자리동사로나누었다. 아래에각유형의동사들의논항의실현양상을보이면아래의표 5~7 과같다. 동사 전체빈도 3자리동사빈비율 NP1 비율 NP2 비율 NP3 비율 도 받다 17 17 100.0% 3 17.6% 15 88.2% 2 11.8% 주다 17 17 100.0% 5 29.4% 13 76.5% 8 47.1% 만들다 12 9 75.0% 3 33.3% 9 100.0% 9 100.0%
보이다 10 3 30.0% 1 33.3% 3 100.0% 0 0.0% 듣다 32 3 9.4% 1 33.3% 3 100.0% 3 100.0% 내다 11 1 9.1% 0 0.0% 1 100.0% 1 100.0% 하다 505 1 0.2% 0 0.0% 1 100.0% 1 100.0% < 표5>: 3자리동사의쓰임 동사 전체빈도 2자리동사비율빈도 NP1 비율 NP2 비율 하다 505 504 99.8% 114 22.6% 407 80.8% 가다 136 129 94.9% 23 17.8% 72 55.8% 보다 115 97 84.3% 21 21.6% 74 76.3% 알다 60 60 100.0% 21 35.0% 48 80.0% 쓰다 53 53 100.0% 18 34.0% 45 84.9% 만나다 55 52 94.5% 8 15.4% 16 30.8% 모르다 44 44 100.0% 14 31.8% 30 68.2% 나오다 45 42 93.3% 25 59.5% 18 42.9% 들다 43 42 97.7% 5 11.9% 42 100.0% 가지다 40 40 100.0% 21 52.5% 38 95.0% 읽다 37 37 100.0% 7 18.9% 21 56.8% 타다 37 36 97.3% 5 13.9% 30 83.3% 먹다 33 33 100.0% 2 6.1% 29 87.9% 듣다 32 29 90.6% 7 24.1% 22 75.9% 오다 49 29 59.2% 4 13.8% 19 65.5% 들어가다 22 22 100.0% 7 31.8% 14 63.6% 찾다 17 17 100.0% 4 23.5% 13 76.5% 맞다 26 13 50.0% 2 15.4% 13 100.0% 내다 11 10 90.9% 4 40.0% 10 100.0% 벌다 10 10 100.0% 2 20.0% 9 90.0% 서다 14 10 71.4% 6 60.0% 9 90.0% 내리다 20 9 45.0% 5 55.6% 7 77.8% 다니다 15 8 53.3% 5 62.5% 7 87.5% 넘다 10 6 60.0% 2 33.3% 4 66.7% 생기다 12 6 50.0% 2 33.3% 4 66.7% 떨어지다 10 5 50.0% 1 20.0% 2 40.0% 앉다 25 4 16.0% 0 0.0% 4 100.0% 되다 194 2 1.0% 1 50.0% 2 100.0% 만들다 12 2 16.7% 0 0.0% 2 100.0% 살다 20 2 10.0% 0 0.0% 2 100.0% 뛰다 14 1 7.1% 0 0.0% 1 100.0% 보이다 10 1 10.0% 0 0.0% 1 100.0% < 표6>: 2자리동사의쓰임 동사 전체빈도 1자리동사빈도비율 NP1 비율 되다 194 76 39.2% 76 100.0% 가다 136 7 5.1% 2 28.6% 보다 115 1 0.9% 1 100.0% 만나다 55 3 5.5% 3 100.0% 오다 49 20 40.8% 10 50.0% 나오다 45 3 6.7% 3 100.0% 나다 40 40 100.0% 40 100.0% 타다 37 1 2.7% 0 0.0% 맞다 26 13 50.0% 3 23.1%
앉다 25 21 84.0% 5 23.8% 내리다 20 11 55.0% 5 45.5% 살다 20 18 90.0% 7 38.9% 다니다 15 7 46.7% 5 71.4% 뛰다 14 13 92.9% 3 23.1% 서다 14 4 28.6% 1 25.0% 생기다 12 6 50.0% 6 100.0% 넘다 10 4 40.0% 4 100.0% 떨어지다 10 5 50.0% 1 20.0% 보이다 10 6 60.0% 5 83.3% 지나다 10 10 100.0% 10 100.0% < 표7>: 1자리동사의쓰임 위표 5~7 에서볼수있듯이동사들의논항의실현은매우높게나타난다. 3 자리동사, 2 자리동사의목적어 (NP2) 의실현은몇개의동사외에는 80% 이상으로실현되었고 1 자리동사의주어 (NP1) 의실현빈도가일부동사에서매우높게나타났다. 이런사실은타동사의경우목적어로쓰이는명사의종류에따라동사의의미분석도가능하기때문에구어말뭉치에서동사의의미주석작업도가능할것으로예상된다. 4. 결론 이상이논문에서는기존의 억양단위 를기본단위로하여구축된 21 세기세종계획 의 구어형태소분석말뭉치 가문법연구에적합하지않다는판단하에 의미적완결성 을기준으로구어에서 문장 이라는단위를설정하여말뭉치의재주석을진행하고, 이렇게 문장 으로묶여진 억양단위 들의특징을살펴보았으며마지막으로이런 문장 을단위로동사의쓰임을논항의실현여부에대한검토를통하여살펴보았다. 결과대화 ( 공적 / 사적 ) 와 공적독백 의경우 80% 이상이 억양단위 와 문장 이일치하다는것을확인하였고 사적독백 의경우여러개의 억양단위 가 문장 으로되는경우도많다는것을확인하였다. 또한구어에서동사가쓰일때그논항의실현정도가매우높게나타난다는것을확인하였고구어말뭉치에서동사의의미주석작업의가능을확인하였다. 시간적인제한으로둘이상의 억양단위 가 문장 으로될때 억양단위 들사이의관계를구체적으로확인하지못하였다. 이는앞으로의과제로남기기로한다. 참고문헌강상호, 1989, 조선어입말체연구,, 평양 : 사회과학출판사구현정, 2000, 입말뭉치구성과구어의특징, 21 세기세종계획특수자료구축분과전문가초청특강발표요지, 연세대언어정보개발연구원. 권재일, 2004, 구어한국어의의향법실현방법,, 서울대출판부김미형, 2004, 한국어구어와문어의특징연구, 한말연구 15, 한말연구학회김순자ㆍ장경희, 2005, 구어자료의정보화 : 화행주석방법연구, 한국언어문화 28, 한국언어문학학회김정자, 1999, 잡지기사의구어성분석 - 10 대후반에서 20 대초반의독자를대상으로한잡지를중심으로, 텍스트언어학 7, 한국텍스트언어학회김흥규외, 1998, 21 세기세종계획국어기초자료구축 ( 한국어입말뭉치의구축방법 ),, 국
립국어원남길임, 2007, 구어억양단위의통사적상관성연구 - 구어독백말뭉치를중심으로 -, 어문학 96 집, 한국어문학회노대규, 1996, 한국어의입말과글말,, 국학자료원박동근, 2005, 구어음운전사말뭉치구축의필요성과방법, 겨레어문학 35, 겨레어문학회서상규외, 2006, 21 세기세종계획국어특수자료구축,, 국립국어원서상규ㆍ구현정, 2002, 한국어구어연구 (1) - 구어전사말뭉치와그활용 -,, 연세대언어정보개발연구원서상규ㆍ구현정, 2005, 한국어구어연구 (2) - 대학생대화말뭉치를중심으로 -,, 한국문화사서상규ㆍ구현정, 2005, 코퍼스에반영된구어와문어, 한국언어학회 2005 년겨울학술발표대회자료집, 한국언어학회서상규ㆍ김형정, 2005, 구어말뭉치설계의몇가지조건, < 언어정보와사전편찬 > 제 14~16 합집, 연세대언어정보연구원성연숙, 2005, 한국어구어의특징 -TV 토론방송대본과의비교를중심으로 -, 제 34 차한국어학회전국학술대회논문집, 한국어학회안의정, 1998, 한국어입말뭉치전사방법연구,, 연세대학교대학원안의정, 2008, 말뭉치를이용한어휘의구어성측정과활용, 어문논집 57, 민족어문학회안정오, 1997, 언어의문어성과구어성, 인문대논문집 16, 고려대학교이진희, 2003, 언어의구어성과문어성에관한연구, 독일문학 85, 한국독어독문학회임성규, 1989, 글말과입말의문체분석, 국어국문학 102, 국어국문학회장경현, 2003, 문어 / 문어체ㆍ구어 / 구어체재정립을위한시론, 한국어의미학 13 호, 한국어의미학회장경희, 2009, 구어연구의현황과전망, 한국어학 vol. 45, 한국어학회장소원, 1995, 국어학에서의구어성, 한일어학논총, 남학이종철선생회갑기념논총간행위원회전영옥, 1993, 한국어발화단위종결방식의화용론적분석,, 상명대학교전영옥, 1997, 담화분석 (1) : 발표요지와실제발표의상관관계, 담화인지언어학회제 3 회학술대회논문집, 전영옥, 2003, 한국어억양단위연구, 담화와인지 10-1, 담화인지언어학회전영옥, 2006, 구어의단위연구, 한말연구 19, 한말연구학회최명식, 1988, 조선말구두어문법,, 료녕민족출판사최명식, 1985/1996, " 조선말입말체문장연구, 해외우리문화학연구총서 95",, 한국문화사최현배, 1937, 우리말본,, 정음문화사小磯花絵, 1996, 対話コーパス作成法, 音声データベース, 強誠社小磯花絵, 2008, 音声談話における発話の終了性を備えた単位に関する一考察, 単位 としての文と発話, ひつじ書房沖裕子, 2008, 談話論からみた 文 と 発話 単位 としての文と発話, ひつじ書房金田純平, 2008, 発話内における単位認定の問題点について, 単位 としての文と発話, ひつじ書房国立国語研究所, 2006, 日本語話し言葉コ - パスの構築法, 国立国語研究所報告書 124, 国立国語研究所国立国語研究所 & 情報通信研究機構, 2004, 日本語話し言葉コ - パス (DVD), 国立国語研究所前川喜久雄, 2004, 日本語話し言葉コーパス の概要, 日本語科学 15, 国立国語研究所 Michael McCarthy, 1998, Spoken language and applied linguistics,, Cambridge University Press.