한국어의형태소분석 최호철 ( 고려대 ) 1. 언어 언어 ( 言語 ) 는소리와뜻이결합된것이므로음성만있는것이라면그것은언어가아닌 허언 ( 虛言 ) 이나헛소리라할수있고뜻만있는것이라면그것역시언어가아닌묵언 ( 默 言 ) 이나생각또는마음이라할수있을것이다. 1) 소리만있다면? 허언 ( 虛言 ), 헛소리. 만구리핼소도루즈르바모치누토카 2) 뜻만있다면? 묵언 ( 默言 ), 생각 / 마음. 철이 : 너, 어제그사람만났지? 석이 :. 철이 : 왜말이없어? 만났어? 석이 :. 철이 : 가타부타말을해야지. 2. 언어구성단위 소리와뜻이결합된언어구성단위로는담문 ( 談文, text), 문장 ( 文章, sentence), 구절 ( 句節, phrase), 어절 ( 語節, syntagma), 단어 ( 單語, word), 형태소 ( 形態素, morpheme) 등이있는데, 담문 ( 談文, text) 은언어구성의최대단위이고형태소 ( 形態素, morpheme) 는언어구성의최소단위이다. 담문 ( 談文, text) 문장 ( 文章, sentence) 구절 ( 句節, phrase) 어절 ( 語節, syntagma) 단어 ( 單語, word) 형태소 ( 形態素, morpheme) - 1 -
3. 언어요소단위 언어성립에서필수적인소리와뜻의두요소가운데에서음소 ( 音素, phoneme) 는소리 의최소단위이고의소 ( 義素, sememe) 는뜻의최소단위이므로음소나의소는단독으로 언어요소의최소단위가될수있지만언어구성의최소단위가될수는없다. { 나무 } 형태소 ( 形態素, morpheme) 언어 -------------- ----------- ------------------ [ 나, 무 ] 나무 언어 음절 ( 音節, syllable) 의소 ( 義素, sememe) / ㄴ, ㅏ, ㅁ, ㅜ / ---- ------ 음소 ( 音素, phoneme) 뜻 ------ ------ 소리 4. 형태소분석 형태소 ( 形態素, morpheme) 는의미를가진언어구성의최소단위이므로의미가없어 지는단계직전까지분석할수있다. 1) 나무 는 < 나무 > 라는의미를갖고있으나 나 또는 무 는어떠한의미도갖고있지않으므로 나무 는형태소가되지만 나 또는 무 는형태소가되지못한다. 2) 너무 는 < 지나치게 > 라는의미를갖고있으며, 이는다시 < 일정한시간, 시기, 범위따위를벗어나지나다 > 라는의미를갖는 너ㅁ 과 < 부사화 > 라는의미를갖는 ㅜ 로나눌수있으므로 너무 는한형태소가아니라 너ㅁ 과 ㅜ 라는두개의형태소로구성된단어이다. 3) 일차적으로언어는음성으로실현되고, 음성과표기가반드시일대일대응되는것은아니므로형태소분석은표기를대상으로삼을것이아니라발음을대상으로삼아야한다. 표기 : 학자여러분! 날개없이날수있어요? 볕에서는붉은색이잘날아요. 앞에놓인문제가무엇인지이야기해요. 발음 : 학짜여러분! 날개업씨날쑤이써요? - 2 -
벼테서는불근새기잘나라요. 아페노힌문제가무어신지이야기해요. 4) 분석예시학 < 學 > / 짜 < 者 > 여러 < 许多 > / 분 < 位 > 날 < 飞 > / 개 < 名詞化接辞 > 업ㅆ < 没有 > / ㅣ < 副詞化接辞 > 나 < 飞 > / ㄹ < 冠形詞形語尾 > / 쑤 < 方法 > * 날 의뒷말이경음으로발음되므로 ㄹ 은어간말음 ㄹ 이아닌관형사형어미 ㄹ 로분석. - 심을 ( 심 + 을 ) 줄, 먹을 ( 먹 + 을 ) 사람 - 볼 ( 보 + ㄹ ) 줄, 줄 ( 주 + ㄹ ) 사람 * 어간말음 ㄹ 은탈락. - 들 ( 드 + ㄹ 들 + ㄹ ) 줄, 벌 ( 버 + ㄹ 벌 + ㄹ ) 사람이ㅆ < 有 > / ㅓ < 平敍形語尾 > / 요 < 相對尊待助詞 > 벼ㅌ < 阳光 > / ㅔ서 < 副詞格助詞 > / 는 < 對照助詞 > 불ㄱ < 红 > / < 冠形詞形語尾 > / 새ㄱ < 色 > / ㅣ < 主格助詞 > 잘 < 容易 > 나ㄹ < 掉 > / ㅏ < 平敍形語尾 > / 요 < 相對尊待助詞 > 아ㅍ < 前 > / ㅔ < 副詞格助詞 > 노ㅎ < 放 > / ㅣ < 被動接辞 > / ㄴ < 冠形詞形語尾 > 문 < 問 > / 제 < 題 > / 가 < 主格助詞 > 무어ㅅ < 什么 > / ㅣ < 敍述格助詞 > / ㄴ지 < 疑問形語尾 > 이야기 < 话 > / 해 ( 하 + 여 ) / 요 < 相對尊待助詞 > * 해 는한형태 하 < 爲 > 와다른한형태 여 < 平敍形語尾 > 의결합으로서형태적인융합이어서분석불가. - 해 ( 하여), 했 ( 하였), 돼 ( 되어), 됐 ( 되었). - 네 ( 너의), 내 ( 나의). 5. 형태소와이형태 형태소 ( 形態素, morpheme) 는하나의같은의미를갖는여러형태 ( 形態, morph) 의집합 ( 集合, set) 이며, 이형태 ( 異形態, allomorph) 는한형태소안에있는여러형태이다. 1) 형태소표시는두가지방법이있는데, 하나는 / / 안에모든이형태를나열하는것이고, 다른하나는 { } 안에하나의대표적인이형태를보이는것이다. 2) 대표이형태는한언어에서분포가넓고다른이형태의도출이자연스러운이형태를선정하는것이일반적이다. - 3 -
/ 이형태나열 / { 대표이형태 } < 學 > / 학 ( 학교), 항 ( 학문)/ ={ 학 } * 파열음이비음앞에서비음으로바뀐다는설명이더자연스러운 학 을 < 者 > / 짜 ( 독자), 자 ( 청자)/ ={ 자 } * 평음이파열음뒤에서경음으로바뀐다는설명이더자연스러운 자 를 < 许多 > / 여러 ( 여러나라 )/ ={ 여러 } < 位 > / 분 ( 한분 ), 뿐 ( 다섯분 )/ ={ 분 } * 평음이파열음뒤에서경음으로바뀐다는설명이더자연스러운 분 을 < 飞 > / 날 ( 새가날고 ), 나 ( 새가나니 )/ ={ 날 } * 미정의음운첨가보다는기존의음운탈락으로설명하는것이더자연스러운 날 을 < 接辞 > / 개 ( 찌개), 깨 ( 덮개)/ ={ 개 } * 평음이파열음뒤에서경음으로바뀐다는설명이더자연스러운 개 를 < 没有 > / 업ㅆ ( 없어), 업 ( 없고), 엄 ( 없네)/ ={ 업ㅆ } * 파열음이비음앞에서비음으로바뀐다는설명이더자연스럽고, 발음의중화가일어 나기전의 업ㅆ 을 < 接辞 > / ㅣ ( 많이)/ ={ ㅣ } < 語尾 > / ㄹ ( 할일 ), ( 먹을것 )/ ={ } * 미정의음운첨가보다는기존의음운탈락으로설명하는것이더자연스러운 을 < 方法 > / 쑤 ( 할수 ), 수 ( 하는수 )/ ={ 수 } * 평음이관형사형어미 ㄹ 뒤에서경음으로바뀐다는설명이더자연스러운 수 를 < 有 > / 이ㅆ ( 있으니), 읻 ( 있지만), 인 ( 있네요)/ ={ 이ㅆ } * 파열음이비음앞에서비음으로바뀐다는설명이더자연스럽고, 발음의중화가일어 나기전의 이ㅆ 을 < 語尾 > / ㅓ ( 먹어), ㅏ ( 막아), 여 ( 하여)/ ={ ㅓ } * 분포가음운적인제약을받는것은임의로정할수있는데, ㅏ 뒤에서 ㅓ 로실현되 는경우도있어분포가더넓은 ㅓ 를 < 助詞 > / 요 ( 어서요), 뇨 ( 하면요)/ ={ 요 } * ㄴ 첨가가일어나지않은경우도있어분포가더넓은 요 를 < 阳光 > / 벼ㅌ ( 볕에), 볃 ( 볕도), 변 ( 볕만), 벼ㅊ ( 볕이), 뼈ㅌ ( 햇볕에), 뼏 ( 햇볕도), 뼌 ( 햇볕만), 뼈ㅊ ( 햇볕이)/ ={ 벼ㅌ } * 파열음이비음앞에서비음으로바뀐다는설명이더자연스럽고, 평음이파열음뒤에 서경음으로바뀐다는설명이더자연스럽고, 발음의중화가일어나기전의 벼ㅌ 을 < 助詞 > / ㅔ서 ( 집에서)/ ={ ㅔ서 } < 助詞 > / 는 ( 학교는), ( 집은 ), ㄴ ( 난몰라 )/ ={ 는 } * 분포가음운적인제약을받는것은임의로정할수있는데, 미정의음운첨가보다는 기존의음운탈락으로설명하는것이더자연스럽고, 앞말의형태가유지되는 는 을 - 4 -
< 红 > / 불ㄱ ( 붉어), 북 ( 붉다), 불 ( 붉고), 붕 ( 붉네), 뿔ㄱ ( 짙붉어), 뿍 ( 짙붉다), 뿔 ( 짙붉고), 뿡 ( 짙붉네)/ ={ 불ㄱ } * 파열음이비음앞에서비음으로바뀐다는설명이더자연스럽고, 평음이파열음뒤에 서경음으로바뀐다는설명이더자연스럽고, 발음의중화가일어나기전의 불ㄱ 을 < 語尾 > / ( 맑은), ㄴ ( 예쁜)/ ={ } * 미정의음운첨가보다는기존의음운탈락으로설명하는것이더자연스러운 을 < 色 > / 새ㄱ ( 색이), 생 ( 색만), 쌕 ( 혈색이), 쌩 ( 혈색만)/ ={ 새ㄱ } * 파열음이비음앞에서비음으로바뀐다는설명이더자연스럽고, 평음이파열음뒤에 서경음으로바뀐다는설명이더자연스러운 새ㄱ 을 < 助詞 > / ㅣ ( 밥이), 가 ( 나무가)/ ={ 가 } * 분포가음운적인제약을받는것은임의로정할수있는데, 서술격조사 이 와구별 하기위해 가 를 < 容易 > / 잘 ( 잘못), 짤 ( 곧잘)/ ={ 잘 } * 평음이파열음뒤에서경음으로바뀐다는설명이더자연스러운 잘 을 < 掉 > / 나ㄹ ( 향수가날고 ), 나 ( 향수가나니 )/ ={ 나ㄹ } * 미정의음운첨가보다는기존의음운탈락으로설명하는것이더자연스러운 나ㄹ 을 < 前 > / 아ㅍ ( 앞을), 압 ( 앞도), 암 ( 앞만)/ ={ 아ㅍ } * 파열음이비음앞에서비음으로바뀐다는설명이더자연스럽고, 발음의중화가일어 나기전의 아ㅍ 을 < 助詞 > / ㅔ ( 집에)/ ={ ㅔ } < 放 > / 노ㅎ ( 놓아), 논 ( 놓네)/ ={ 노ㅎ } * 마찰음이비음앞에서비음으로바뀐다는설명이더자연스러운 노ㅎ 을 < 接辞 > / ㅣ ( 깎이다), 히 ( 먹히다), 리 ( 팔리다), 기 ( 안기다)/ ={ 히 } * 분포가형태적인제약을받는것은임의로정할수있는데, 사동접사의 이 와구별 하기위해 히 를 < 問 > / 문 ( 질문, 문답 )/ ={ 문 } < 題 > / 제 ( 제목), 쩨 ( 숙제)/ ={ 제 } * 평음이파열음뒤에서경음으로바뀐다는설명이더자연스러운 제 를 < 什么 > / 무어ㅅ ( 무엇을), 무얻 ( 무엇도), 무언 ( 무엇만)/ ={ 무어ㅅ } * 파열음이비음앞에서비음으로바뀐다는설명이더자연스럽고, 발음의중화가일어 나기전의 무어ㅅ 을 < 助詞 > / ㅣ ( 밥이다)/ ={ ㅣ } < 語尾 > / ㄴ지 ( 바쁜지), 지 ( 맑은지), - 5 -
는지 ( 있는지)/ ={ 지 } * 미정의음운첨가보다는기존의음운탈락으로설명하는것이더자연스럽고, 분포가더넓은 지 를 < 话 > / 이야기 ( 혼사이야기 ), 니야기 ( 뒷이야기)/ ={ 이야기 } * ㄴ 첨가가특별한경우에일어나서분포가더넓은 이야기 를 6. 형태소와한국어의표기원칙 한국어의표기는원칙적으로형태소의이형태가운데에서다른이형태의도출이자연스 러워서선정한대표이형태를적되, 한이형태에서다른이형태의도출이자연스럽지않 고발음이확연히달라지는것은해당하는환경에서실현되는이형태를그대로적는다. / 이형태 / { 대표이형태 } 표기 / 학, 항 / ={ 학 } 학 / 짜, 자 / ={ 자 } 자 / 여러 / ={ 여러 } 여러 / 분, 뿐 / ={ 분 } 분 / 날, 나 / ={ 날 } 날 / 나 * 날는 과같은표기로 [ 나는 ] 발음을실현할수없을때는 나 로표기. / 개, 깨 / ={ 개 } 개 / 업ㅆ, 업, 엄 / ={ 업ㅆ } 없 * 업ㅆ 과발음이같고종성을아래에적는 없 으로표기. / ㅣ / ={ ㅣ } 이 * ㅣ 와발음이같고앞말의형태를밝힐수있는 이 로표기. / ㄹ, / ={ } 을 / ㄹ * 과발음이같고앞말의형태를밝힐수있는 을 로표기하되, 하을 과같은표기로 [ 할 ] 발음을실현할수없을때는 ㄹ 로표기. / 쑤, 수 / ={ 수 } 수 / 이ㅆ, 읻, 인 / ={ 이ㅆ } 있 * 종성을아래에적는 있 으로표기. / ㅓ, ㅏ, 여 / ={ ㅓ } 어 / 아 / 여 * ㅓ 와발음이같고앞말의형태를밝힐수있는 어 로표기. * 조허 와같은표기로 [ 조하 ] 발음을실현할수없을때는 조하 와발음 이같고앞말의형태를밝힐수있는 아 로표기. * 하어 / 하아 와같은표기로 [ 하여 ] 발음을실현할수없을때는 여 로 표기. / 요, 뇨 / ={ 요 } 요 / 벼ㅌ, 볃, 변, 벼ㅊ, 뼈ㅌ, 뼏, 뼌, 뼈ㅊ / ={ 벼ㅌ } 볕 * 종성을아래에적는 볕 으로표기. - 6 -
/ ㅔ서 / ={ ㅔ서 } 에서 * ㅔ서 와발음이같고앞말의형태를밝힐수있는 에서 로표기. / 는, 은, ㄴ / ={ 는 } 는 / 불ㄱ, 북, 불, 붕, 뿔ㄱ, 뿍, 뿔, 뿡 / ={ 불ㄱ } 붉 * 종성을아래에적는 붉 으로표기. /, ㄴ / ={ } 은 / ㄴ * 과발음이같고앞말의형태를밝힐수있는 은 으로표기하되, 예 쁘은 과같은표기로 [ 예쁜 ] 발음을실현할수없을때는 ㄴ 으로표기. / 새ㄱ, 생, 쌕, 쌩 / ={ 새ㄱ } 색 * 종성을아래에적는 색 으로표기. / ㅣ, 가 / ={ 가 } 가 / 이 * 밥가 와같은표기로 [ 바비 ] 발음을실현할수없을때는 ㅣ 와발음이 같고앞말의형태를밝힐수있는 이 로표기. / 잘, 짤 / ={ 잘 } 잘 / 나ㄹ, 나 / ={ 나ㄹ } 날 / 나 * 종성을아래에적는 날 로표기하되, 날는 과같은표기로 [ 나는 ] 발음 을실현할수없을때는 나 로표기. / 아ㅍ, 압, 암 / ={ 아ㅍ } 앞 * 종성을아래에적는 앞 으로표기. / ㅔ / ={ ㅔ } 에 * ㅔ 와발음이같고앞말의형태를밝힐수있는 에 로표기. / 노ㅎ, 논 / ={ 노ㅎ } 놓 * 종성을아래에적는 놓 으로표기. / ㅣ, 히, 리, 기 / ={ 히 } 히 / 이 / 리 / 기 * 깎히다 와같은표기로 [ 까끼다 ] 발음을실현할수없을때는 ㅣ 와발 음이같고앞말의형태를밝힐수있는 이 로표기. * 팔히다 와같은표기로 [ 팔리다 ] 발음을실현할수없을때는 리 로표 기. * 안히다 와같은표기로 [ 안기다 ] 발음을실현할수없을때는 기 로표 기. / 문 / ={ 문 } 문 / 제, 쩨 / ={ 제 } 제 / 무어ㅅ, 무얻, 무언 / ={ 무어ㅅ } 무엇 * 종성을아래에적는 무엇 으로표기. / ㅣ / ={ ㅣ } 이 * ㅣ 와발음이같고앞말의형태를밝힐수있는 이 로표기. / ㄴ지, 은지, 는지 / ={ 지 } 은지 / ㄴ지 / 는지 * 지 와발음이같고앞말의형태를밝힐수있는 은지 로표기하되, 예쁘은지 와같은표기로 [ 예쁜지 ] 발음을실현할수없을때는 ㄴ지 로 표기. - 7 -
* 먹은지 와같은표기로 [ 먹는지 ] 발음을실현할수없을때는 는지 로 표기. / 이야기, 니야기 / ={ 이야기 } 이야기 7. 형태 ( 영형태, 零形態, zero morph) : 의미는있는데형태가없는것. 날개가없이 의 가 는 < 주체화 > 의미의형태 : 가 형태. 손발이없이 의 이 는 < 주체화 > 의미의형태 : 이 형태. 날개없이 의 날개 뒤에 < 주체화 > 의미의 형태가있다고가정 : 형태. 손발없이 의 손발 뒤에 < 주체화 > 의미의 형태가있다고가정 : 형태. 날개를펴고 의 를 은 < 객체화 > 의미의형태 : 를 형태. 날개ㄹ펴고 의 ㄹ 은 < 객체화 > 의미의형태 : ㄹ 형태. 손발을펴고 의 을 은 < 객체화 > 의미의형태 : 을 형태. 날개펴고 의 날개 뒤에 < 객체화 > 의미의 형태가있다고가정 : 형태. 손발펴고 의 손발 뒤에 < 객체화 > 의미의 형태가있다고가정 : 형태. * 형태소는같은의미를갖는여러형태의집합이므로 < 주체화 > 형태소는 가 형태와 이 형태및 형태를아우르는말로서 / 가, ㅣ, / 로표시하거나 { 가 } 나 { 이 } 또는 { } 으로표시할수있고, < 객체화 > 형태소는 를 형태와 ㄹ 형태및 을 형태와 형태를아우르는말로서 / 를, ㄹ, 을, / 으로표시하거나 { 를 } 이나 { ㄹ } 또는 { 을 } 이나 { } 로표시할수있다. * 형태 (morph) 는개별적인것을지칭하므로 가 형태, 이 형태, 를 형태, ㄹ 형태, 을 형태, 형태라고할수있으나, 형태소 (morpheme) 는하나의같은의미를갖는여러형태의집합이므로 형태소 란말앞에는구체적인개별형태를나타내는말이올수없다. 예를들어의미를나타내는 < 주체화 > 나 < 객체화 > 를앞세워 < 주체화 > 형태소, < 객체화 > 형태소란말은사용할수있으나개별형태 (morph) 를앞세운 가 형태소, 이 형태소, 를 형태소, ㄹ 형태소, 을 형태소, 형태소 (zero morpheme) 란말은사용할수없다. * 가 형태 / 이 형태 / 를 형태 / ㄹ 형태 / 을 형태 / 형태 : < 주체화 > 형태소 / < 객체화 > 형태소 : 가 형태소 / 이 형태소 / 를 형태소 / ㄹ 형태소 / 을 형태소 / 형태소 : 8. 허형태 ( 虛形態, empty morph) : 형태는있는데의미가없는것. 좁쌀 ( 조ㅂ쌀 ) 의 ㅂ 은형태는있으나의미가없음 : 허형태. 송아지 ( 소ㅇ아지 ) 의 ㅇ 은형태는있으나의미가없음 : 허형태. - 8 -
* 허형태란말은형태는있으나의미가없는것을일컬으므로위의 ㅂ 이나 ㅇ 과같이의미가없는형태는모두허형태라할수있으며, 형태소는같은의미를갖는여러형태의집합이므로허형태소 ( 虛形態素, empty morpheme) 는위의 ㅂ 이나 ㅇ 과같이의미가없는모든형태를아우르는말로서 / ㅂ, ㅇ, / 으로나열하거나 { ㅂ } 이나 { ㅇ } 등과같이대표이형태로표시할수있다. * 허형태, 허형태소 : 9. 언어구성과요소의최소단위 언어구성단위 언어요소단위 구성의최소단위 소리의최소단위 뜻의최소단위 개별적 : 형태 ( 形態, morph) 음성 ( 音聲, phone) 의미 ( 義味, seme) 집합적 : 형태소 ( 形態素, morpheme) 음소 ( 音素, phoneme) 의소 ( 義素, sememe) 개별적 : 이형태 ( 異形態, allomorph) 이음 ( 異音, allophone) 이의 ( 異義, alloseme) < 끝 > 고맙습니다. - 9 -