Microsoft Word - src.docx

Similar documents

회원번호 대표자 공동자 KR000****1 권 * 영 KR000****1 박 * 순 KR000****1 박 * 애 이 * 홍 KR000****2 김 * 근 하 * 희 KR000****2 박 * 순 KR000****3 최 * 정 KR000****4 박 * 희 조 * 제

hwp

기철 : 혜영 : 기철 : 혜영 : ㄴ ㅁ ㅇ ㄴ ㅁ ㅇ ㅇ ㄴ ㅁ ㅇ


국어 순화의 역사와 전망

º´¹«Ã»Ã¥-»ç³ªÀÌ·Î

( 단위 : 가수, %) 응답수,,-,,-,,-,,-,, 만원이상 무응답 평균 ( 만원 ) 자녀상태 < 유 자 녀 > 미 취 학 초 등 학 생 중 학 생 고 등 학 생 대 학 생 대 학 원 생 군 복 무 직 장 인 무 직 < 무 자 녀 >,,.,.,.,.,.,.,.,.

<28C3D6C1BE29C7D1B1B9BEEEB9AEB9FDB7D028317E D E687770>


#7단원 1(252~269)교

¿©¼ºÀαÇ24È£

어린이 비만예방 동화 연극놀이 글 김은재 그림 이 석

안 산 시 보 차 례 훈 령 안산시 훈령 제 485 호 [안산시 구 사무 전결처리 규정 일부개정 규정] 안산시 훈령 제 486 호 [안산시 동 주민센터 전결사항 규정 일부개정 규

<C5D8BDBAC6AEBEF0BEEEC7D02D3336C1FD2E687770>

<B3EDB9AEC0DBBCBAB9FD2E687770>

041~084 ¹®È�Çö»óÀбâ

ÃÊ2)03È£³ëº§»óiÇؼ³ÇÊ

Microsoft Word - TTAK.KO

»êÇÐ-150È£

2015년9월도서관웹용

41호-소비자문제연구(최종추가수정0507).hwp

자연언어처리


<34BFF9C8A320B4DCB8E9B0EDC7D8BBF32E706466>

152*220

춤추는시민을기록하다_최종본 웹용


178È£pdf

Microsoft PowerPoint - chap02-C프로그램시작하기.pptx

제5장 형태소분석


750 1,500 35


03 ¸ñÂ÷

* pb61۲õðÀÚÀ̳ʸ

08학술프로그램

해피메이커 표지.indd

Microsoft PowerPoint - MonthlyInsighT-2018_9월%20v1[1]

CT083001C

33 래미안신반포팰리스 59 문 * 웅 입주자격소득초과 34 래미안신반포팰리스 59 송 * 호 입주자격소득초과 35 래미안신반포팰리스 59 나 * 하 입주자격소득초과 36 래미안신반포팰리스 59 최 * 재 입주자격소득초

歯이

³»Áö_10-6

T T A S t a n d a r d

2016 년 1 학기국어학개론 형태론 (Morphology): 형태소와교체, 단어의구성요소 1. 형태론의개념과분야 1) 개념 : 단어의구조를연구하는분야 2) 분야 : (1) 단어형성법 ( 조어법 ) (2) 굴절법 ( 屈折法, inflection): 조사나어미가붙어문법적

도약종합 강의목표 -토익 700점이상의점수를목표로합니다. -토익점수 500점정도의학생들이 6주동안의수업으로 점향상시킵니다. 강의대상다음과같은분들에게가장적합합니다. -현재토익점수 500점에서 600점대이신분들에게가장좋습니다. -정기토익을 2-3번본적이있으신분

Drucker Innovation_CEO과정

0.筌≪럩??袁ⓓ?紐껋젾 筌

PowerPoint 프레젠테이션

소식지수정본-1

CR hwp

< C617720BBF3B4E3BBE7B7CAC1FD20C1A632B1C72E687770>

아이콘의 정의 본 사용자 설명서에서는 다음 아이콘을 사용합니다. 참고 참고는 발생할 수 있는 상황에 대처하는 방법을 알려 주거나 다른 기능과 함께 작동하는 방법에 대한 요령을 제공합니다. 상표 Brother 로고는 Brother Industries, Ltd.의 등록 상

(012~031)223교과(교)2-1

문화재이야기part2

현장에서 만난 문화재 이야기 2

< B3EDB9AEB8F1C2F728332D362936BFF92E687770>

2016년 신호등 3월호 내지A.indd

04 Çмú_±â¼ú±â»ç

내지-교회에관한교리

- 2 -

2002report hwp

나하나로 5호

한국의 양심적 병역거부

<C0FCB9AEB1E2BCFA20BFDCB1B9C0CEB7C220B3EBB5BFBDC3C0E520BAD0BCAE2E687770>

hwp


2014학년도 수시 면접 문항

금강인쇄-내지-세대주의재고찰

FSB-12

Çѹ̿ìÈ£-197È£

1960 년 년 3 월 31 일, 서울신문 조간 4 면,, 30

Big Data Analysis Using RHINO

Untitled-1

Microsoft PowerPoint - 26.pptx


감사회보 5월

E (2005).hwp

2 Verse 2C E 전능 하신나의주하나님은?? j r j 2 0 r. fij fi j R = E2G 능치 Fm9 Cm M9 2C 못하실일전혀없네우리?? r. o R

<C3E6B3B2B1B3C0B C8A32DC5BEC0E7BFEB28C0DBB0D4292D332E706466>

서만설명되는이형태 1 과거시제를나타내는 -았-/-었- 은음운론적조건에따른교체양상을보이는데, 하 - 와결합할때는 -였- 으로바뀌게된다. -았-~-었- -였- 2 명령형어미 (-아라/-어라) 는형태소 하- 와결합할때음운론적조건에따라 -아라 가연결되지않고 -여라 가연결되며,

우루과이 내지-1

레이아웃 1


A 한국노동연구원 한국보건사회연구원 1998 년 한국사회과학자료원 2008년 2008년

완벽한개념정립 _ 행렬의참, 거짓 수학전문가 NAMU 선생 1. 행렬의참, 거짓개념정리 1. 교환법칙과관련한내용, 는항상성립하지만 는항상성립하지는않는다. < 참인명제 > (1),, (2) ( ) 인경우에는 가성립한다.,,, (3) 다음과같은관계식을만족하는두행렬 A,B에

00-1표지

1504-<C804><CCB4>.pdf

82-대한신경학0201

¿øÀü¼¼»ó-20È£c03ÖÁ¾š

<C1DF29B1E2BCFAA1A4B0A1C1A420A8E85FB1B3BBE7BFEB20C1F6B5B5BCAD2E706466>

경제통상 내지.PS

°æÁ¦Åë»ó³»Áö.PDF

5월전체 :7 PM 페이지14 NO.3 Acrobat PDFWriter 제 40회 발명의날 기념식 격려사 존경하는 발명인 여러분! 연구개발의 효율성을 높이고 중복투자도 방지할 것입니다. 우리는 지금 거센 도전에 직면해 있습니다. 뿐만 아니라 전국 26

OCW_C언어 기초

01¸é¼öÁ¤

sk....pdf..

Microsoft PowerPoint - chap04-연산자.pptx

(중등용1)1~27

10월추천dvd

Transcription:

TTAK..KO-11.0010/R1 개정일 : 2015 년 06 월 23 일 T T A S t a n d a r d 형태소태깅말뭉치작성용품사태그세트 Part-of-Speech Tag Set for Morphological Annotationn of Written Texts

정보통신단체표준 ( 국문표준 ) TTAK.KO-11.001 10/R1 개정일 : 2015 년 06 월 23 일 형태소태깅말뭉치작성용 품사 태그 세트 Part-of-Speech Tag Set for Morphological Annotationn of Written Texts 본문서에대한저작권은 TTA 에있으며, TTA 와사전협의일부를상업적목적으로복제또는배포해서는안됩니다. 없이이문서의전체또는 Copyrightc Telecommunications Technology Association 2015. All Rights Reserved.

서문 1. 표준의목적 대규모말뭉치 (corpus) 는자연어처리분야에서가장기초적인언어자원으로서그중요성이높아지고있다. 특히말뭉치를분석하여가공한형태소품사부착말뭉치 (tagged corpus) 는형태소분석기개발에있어서필수적인언어자원으로서그구축과관리에많은비용이소요되므로연구개발자간에공유가가능해야하고, 기존에구축되어있는것을재사용할수있어야한다. 본표준은품사부착말뭉치의재사용및공유를가능하게하는표준태그세트를제공하기위하여작성되었다. 2. 주요내용요약 1999 년표준태그세트는일반적으로많이사용되는형태소품사위주로작성되었다. 하지만, 최근에는구문분석이나의미역인식등의상위수준의언어분석에대한수요가늘어나면서형태소품사에대한세분화요구가늘어나고있다. 그러므로, 본표준에서는 1999 년표준태그세트보다조사, 어미, 기호등을세분화해서정리하였다. 본표준은 14 개기관에서사용하는태그세트의비교과정을거쳤다 [1-10]. 1999 년에제정된기존표준태그세트는 27 개품사로구성된반면, 본표준은 47 개품사로세분화되었다. 3. 표준적용산업분야및산업에미치는영향 언어분석은정보추출, 정보검색, 질의응답등의자연어처리분야에서기반이되는기술이며, 본표준은언어분석과정중형태소분석에대한것이다. 형태소분석은언어분석과정중에도가장기반이되는중요한기술인데, 정보추출등의응용분야기술은형태소분석의태그세트에매우의존적이므로응용분야의필요에부합되도록형태소태그세트를확장 / 정제하고품사부착말뭉치작성용표준안을마련할필요가있다. 응용분야의필요에적합한품사태그세트와말뭉치구축표준안이나오면, 표준안에따르는형태소품사부착말뭉치가다양한기관에서만들어지고공유되면서형태소분석기개발생태계가자연스럽게조성되고, 나아가서는형태소분석기를활용하는응용분야의기술발전에도기여할것이다. 4. 참조표준 ( 권고 ) i

4.1. 국외표준 ( 권고 ) - 해당사항없음. 4.2. 국내표준 - 해당사항없음. 5. 참조표준 ( 권고 ) 과의비교 5.1. 참조표준 ( 권고 ) 과의관련성 - 해당사항없음. 5.2. 참조한표준 ( 권고 ) 과본표준의비교표 - 해당사항없음. 6. 지식재산권관련사항 본표준의 지식재산권확약서 제출현황은 TTA 웹사이트에서확인할수있다. 본표준을이용하는자는이용함에있어지식재산권이포함되어있을수있으므로, 확인후이용한다. 본표준과관련하여접수된확약서이외에도지식재산권이존재할수있다. 7. 시험인증관련사항 7.1. 시험인증대상여부 - 해당사항없음. 7.2. 시험표준제정현황 - 해당사항없음. ii

8. 표준의이력정보 8.1. 표준의이력 판수제정 개정일제정 개정내역 제 1 판 1999.12.08. 제 2 판 2015.06.23. 제정 TTAK.KO-11.0010 개정 8.2. 주요개정사항 - 2000 년부터 2014 년까지발표된주요기관의형태소태그세트를비교분석 - 최근의형태소품사에대한세분화요구에따라 1999 년표준태그세트보다조사, 어미, 기호등을세분화해서정리 - 1999 년에제정된기존표준태그세트는 27 개품사로구성된반면, 본표준은 47 개품사로세분화 iii

Preface 1. Purpose of the Standard One of the most essential language resources, large-scale corpora becomes more important in the Natural Language Processing research and application area. Specially tagged corpora obtained by attaching tags to the lexical items in the raw corpora are basic language resources for morphological analysis and require tremendous cost for its development and management. As a result, it is desirable that tagged corpora should be reusable and sharable among the research community. The purpose of this recommendatory standard is to provide commonly usable guidelines for the Part-of- Speech tag set for reuse and sharing of tagged corpus. 2. Summary of Contents The original version of 1999 mainly defines the part of speech tag set used for general purpose. The needs for more detailed categorization of part of speech tags are increasing recently as the syntactic and semantic analysis are required for a high-level language analysis. Therefore, the proposed standard provides more detailed subcategorization of auxiliaries, word endings, and symbols by revision of the original version of the part of speech tag set. To achieve interoperability with the existing tag sets, the proposed tag set was produced by comparing with other 14 different tag sets [1-10]. While the original standard tag set established in 1999 consists of 27 speech tags, the proposed standard tag set in this document extends to 47 tags. 3. Applicable Fields of Industry and its Effect Language analysis is the essential technology in the Natural language processing areas for information retrieval, information search and Question Answering. The proposed standard is related with the technology of morphological analysis, the core technology among various language analysis technologies. Since the application technologies such as information retrieval are heavily dependent on the POS tag sets, it is required to extend and refine the POS tag set and to establish a standard to construct tagged iv

corpus satisfying the needs of the applications. The standardized POS tag set and tagged corpus guidelines will contribute to the development of the eco system of the morphological analysis and technology enhancement of various application areas by producing and sharing POS tagged corpus in many different institutes. 4. Reference Standards(Recommendations) 4.1. International Standards(Recommendations) - None 4.2. Domestic Standards - None 5. Relationship to Reference Standards(Recommendations) 5.1. Relationship of Reference Standards(Recommendations) - None 5.2. Differences between Reference Standard(Recommendation) and this Standard - None 6. Statement of Intellectual Property Rights IPRs related to the present document may have been declared to TTA. The information pertaining to these IPRs, if any, is available on the TTA Website. No guarantee can be given as to the existence of other IPRs not referenced on the TTA website. And, please make sure to check before applying the standard. v

7. Statement of Testing and Certification 7.1. Object of Testing and Certification - None 7.2. Standards of Testing and Certification - None 8. History of Standard 8.1. Change History Edition Issued date Outline First Edition 1999.12.08. Second Edition 2015.06.23. Established TTAK.KO-11.0010 Revision 8.2. Revisions - Comparison of the different tag sets published by major institutes from 2000 to 2014 - Sub-division of the POS tags such as auxiliaries, word endings and symbols according to the recent needs of the sub-division - The revised tag set consists of 47 POS tags while the existing tag set consists of 27 tags vi

목차 1. 개요 1 2. 표준의구성및범위 1 3. 참조표준 ( 권고 ) 2 4. 용어정의및약어 3 5. 품사태그세트분류기준 5 5.1. 태그세트분류체계 5 5.2. 각태그별정의및분류기준 7 6. 기타 44 6.1. 준말 44 6.2. 합성어 44 부록. 참고문헌 45 vii

Contents 1. Introduction 1 2. Constitution and Scope 1 3. Reference Standards(Recommendations) 2 4. Terms and Definitions 3 5. POS Tag Classification Criteria 5 5.1. POS tag Classification 5 5.2. Definition and Classification Criteria 7 6. Other information 44 6.1. Abbreviation 44 6.2. Compound 44 Appendix. Reference 45 viii

형태소태깅말뭉치작성용품사태그세트 (Part-of-Speech Tag Set for Morphological Annotation of Written Texts) 1. 개요 대규모말뭉치 (corpus) 는자연어처리분야에서가장기초적인언어자원으로서그 중요성이높아지고있다. 특히말뭉치를분석하여가공한형태소품사부착말뭉치 (POS tagged corpus) 는형태소분석시스템개발에있어서필수적인언어자원이다. 품사부착말뭉치는그중요성이큰만큼구축과관리에많은비용이소요되므로연구개발자간에공유가가능해야하고, 기존에구축되어있는것을재사용할수있어야한다. 품사부착말뭉치의공유와재사용이가능하기위해서는품사부착말뭉치에쓰이는품사태그세트의표준화가선행되어야한다. 표준태그세트가관련연구개발자누구나수용할수있는체계로되어있어서품사부착말뭉치가표준태그세트로구축된다면각각이서로다른형태의품사부착말뭉치를소규모로구축하던것을한곳에집중시킴으로써대규모, 고품질의언어자원확보가가능해질것이다. 2. 표준의구성및범위 본표준은말뭉치를분석하여형태소단위로분할할때, 각형태소에부착되는태그 세트에대한정의와분류기준을제공한다. 전체태그세트분류체계를제시하고각 태그에대한정의한분류기준을기술한다. 본표준에서제시하는태그세트는전산처리적관점에서단위와범주를설정하여국어학이나언어학에서연구하고있는품사분류체계와는그목적과용도가분명히다르다. 본표준은국어학이나언어학에서연구한결과를가능한많이참고하지만, 실제실행되는시스템들의일반적인환경적제약과개발에드는노력및자원의제한을고려한전산처리의효율성을고려하는관점에서분류체계가설정되었다. 각태그별로제시되는예는해당태그에속하는전체어휘가아니라대표적어휘를예시한것이다. 1

본표준에서제시하는품사태그세트의가장주된용도는자동품사태거를위한학습자료로활용되는품사부착말뭉치작성용이다. 이러한용도는의미론적인어휘분류나구문론적또는형태론적인어휘범주를연구하는사람들의분류체계와관점이다르다는것을전제하는것이다. 언어분석과정중에는문장분석과정으로형태소분석이끝나고구문분석을하게 된다. 구문분석에서의애매성폭발을줄이기위하여품사태거는형태소분석결과인 어절별분석결과들을순위화 (ranking) 하여상위 1 개의분석결과만구문분석의 입력으로넘겨주기위한용도로자동품사태거가사용됨을자연언어처리분야의 연구자들은주지하고있을것이다. 따라서, 태깅용또는태그부착말뭉치작성용품사태그세트는어절내에서의다양하고복잡한형태소들의결합제약을반영하는형태론적분류보다덜정밀하며, 문장내에멀리떨어져있는어절간또는구절간의순서, 공기제약관계등의현상을반영하는구문론적분류보다도덜정밀하다. 그래서, 태깅용품사태그세트는형태소분석과구문분석사이의중간단계의처리를위한 형태-통사분석론 적인분류를따른다고말할수있다. 그리고, 자동품사태거를정보검색에서의명사추출의정확도를높이기위해서사용할수있다는것을주지하고있을것으로간주하며, 또한이권고안을활용하는사람들은통계적자연언어처리의기본개념과제약사항등을숙지하고있음을가정한다. 끝으로, 태그세트에서다루지않은세부적인언어현상들은각시스템의문법 규칙이나전자사전의자질 - 값에서반영한다는것을가정한다. 3. 참조표준 ( 권고 ) 3.1. 국외표준 ( 권고 ) - 해당사항없음. 3.2. 국내표준 2

- 해당사항없음. 4. 용어정의및약어 4.1.1. 언어자원 (language resource) 최근에유행하는경험적이고관찰적인자연언어처리기법에서귀납적으로언어지식을추출하기위해필요한대량의다양한언어현상을담고있는기초자료이며, 전자사전, 말뭉치, 품사부착말뭉치, 구문구조부착말뭉치등을말한다. 이중, 본표준안과직접적으로관련이있는 말뭉치, 품사부착말뭉치 에대해서만정의를내리기로한다. 4.1.2. 말뭉치 (corpus) 신문, 소설, 교과서등각분야의저서나출판물을정해진저장양식과표현 양식에따라전자화 (machine-readable) 한텍스트모음을말한다. 4.1.3. 형태소 (morpheme) 우리나라말에서의미의최소단위로정의되는단위이다. 예를들어, 나무 의의미는 나 와 무 의의미로더이상분해불가능하므로 나무 는하나의의미단위인형태소가되고, 코웃음 은 코 와 웃음 이의미가있으므로 코, 웃음 이각각형태소가된다. 4.1.4. 형태소분석 (morphological analysis) 어절 ( 즉, 한글에서의띄어쓰기의기본단위 ) 을분석을위한기본단위로하여, 가능한모든문법적인형태소의결합구조와그결합구조에서의각형태소가취하는품사를출력하는것을말한다. 예를들면, 차는 이라는입력어절에대해형태소분석기는 차 / 명사 + 는 / 조사 와 차 / 동사어간 + 는 / 어미 를가능한결합구조로출력할수있다. 4.1.5. 품사태그세트 (POS tag set) 3

한글을형태소단위로분리했을때각형태소가형태나기능적으로분류되는품사 (POS, Part-of-Speech) 체계를말한다. 국어학에서는기본적으로 8 품사를정하고있지만, 본표준에서말하는태그세트는목적과용도가다르므로전산처리에맞는품사체계를말한다. 따라서, 국어학에서정의하는품사보다적용범위가좀더넓은것으로써, 형태-통사론적인관점의품사태그세트라고볼수있다. 그러한관점에서전통적인개념의품사라는말보다는어휘범주라는말이더적합하지만일반적으로많이쓰이는용어를쓰기로한다. 4.1.6. 태그 (tag) 태그세트를이루는구성요소들로써태깅의관점에서분류한각각의품사를 상징하는암호화된표식을말한다. 4.1.7. 태깅 (tagging) 말뭉치의어휘를형태소단위로분석하고, 주변문맥을고려해서가장적합한품사태그를하나만부여하는것이다. 예를들면, ' 차 라는어휘는동사어간, 명사, 형용사어간등이될수있지만, 나는차를마신다 라는문장에서는 차 / 명사 + 를 / 조사 의형태로하나의적절한품사가부여되고, 나는공을찬다 라는문장에서는 차 / 동사어간 + ㄴ다 / 어말어미 와같이하나의적절한품사를부여하는것이다. 4.1.8. 품사부착말뭉치 (POS tagged corpus) 정해진분리원칙에따라말뭉치의어절을형태소단위로분리하고, 정해진표현 양식과할당기준및문맥에따라각형태소에 1 개의태그를부착한형태의 텍스트모음을말한다. 4.1.9. 전산처리적관점과용도 전산처리적인관점이라는것은좀더엄밀하게말하면, 사람들에게설명을위한형태로언어현상의특징을설명하는형태론, 구문론이아니다. 형태소분석기, 품사태거, 구문분석기등과같은논리적으로엄격하고융통성이별로없는프로그램으로하여금주어진컴퓨팅환경과제한된메모리와계산능력을 4

활용하여관찰가능하고처리가능한범위내의문장을입력으로받아정해진 형태의출력을제한된시간내에출력해야한다는제약적용도를고려한 관점이다. 5. 품사태그세트분류기준 1)2) 5.1. 태그세트분류체계 대분류소분류세분류 일반명사 (NNG) 명사 (NN) 고유명사 (NNP) (1) 체언 의존명사 (NNB) (2) 용언 (3) 수식언 대명사 (NP) 수사 (NR) 동사 (VV) 형용사 (VA) 보조용언 (VX) 지정사 (VC) 관형사 (MM) 부사 (MA) 대명사 (NP) 수사 (NR) 동사 (VV) 형용사 (VA) 보조용언 (VX) 긍정지정사 (VCP) 부정지정사 (VCN) 성상관형사 (MMA) 지시관형사 (MMD) 수관형사 (MMN) 일반부사 (MAG) 접속부사 (MAJ) (4) 독립언감탄사 (IC) 감탄사 (IC) 주격조사 (JKS) (5) 관계언격조사 (JK) 보격조사 (JKC) 관형격조사 (JKG) 1) 본표준의설정에있어서먼저기존태그세트와호환성을제고하기위하여세종태그셋, 품사부착말뭉치작성용품사태그세트표준 (TTA.KO-11.0010), ETRI, 서울대, KAIST, 포항공대, 울산대, 충북대, MORAN, 연세대, 고려대, MACH, HAM, 표준국어대사전의 14개기관에서사용하는태그세트의비교과정을거쳤음을밝힌다. 2) 본표준태그세트분류기준의기술형식은세종21계획의결과물인 형태분석말뭉치구축지침 (Ver. 2005-1) 지침서를참고했음을밝힌다. 5

목적격조사 (JKO) 부사격조사 (JKB) 호격조사 (JKV) 인용격조사 (JKQ) 보조사 (JX) 접속조사 (JC) 보조사 (JX) 접속조사 (JC) 선어말어미 (EP) 종결어미 (EF) 어미 (EM) 연결어미 (EC) (6) 의존형태 (7) 기호 접두사 (XP) 접미사 (XS) 어근 (XR) 일반기호 (ST) 외국어 (SL) 한자 (SH) 숫자 (SN) 분석불능범주 (NA) 명사형전성어미 (ETN) 관형형전성어미 (ETM) 체언접두사 (XPN) 명사파생접미사 (XSN) 동사파생접미사 (XSV) 형용사파생접미사 (XSA) 어근 (XR) 마침표, 물음표, 느낌표 (SF) 쉼표, 가운뎃점, 콜론, 빗금 (SP) 따옴표, 괄호표, 줄표 (SS) 줄임표 (SE) 붙임표 ( 물결 )(SO) 기타기호 (SW) 외국어 (SL) 한자 (SH) 숫자 (SN) 분석불능범주 (NA) - 품사마다세분류된정도가다른것은품사태깅의관점에서유용성을검토하여적합성에따라취사선택을하였기때문이며, 미학적이나구조상의균형을고려한것이아님을밝혀둔다. 단지, 분류구조상의균형성만을이유로똑같은깊이의품사세분을하여품사태그부착말뭉치를구축하면태깅의관점에서불필요한낭비와작업의어려움을초래하기때문이다. 6

- 태그세트는용도에따라더세분되거나덜세분된분류가제시될수있지만, 이 권고안에서당면목표로하는용도는자동품사태거용품사부착말뭉치구축에 있음을다시한번밝혀둔다. - 새로운의미있는용도나언어현상의출현또는발견으로새범주의태그설정이필요할경우에는이체계를유지하면서계층적으로새로운하위분류를추가하여점증적인방식으로다듬어나갈수있으므로, 이분류체계는개방적이고수용적인기본틀을제공하는것을목적으로하고있다. - 본권고안은품사태그세트와품사별태깅지침의표준안마련에목적이있으며, 기본적인태깅지침은세분류를기준으로작성하였다. 하지만, 본권고안의사용자가필요에따라서소분류와세분류를선택해서사용할수있도록소분류에도품사태그를설정하였다. 5.2. 각태그별정의및분류기준 5.2.1. 체언 체언은명사, 대명사, 수사를포괄하는대범주로서, 조사와결합하거나그자체로다른 체언이나용언과어울려하나의문장성분이될수있다. 5.2.1.1. 명사 (NN) 명사는사물의이름을나타내는품사이다. 본표지에서는명사를일반명사, 고유명사, 의존명사로세분한다. 5.2.1.1.1. 일반명사 (NNG) 사물의이름을나타내는단어로서표준국어대사전에명사로등재된표제어 ( 고유명사와 의존명사를제외한모든명사 ) 와독립된음절 ( 한자어 ), 약어, 고사성어등사전표제어는 아니나다른품사로분석될수없는단위들을포함한다. (1) 일반명사로분석할수있는단어 7

( 가 ) 표준국어대사전의명사표제어 국어 /NNG, 연구 /NNG ( 나 ) 1 음절한자어가독립된단위로사용되는경우 서울초등학교졸 [ 졸 /NNG] ( 다 ) 한자성어 백척간두 ( 百尺竿頭 ) [ 백척간두 /NNG+(/SS+ 百尺竿頭 /SH+)/SS] ( 라 ) 외국어를음차한경우 아이러브유 [ 아이 /NNG] ( 마 ) 기타다른품사로분석될수없는단위 5 관왕 벙커 C 유 [5/SN+ 관 /NNG+ 왕 /NNG] [ 벙커 /NNG+C/SL+ 유 /NNG] (2) 명사상당어의분석 ( 가 ) 동사의활용형이따옴표없이문장속에서명사처럼기능하는경우는원래 품사대로분석한다. 어디가느냐가그의물음이었다. [ 가 /VV+ 느냐 /EC+ 가 /JKS] ( 나 ) 따옴표를가진성분이나요소도명사처럼기능할수있으나, 원래품사대로 분석한다. 그것은 는 이아니라 를 이다. [ /SS+ 는 /JX+ /SS+ 이 /JKC] ( 다 ) 부사뒤에격조사가쓰이는것도의미론적인따옴의효과에의하여부사가 명사적인용법을가지는것이므로분석은 부사 로한다. 가족을멀리에보냈다. [ 멀리 /MAG+ 에 /JKB] 5.2.1.1.2. 고유명사 (NNP) 고유명사는특정한사물에붙여진이름으로, 기본적으로최하의어에속하는대상을서로변별하기위하여붙인이름이며, 원칙적으로지시대상만가질뿐의미내용은가지지않는다. 고유명사의분석기준은매우다양하므로, 본지침에서는다음에제시하는것만을고유명사로인정한다. 또한, 본지침은띄어쓰기단위의분석을원칙으로하고있으므로, 한단어이상으로구성된고유명사 ( 바람과함께사라지다 ) 와같은경우의분석을위해전체를아우르는단위를설정하지는않는다. (1) 인명, 종족명 8

( 가 ) 씨 ( 氏 ), 공 ( 公 ), 군 ( 君 ), 양 ( 孃 ), 옹 ( 翁 ) 등성또는이름뒤에같이쓰이는호칭어나직책명은분리해서분석한다. 남수 /NNP+ 군 /NNB, 김 /NNP+ 씨 /NNB, 최치원 /NNP+ 옹 /NNB 케네디 /NNP+ 씨 /NNB, 정 /NNP+ 과장 /NNG, 최 /NNP+ 선생 /NNG ( 나 ) 성과이름, 호가함께쓰이면하나의단위로분석한다. 김철수 /NNP, 이태백 /NNP ( 다 ) 씨, 군 등과달리 가 ( 哥 ) 는접미사이므로, 김가 ( 金哥 ), 이가 ( 李哥 ) 는파생어이다. 김 /NNP+ 가 /XSN ( 라 ) 사람이름의뒤에 이 가붙는경우는이름과함께하나의단위로분석한다. 진현이 /NNP + 가 /JKS ( 마 ) 특정한종족의이름은고유명사가된다. 알타이족 /NNP, 피그미족 /NNP, 돌궐족 /NNP, 한족 /NNP (2) 지명 ( 가 ) 내륙, 바다, 강, 산, 산맥, 호수, 섬, 만, 계곡, 늪, 주등의이름 카스피해 /NNP, 템즈강 /NNP, 태백산맥 /NNP, 미시시피호 /NNP, 네바다주 /NNP ( 나 ) 도 ( 道 ), 시 ( 市 ), 읍 ( 邑 ), 면 ( 面 ), 리 ( 里 ), 군 ( 郡 ), 구 ( 區 ), 동 ( 洞 ), 골, 촌등의이름은 그구역의종류를나타내는말과함께전체가고유명사가된다. 서울특별시 /NNP, 성북구 /NNP, 강진군 /NNP, 인창동 /NNP, 빨래골 /NNP, 해방촌 /NNP (3) 국가명또는왕조명 ( 가 ) 국가의명칭, 또는왕조의명칭은고유명사로분석한다. 대한민국 /NNP, 조선 /NNP ( 나 ) 다른형태가붙어국가나왕조의존립기간을나타내는경우일반명사로분석한다. 대한제국기 /NNG, 조선조 /NNG ( 다 ) 남한 과 북한 을의미하는 ' 남, 북, 남북 ' 은모두일반명사와고유명사를구별한다. 남한을뜻하는 남 과북한을뜻하는 북 을고유명사로분석한다. 남 /NNP+ 과 /JKB 북 /NNP+ 의 /JKG 의견 /NNG 차이 /NNG 9

남북 /NNP 적십자회담 /NNG 북 /NNP+ 미 /NNP 회담 /NNG ( 라 ) 어떤국가의국민을나타내는 국가 + 인 은통합하여일반명사로분석한다. 이집트인 /NNG, 아제르바이젠인 /NNG, 이스라엘인 /NNG, 조선인 /NNG ( 마 ) 어떤국가의군대를나타내는 국가 + 군 은통합하여일반명사로분석한다. 미군 /NNG, 북한군 /NNG, 영국군 /NNG, 일본군 /NNG (4) 건축물이나시설물혹은구조물의이름 ( 가 ) 도로, 항만, 철도, 전철, 지하철및그명칭과함께쓰이는부대시설은그종류를나타내는말과함께전체가고유명사가된다. 부산항 /NNP, 대전역 /NNP, 서울지하철 /NNP, 테헤란로 /NNP ( 나 ) 빌딩, 박물관, 극장등건물명은그종류를나타내는말과함께전체가고유명사가된다. 서울역사 /NNP, 세종문화회관 /NNP, 개나리유치원 /NNP, 고려대학교 /NNP 국립중앙박물관 /NNP, 국립민속박물관 /NNP, 구텐베르그박물관 /NNP 신라호텔 /NNP, 미도파백화점 /NNP, 동궁예식장 /NNP, 명보극장 /NNP, 고대병원 /NNP (5) 회사, 학교, 정당, 기관이나단체의이름 ( 가 ) 특정회사나학교, 정당등의이름은고유명사로분석한다. 단, 특정회사의상품명은고유명사가아닌일반명사로취급한다. 삼성 /NNP, 고려대학교 /NNP, 한나라당 /NNP, 자유민주주의연합 /NNP 쵸코하임 /NNG, 한메타자교실 /NNG ( 나 ) 정부기관의명칭은모두일반명사로처리한다. 그러나거기에인명, 지명등의고유명사가포함된경우그통합형을고유명사로처리한다. 헌법 /NNG+ 재판소 /NNG, 대 /XPN+ 법원 /NNG, 고등 /NNG+ 법원 /NNG, 재정 /NNG+ 경제원 /NNG 서울고등법원 /NNP, 서울시경찰서 /NNP, 서대문구치소 /NNP ( 다 ) 특정기관이나단체, 연구소등의경우에는분석하는것을원칙으로한다. 그러나거기에인명, 지명등의고유명이나 전국, 국제, 세계 등이포함되면그통합형을고유명사로처리한다. 대한축구협회 /NNP, 전국은행협회 /NNP, 한국전자통신연구원 /NNP 10

생활 /NNG+ 체육 /NNG+ 연구소 /NNG, 입주자 /NNG+ 대표자 /NNG+ 협의회 /NNG ( 라 ) 약어나준말의처리고유명사가축약된형태 ( 준말 ) 로쓰일경우본디말과함께준말도인정하여축약된형태그대로를고유명사로분석한다. 그리고일반명사로분석하는기관명의약자는일반명사로분석한다. 육사 /NNP, 고대 /NNP, 자민련 /NNP, 서울고법 /NNP 정보통신위 /NNG (6) 책, 연극, 영화등의창작물의제목 삼국사기 /NNP, 손자병법 /NNP, 고래사냥 /NNP (7) 언어명 언어명의경우 - 어 의형태만을통합하여고유명사로인정한다. 한국말 과같은 경우는일반명사로분석한다. 한국어 /NNP, 일본어 /NNP, 영어 /NNP, 알타이어 /NNP, 네덜란드어 /NNP 5.2.1.1.3. 의존명사 (NNB) 의존명사는자립해서쓰일수없는명사로, 수식성분을반드시동반해야한다. 의존명사는비단위성의존명사와단위성의존명사로나뉠수있으나, 본분석에서는이를세분화하지않는다. 또한의존명사가일반명사와같이독립적으로쓰일때는일반명사로분석한다. 의존명사와일반명사의구분은표준국어대사전의등재여부에따른다. (1) 의존명사이지만, 일반명사처럼쓰이는경우 ( 가 ) 연대, 연도, 연차 는 년대, 년도, 년차 와달리모두일반명사로분석한다. 연도별로정리된자료 몇년도에일어난일 [ 연도 /NNG] [ 년도 /NNB] ( 나 ) 월, 연, 일, 주, 달러, 원 등은본래의존명사이지만, 독립되어쓰일경우모두 일반명사의자격을가지므로일반명사로분석해야한다. 나는월 30 만원을받는다. 달러의가치는 [ 월 /NNG] [ 달러 /NNG] 11

(2) 단위를나타내는표현 ( 가 ) 길이, 무게, 수효, 시간따위의수량을수치로나타내는단위들중 미터, 그램, 리터 등은의존명사 (NNB) 로, 외국어로된 m, g, l 등은기호 (SW) 로분석한다. ( 나 ) 일반명사가단위적인용법으로쓰인경우에는의존명사가아니므로주의한다. 사람, 시간, 그릇 한사람이교실로들어왔다. [ 사람 /NNG+ 이 /JKS] 자장면한그릇만주세요. [ 그릇 /NNG+ 만 /JX] (3) 것 과구어형 거 의분석 거 의형태를그대로인정하여분석한다. 그러나다른형태와의결합에서 거 의 형태가유지되지않는다면그때에는 것 으로복원하여분석한다. 공부할거를준비해왔니? 공부할걸가져왔니? 연습할건있니? 먹을게모자라다. [ 거 /NNB+ 를 /JKO] [ 것 /NNB+ ㄹ /JKO] [ 것 /NNB+ ㄴ /JX] [ 것 /NNB+ 이 /JKS] 5.2.1.2. 대명사 (NP) 대명사는그자체로는자신의본유적지시물을가지지않은채, 다만사람이나사물 등어떤대상을간접적으로지시하는품사이다. 단, 동일한대명사가방언이나고어의 이형태를가진경우에는이들도대명사로같이분석한다. (1) 1 인칭대명사 ( 가 ) 1 인칭대명사 나, 내, 우리, 저, 제, 저희 ( 나 ) 2 인칭대명사 너, 네, 그대, 당신, 댁, 어르신 ( 다 ) 기타대명사 이이, 이분, 그이, 그분, 저이, 저분, 아무, 아무개, 누구, 무엇, 뭐, 어디, 언제, 자기, 걔, 쟤, 얘, 이것, 저것, 그것, 이거, 저거, 그거, 여기, 저기, 거기, 이곳, 그곳, 저곳, 어디, 모 ( 某 ), 모모 ( 某某 ) (2) 대명사와관형사의두가지분석이가능한단어 12

( 가 ) 모 ( 某 ) 는관형사와대명사로분석될수있으므로주의를요한다. 모기업체 김모씨 [ 모 /MMD] [ 모 /NP+ 씨 /NNB] ( 나 ) 모모 ( 某某 ) 도위와같이분석될수있다. 모모가말했다 [ 모모 /NP+ 가 /JKS] 모모기관의조사를마쳤다 [ 모모 /MMD] (3) 대명사의이형태분석 ( 가 ) 이것, 그것, 저것 ; 이거, 그거, 저거 는분석하지않고대명사로인정한다. ~ 거 의경우, 다른형태와의결합에서 ~ 거 의형태가유지되지않는다면 ~ 것 으로복원한다. 난저거를먹을래. [ 저거 /NP+ 를 /JKO] 나는여태그걸믿어왔단다. [ 그것 /NP+ ㄹ /JKO] ( 나 ) 다음과같이원형을밝힐수있는대명사는원형대로분석한다. 내 이제부터는내명령을따라라. [ 나 /NP+ 의 /JKG] 내게 내게전자우편으로알려다오. [ 나 /NP+ 에게 /JKB] 네게 어제네게보낸선물이잘못되었다. [ 너 /NP+ 에게 /JKB] 제게 문제가있다면제게말씀해주세요. [ 저 /NP+ 에게 /JKB] 누가 누가전화를하는지보고해라. [ 누구 /NP+ 가 /JKS] 뉘 뉘집애기가이렇게울고있는거야? [ 누구 /NP+ 의 /JKG] 뭐가 도대체뭐가문제라는거야? [ 뭐 /NP+ 가 /JKS] ( 다 ) 뭐 는 무엇 과대등할정도로자주사용되므로그형태자체를인정해준다. 다만, 다음과같이조사와축약되었을경우에만원형으로복원해준다. 앞으로우리가뭘하자는얘기이냐? [ 무엇 /NP+ ㄹ /JKO] ( 라 ) ' 제 ' 의경우, ' 제 /NP+ 가 /JKS' 를제외하고는모두 ' 저 /NP+ 의 /JKG' 로분석한다. 제가갈것입니다. 철수는제잘못을안다. 제무게를못견디다. 제값을하다. [ 제 /NP+ 가 /JKS] [ 저 /NP+ 의 /JKG] [ 저 /NP+ 의 /JKG] [ 저 /NP+ 의 /JKG] 13

5.2.1.3. 수사 (NR) 수사는사물의수량이나차례를나타내는품사를말한다. (1) 수사의종류 ( 가 ) 양수사 하나, 둘, 셋, 넷, 다섯, 여섯, 일곱, 여덟, 아홉, 열, 스물, 서른, 마흔, 쉰, 예순, 일흔, 여든, 아흔, 백 한둘, 두서넛, 서넛, 너덧, 네다섯, 네댓, 대여섯, 예닐곱, 일여덟, 일고여덟, 열두서넛, 열대여섯, 열일고여덟, 스물두서넛 일, 이, 삼, 사, 오, 육, 칠, 팔구, 십, 백, 천, 만, 억, 조 기십, 기백, 기천, 수십, 수백, 수천, 수만, 수억, 수십만, 수백만, 수천만 ( 나 ) 서수사 첫째, 둘째, 셋째, 넷째,, 열째, 열한째,, 스물한째,, 아흔아홉째, 백째, 백한째, (2) 주의사항 ( 가 ) 복수의수사가한어절내에나타날때에는전체를통합해서분석한다. 백만오천삼십사 [ 백만오천삼십사 /NR] ( 나 ) 하나 는표준국어대사전에그품사가명사와수사로되어있지만본지침에서는 수사로분석한다. 광에가서물건하나만가져오렴. 우리는하나로뭉쳤다. [ 하나 /NR+ 만 /JX] [ 하나 /NR+ 로 /JKB] ( 다 ) 때로수사와수관형사의구별이애매한경우가있다. 임홍빈 (1998) 의견해에따르면, 다음과같은특이한형식을가진예만을수관형사로취급하고, 그밖의것들은모두수사로분석하지만, 본표준안에서는조사와결합한경우에만수사로판별한다. 임홍빈이제시한수관형사 : 한, 한두, 한두어, 두, 두어, 두세, 두서너, 세, 석, 서, 서너, 네, 너, 넉 ( 라 ) 제일, 제이 등은접두사 제- 와수사의결합으로분석한다. 14

제일, 제이, 제삼, 제사, 제오,, 제구십구, 제백, [ 제 /XPN+ 일 /NR], [ 제 /XPN+ 이 /NR], 5.2.2. 용언 용언은동사, 형용사, 지정사를가리킨다. 용언범주에서는분석대상이본용언일경우에만동사와형용사로구분하여표시하고, 보조용언의경우에는보조동사와보조형용사를구분하지않고 VX 라는하나의표지만을준다. 또한학교문법에서서술격조사로다루는 이다 는조사의범주에넣지않고 지정사 라는용언의하위범주에넣기로한다. 지정사는다시긍정지정사 (VCP) 와부정지정사 (VCN) 로세분된다. 5.2.2.1. 동사 (VV) 동사는사물의움직임이나작용을나타내는용언을말한다. 동사는일반적으로 목적어의필요성여부에따라자동사, 타동사로나누기도하지만, 본분석에서는그것을 위한별도의표지를세분하지않고모두 VV 로표시한다. 5.2.2.2. 형용사 (VA) 형용사는사물의성질이나상태를나타내는용언을가리킨다. 5.2.2.3. 보조용언 (VX) 이분석에서는보조용언을보조동사와보조형용사로하위구분하지않는다. (1) 보조용언분석원칙 ( 가 ) 보조용언의후보는표준국어대사전에그쓰임이제시되어있어야한다. ( 나 ) 보조용언앞에는반드시다른용언이위치해있어야한다. ( 다 ) 보조용언이동시에두개이상이연결되어나타날수도있다. (2) 보조용언의예와주의사항보조용언의목록은다음과같다. 이목록은표준국어대사전을참고한것이다. 가다 세월이흘러가는대로정처없이떠도는나그네 [ 가 /VX+ 는 /ETM] 가지다 15

일을그렇게해가지고는기일을맞출수없다. [ 가지 /VX+ 고 /EC+ 는 /JX] 계시다 손님께서와계십니다. [ 계시 /VX+ ㅂ니다 /EF+./SF] 나가다 정책을추진해나가는과정에서문제가생겼다. [ 나가 /VX+ 는 /ETM] 나다 아침에깨어나보니그가없어졌다. [ 나 /VX+ 아 /EC] 내다 힘들겠지만잘견뎌내야한다. [ 내 /VX+ 아야 /EC] 놓다 약속을잡아놓고출장을가다니 [ 놓 /VX+ 고 /EC] 달다 이번시험문제의정답을알려다오. [ 달 /VX+ 오 /EF+./SF] 대다 자꾸졸라대는통에그만허락해주고말았다. [ 대 /VX+ 는 /ETM] 두다 남겨둔돈도이제바닥이났다. [ 두 /VX+ ㄴ /ETM] 드리다 염려를끼쳐드려송구하옵니다. [ 드리 /VX+ 어 /EC] 들다 도무지내말은믿으려들지않는다. [ 들 /VX+ 지 /EC] 말다 어렵더라도희망을잃지말아야한다. [ 말 /VX+ 아야 /EC] 먹다 나는오늘도수업을빼먹었다. [ 먹 /VX+ 었 /EP+ 다 /EF+./SF] 못하다 그참상을차마보지는못할것이다. [ 못하 /VX+ ㄹ /ETM] 버리다 음식이다타버렸다. [ 버리 /VX+ 었 /EP+ 다 /EF+./SF] 보다 이제는새벽이오는가보다. [ 보 /VX+ 다 /EF+./SF] 빠지다 썩어빠진생선을사오다니 [ 빠지 /VX+ ㄴ /ETM] 싶다 16

너를보고싶다. [ 싶 /VX+ 다 /EF+./SF] 쌓다 꼬치꼬치물어쌓는통에정신이없었다. [ 쌓 /VX+ 는 /ETM] 아니하다 일이순리대로풀리지아니했다. [ 아니하 /VX+ 았 /EP+ 다 /EF+./SF] 않다 시간이지나도기차는오지않았다. [ 않 /VX+ 았 /EP+ 다 /EF+./SF] 오다 고향을떠나온지 10 년이지났다. [ 오 /VX+ ㄴ /ETM] 있다 그녀는검정옷을입고있었다. [ 있 /VX+ 었 /EP+ 다 /EF+./SF] 주다 아버지는아기에게동화책을읽어주었다. [ 주 /VX+ 었 /EP+ 다 /EF+./SF] 지다 한번넘어진아이는일어나는법을안다. [ 지 /VX+ ㄴ /ETM] 치우다 다섯명이 10 인분의식사를먹어치웠다. [ 치우 /VV+ 었 /EP+ 다 /EF+./SF] 터지다 끓인지오래되어서라면이불어터졌다. [ 터지 /VX+ 었 /EP+ 다 /EF+./SF] 하다 나귀를쉬게하는것이좋겠다. [ 하 /VX+ 는 /ETM] 1 다음과같은어절은보조용언으로취급되기도하나, 여기서는 의존명사 + 접사 로 분석한다. 이들앞에는항상관형어가온다는분포적인특성을중시한것이다. 양하다 / 체하다 / 척하다 / 듯하다 / 법하다 / 뻔하다 [ 양 /NNB+ 하 /XSA+ 다 /EF+./SF] 2 버릇하다 의경우에는선행성분으로관형형이오는것은아니지만, 일반명사 버릇 과크게구별되지않으므로 버릇 은명사로분석한다. 자꾸울어버릇하다. [ 버릇 /NNG+ 하 /XSV+ 다 /EF+./SF] 5.2.2.4. 지정사 (VC) 지정사는학교문법의서술격조사에대응되는것인데, 용언과같이활용한다는 특성을중시한술어이다. 여기서는학교문법의 이다 를긍정지정사로, 아니다 를부정 17

지정사로하위구분한다. 일반적으로 아니다 는형용사로다루어지기도하나, 여기서는 아니다 가 이다 의부정형이라는점을중시하여 부정지정사 로다룬다. 철수는매우우수한학생이다. [ 학생 /NNG+ 이 /VCP+ 다 /EF+./SF] 철수는모범적인학생이아니다. [ 아니 /VCN+ 다 /EF+./SF] (1) 지정사 이 /VCP 를복원해야하는경우 1 체언에어미가직접연결된경우 철수는훌륭한교사다. [ 교사 /NNG+ 이 /VCP+ 다 /EF+./SF] 2 조사에어미가직접연결된경우 우리가그를본것은서울에서다. [ 서울 /NNP+ 에서 /JKB+ 이 /VCP+ 다 /EF+./SF] 3 ~였다 그당시나는아이였다. [ 아이 /NNG+ 이 /VCP+ 었 /EP+ 다 /EF+./SF] 4 어미 '- 라고, - 라는, - 라도, - 라며, - 라면서, - 라서 나는그에게절교라고말했다. [ 절교 /NNG+ 이 /VCP+ 라고 /EC] 나는친구라는말이좋다. [ 친구 /NNG+ 이 /VCP+ 라는 /ETM] 거지라도존중해주어야한다. 그는최고라며나를추켜주었다. 그는실수라면서얼버무렸다. [ 거지 /NNG+ 이 /VCP+ 라도 /EC] [ 최고 /NNG+ 이 /VCP+ 라며 /EC] [ 실수 /NNG+ 이 /VCP+ 라면서 /EC] 너는부자라서우릴이해하지못할것이다. [ 부자 /NNG+ 이 /VCP+ 라서 /EC] 5 인용문뒤에오는 ~ 며 는지정사를복원하지않는다. 얼마나친절하나? 며 [ 친절 /NNG + 하 /XSA + 나 /EF +?/SF + "/SS + 며 /EC] 5.2.3. 수식언 5.2.3.1. 관형사 (MM) 관형사는체언앞에서그것을꾸미는품사를말한다. 관형사는지시관형사, 수관형사, 성상관형사로세분될수있다. 18

5.2.3.1.1. 성상관형사 먼저체언의성질이나상태를 어떠한 의방식으로꾸며주는구실을하는관형사를성상관형사라한다. 예를들어 새목록 에서 새 가성상관형사인데, 이는 새로운목록 에서 새로운 이라는형용사의관형사형이하는역할과비슷하다. 성상관형사의예제는다음과같다. 상태 온갖, 새, 헌, 헛, 윗, 뒷, 온, 뭇, 외딴, 참, 거짓, 순 ( 純 ) 주 ( 主 ), 정 ( 正 ), 준 ( 準 ), 대 ( 大 ), 소 ( 小 ), 정도 단지 ( 但只 ), 유독 ( 惟獨 ), 무려 ( 無慮 ), 약 ( 若 ), 5.2.3.1.2. 지시관형사 다음어떤대상을가리키는관형사를지시관형사라한다. 지시관형사에는다음과같은것들이있다. 이, 그, 저, 요, 고, 조 이런, 그런, 저런, 다른 어느, 무슨, 웬 옛, 올, 현 ( 現 ), 신 ( 新 ), 구 ( 舊 ), 전 ( 前 ), 후 ( 後 ), 래 ( 來 ) 이, 그, 저 는동일한형태가지시관형사와지시대명사로쓰인다. 예를들면, 이도저도다싫다. 에서 이, 저 는대명사이고, 저여자가이거리에서빵을판다. 에서는관형사이다. 이렇게동일한형태가있는경우, 조사와결합된경우에만대명사로판별한다. 이런, 그런, 저런 은형용사 이렇다, 그렇다, 저렇다 의활용형 이러한, 그러한, 저러한 이줄어든형식이다. 이런경우에는 이런, 그런, 저런 의형태가표준국어대사전에관형사로등재된경우에만관형사로판별한다. 5.2.3.1.3. 수관형사 수량을나타내는관형사가수관형사이다. 양 ( 量 ) 을나타내는양수관형사와 순서 ( 順序 ) 를나타내는서수관형사로나뉘지만, 본표준에서는수관형사로만구분한다. 19

수관형사는대체로단위를나타내는단위성의존명사앞에오지만, 자립명사앞에도 온다. 잣나무열그루를심었다 수관형사와수사는조사를취할수있는가에의하여구별되는데, 조사를취하면수사로판별한다. 첫째분이나의형이다. 첫째 : 수관형사 첫째로남에게친절해야한다. 첫째 : 수사 수관형사의예는다음과같다. 한, 두, 세 ( 석, 서 ), 네 ( 넉, 너 ), 다섯 ( 닷 ), 엿, 일곱, 여뎗, 아홉, 열, 열한, 열두, 열세, 열석, 열서, 스무, 스물한, 스물두, 한두, 두세, 서너, 너댓, 첫, 첫째, 둘째, 셋째, 제일 ( 第一 ), 제이 ( 第二 ), 한두째, 주어째, 몇째, 여남은째, 몇몇, 여러, (1) 주의사항 ( 가 ) 관형사는때로문맥에따라다른품사로분석될가능성이있으니문맥을잘 살펴서분석해야한다. 관형사, 명사통용 올예산이다바닥이났다. [ 올 /MMD] 올들어물가가많이올랐다. [ 올 /NNG] 관형사, 부사통용 단세명이서그일을꾸몄다. [ 단 /MMD] 단, 그일은해서는안된다. [ 단 /MAJ] 관형사, 명사, 부사통용 이내마음을어찌알리요. [ 이내 /MMD] 아침들판에이내가끼었다. [ 이내 /NNG] 그는이내떠나갔다. [ 이내 /MAG] ( 나 ) 접미사 -적( 的 ) 이붙는경우, 언어학적으로는 -적( 的 )+ 체언 의경우에는 관형사로 분류하고 -적( 的 )+ 조사 인 경우에는 명사로 분류하지만, 본 표준안에서는조사와의결합여부와관계없이모두명사로분석한다. 명사의부사적인용법 [ 부사 /NNG+ 적 /XSN+ 이 /VCP+ ㄴ /ETM] 명사의부사적용법 [ 부사 /NNG+ 적 /XSN] 20

5.2.3.2. 부사 (MA) 부사는주로용언을꾸며서그뜻을더세밀하고분명하게해주는품사를말한다. 여기서는부사를세분하지않고, 접속부사와일반부사로만나누기로한다. 5.2.3.2.1. 접속부사 (MAJ) 접속부사는문장이나단어를이어주며뒷말을꾸미는부사를말한다. 접속부사에는다음과같은것들이있다. 단어접속 : 또는, 그리고, 및, 혹은 문장접속 : 왜냐하면, 즉, 그러므로, 그러나, 하지만, 그리고 (1) 주의사항 1 접속부사는종종용언의활용형으로도쓰일수있으므로주의한다. 그래서마지막에는조심하라고했지? [ 그래서 /MAJ] 영희가그래서결석을했구나. [ 그렇 /VA + 어서 /EC] 2 ' 그리고나서 ', 그래도 의분석 그리고나서 그래도 [ 그리 /MAG+ 하 /XSV+ 고 /EC+ 나 /VX+ 서 /EC] [ 그러 /VV+ 어도 /EC] 5.2.3.2.2. 일반부사 (MAG) 접속부사를제외한나머지부사는모두일반부사로판별한다. 일반부사는문장의한성분을꾸며주는성분부사를말하며, 성상부사, 지시부사, 부정부사등으로구분할수있지만, 본표준안에서는일반부사로만구분한다. 성상부사 :' 어떻게 ' 라는방식으로용언을꾸미는부사로, ' 매우, 빨리, 잘 ' 등이있다. 지시부사 : 시간 처소, 또는특정한대상을가리키는부사로, ' 이리, 저리, 그때, 내일, 일찍, 이미 ' 등이있다. 부정부사 : 용언의뜻을부정하는부사로, ' 아니, 잘못, 못 ' 등이있다. 의성부사 : 사물의소리를표현하는부사로, ' 철썩철썩, 딸랑딸랑, 펑펑 ' 등이있다. 의태부사 : 사물의모양을표현하는부사로, ' 울긋불긋, 꾸불꾸불 ' 등이있다. 21

(1) 주의사항 1 일반부사는종종일반명사와동일형태를띠고있어구분이어려운경우가있다. 이들은뒤에조사가결합하느냐의여부와, 문맥에서후행명사를수식하느냐의 여부에따라부사와명사로분석될수있다. 너의진짜속셈이무엇인지말해봐라. [ 진짜 /NNG] 그수학문제는진짜어려웠다. 지금이공부하기딱좋은때이다. [ 진짜 /MAG] [ 지금 /NNG+ 이 /JKS] 나는지금막집에도착했다. [ 지금 /MAG] 2 부사적인용법을가졌음에도불구하고일반부사가아닌일반명사로만표준국어대사전에등재되어있는단어는오로지일반명사로만분석한다. 구석구석, 무작정, 여기저기, 오랫동안, 이곳저곳, 정작, 좌우간, 처음, 최근, 한때 3 일반부사로분석하기쉬운활용상의불완전동사인 덩달아, 더불어 는모두동사로옳게분석해야함에주의한다. 너는덩달아왜난리니? [ 덩달 /VV+ 아 /EC] 우리함께더불어살아가자. [ 더불 /VV+ 어 /EC] 4 명사 + 없이 는원칙적으로 일반명사 + 없이 /MAG 로태깅하지만, 아래와같이하나의단어로굳어져사전에등재된경우는 없이 통합형자체를하나의일반부사로분석한다. 관계없이, 그지없이, 꾸밈없이, 끊임없이, 난데없이, 남김없이등 5.2.4. 독립언 5.2.4.1. 감탄사 (IC) 감탄사는화자의부름이나느낌, 놀람이나대답을직접적으로나타내는품사를말한다. 그럼 ( 요 ), 야호, 어머, 앗, 아, 예, 그래 ( 요 ), 아니 ( 요 ), 글쎄, 참, 아이구, 와아, 오호, 세상에 (1) 주의사항 1 사람이입으로직접내는소리를대상으로하되, 흉내를내는의도가없는것과 본능적인놀람이나느낌을나타내는것을대상으로한다. 또한감탄사와혼동되는 22

부사로서음성상징어류의부사어가있는데, 이는감탄사가아닌일반부사로 분석한다. 야호! 드디어정상이다. 쿨럭쿨럭기침을했다. [ 야호 /IC+!/SF] [ 쿨럭쿨럭 /MAG] 2 동물의울음소리등은감탄사가아니라일반부사로분석한다. 검둥이는멍멍짖으며수풀속으로뛰어들어갔다. [ 멍멍 /MAG] 3 욕이나욕설을나타내는말은전체를감탄사로분석한다. 빌어먹을! [ 빌어먹을 /IC+!/SF] 4 뭐 는문맥에따라대명사와감탄사의두가지쓰임이있다. 뭔지도모른채 [ 뭐 /NP+ 이 /VCP+ 지 /EC+ 도 /JX] 신문에뭐대단한특종이라도실렸습니까? [ 뭐 /IC] 5 한어절이비정상적으로늘어나거나다른기호가개입되었을경우분석불능 범주 (NA) 로분석한다. 그러어엄 /NA, 으 ~ 어 ~ 이 /NA 5.2.5. 관계언 조사는주로체언과결합하여다른말과의문법적관계를나타내거나, 특별한뜻을 더해주는품사를말한다. 조사는크게격조사, 접속조사, 보조사로나눈다. 한글은 조사가중첩하는경우가많은데, 이러한경우조사의결합형은분리해서분석함을 원칙으로한다. 부산에서도대형사고가있었다. 그녀와의약속이갑자기잡혔다. [ 부산 /NNP+ 에서 /JKB+ 도 /JX] [ 그녀 /NP+ 와 /JKB+ 의 /JKG] 5.2.5.1. 격조사 (JK) 이는체언과다른성분간의일정한문법관계를나타내는조사이다. 5.2.5.1.1. 주격조사 (JKS) 선행체언으로하여금주어가되게하는조사이다. 이 / 가책이보인다. [ 책 /NNG+ 이 /JKS] 께서선생님께서오신다. [ 선생 /NNG+ 님 /XSN+ 께서 /JKS] ( 이 ) 서둘이서그일을꾸몄다고? [ 둘 /NR+ 이서 /JKS] 23

혼자서그일을꾸몄다고? [ 혼자 /NNG+ 서 /JKS] 께오서부대장님께오서 [ 부대장 /NNG+ 님 /XSN+ 께오서 /JKS] 께옵서 황제께옵서드나드신다. [ 황제 /NNG+ 께옵서 /JKS] 5.2.5.1.2. 보격조사 (JKC) 선행체언으로하여금서술어 되다, 아니다 의보어가되게하는조사이다. 이 / 가얼음이물이되었다. 철수는범인이아니다. [ 물 /NNG+ 이 /JKC] [ 범인 /NNG+ 이 /JKC] 5.2.5.1.3. 목적격조사 (JKO) 선행체언으로하여금목적어가되게하는조사이다. ㄹ / 을 / 를너는바람소리를들었다. [ 바람 /NNG+ 소리 /NNG+ 를 /JKO] 5.2.5.1.4. 관형격조사 (JKG) 선행체언으로하여금관형어가되게하는조사이다. 의나의친구는너하나뿐이다. [ 나 /NP+ 의 /JKG] 5.2.5.1.5. 부사격조사 (JKB) 선행체언으로하여금부사어가되게하는조사이다. ( 으 ) 로 망치로못을박아야지. [ 망치 /NNG+ 로 /JKB] ( 으 ) 로서장관으로서책임을다해야한다. [ 장관 /NNG+ 으로서 /JKB] ( 으 ) 로써돌로써지붕을만든다고? [ 돌 /NNG+ 로써 /JKB] 같이바보같이웃고다닌다. [ 바보 /NNG+ 같이 /JKB] 더러나더러이것도하라고한다. [ 나 /NP+ 더러 /JKB] 랑너랑많이닮았다. [ 너 /NP+ 랑 /JKB] ( 으 ) 로부터 TV 로부터받는영향력이너무크다. [TV/SL+ 로부터 /JKB] 마냥기영이마냥놀수만은없다. [ 기영이 /NNP+ 마냥 /JKB] 마따나네말마따나나도그래야한다. [ 말 /NNG+ 마따나 /JKB] 만큼눈물만큼콧물도흐른다니까. [ 눈물 /NNG+ 만큼 /JKB] 24

보고영자보고놀자고좀해라. 보다직관보다는논리가동원돼야한다. [ 영자 /NNP+ 보고 /JKB] [ 직관 /NNG+ 보다 /JKB+ 는 /JX] 에나는너에대해아무것도모른다. [ 너 /NP+ 에 /JKB] 에게너에게말하기싫다. [ 너 /NP+ 에게 /JKB] 에게서나는철수에게서그말을들었다. [ 철수 /NNP+ 에게서 /JKB] 에서집에서학교까지너무멀다. [ 집 /NNG+ 에서 /JKB] 에서부터연구소에서부터가게까지는너무멀다. [ 연구소 /NNG+ 에서부터 /JKB] 와 / 과경미와함께다닌다면, [ 경미 /NNP+ 와 /JKB] 처럼사람처럼행동하는동물이있다. 하고그일하고관련된사람은아무도없다. 한테그일은경비한테부탁해라 [ 사람 /NNG+ 처럼 /JKB] [ 일 /NNG+ 하고 /JKB] [ 경비 /NNG+ 한테 /JKB] 5.2.5.1.6. 호격조사 (JKV) 주로사람을가리키는체언뒤에연결되어그것으로하여금부름의대상이되게하는 조사이다. 아 호동아! 이제그만일어나거라 [ 호동 /NNP+ 아 /JKV+!/SF] 야철수야! 밥먹어라 [ 철수 /NNP+ 야 /JKV+!/SF] 여주여, 우리에게힘을주소서 [ 주 /NNG+ 여 /JKV] ( 이 ) 시여신이시여! 우리를저버리지마소서 [ 신 /NNG+ 이시여 /JKV+!/SS] (1) 주의사항 호격조사와어말어미는구분해서태깅해야한다. 저기오는것이철수야. [ 철수 /NNP+ 이 /VCP+ 야 /EF+./SF] 5.2.5.1.7. 인용격조사 (JKQ) 인용문이나인용구를, 동사에대한부사적성분으로도입하는조사이다. 고그는 " 이제가도좋다 " 고말했다. [ 좋 /VA+ 다 /EF+"/SS+ 고 /JKQ] 25

( 이 ) 라고문제가심각하다라고보고했다. [ 심각 /XR+ 하 /XSA+ 다 /EF+"/SS+ 라고 /JKQ] 하고영수는 " 이제가자 " 하고말문을닫았다. [ 가 /VV+ 자 /EF+"/SS+ 하고 /JKQ] (1) 주의사항 1 인용격조사는연결어미와구별하기어려운경우가있으므로주의한다. 철수는자기가학생이라고말했다. [ 학생 /NNG+ 이라고 /JKQ] ( ) [ 학생 /NNG+ 이 /VCP+ 라고 /EC] ( ) 철수는 다음주에놀러가도좋다 고말하였다. [ 좋 /VA+ 다 /EF+ /SS+ 고 /JKQ] ( ) [ 좋 /VA+ 다 /EF+ /SS+ 고 /EC] ( ) 2 인용격조사는형태만으로확인할수없고발화상황까지고려해야하는복잡한표지이다. 게다가인용격조사로인정되는형태인 라고, 하고 등은원래용언의활용형에불과하다. 하지만인용격조사를설정하지않을경우에는인용부호가들어간어절의처리가어색해진다. 따라서우리는인용격조사를설정하되, 그쓰임은인용부호 (,, ),, },,,...) 가있는경우로만제한하기로한다. 물론인용부호가빠진경우에는어미로분석한다. 철수는영희가좋다고말했다. [ 좋 /VA+ 다고 /EC] 5.2.5.2. 접속조사 (JC) 두단어를같은자격으로이어주는구실을하는조사를말한다. 와그아주머니는딸기와사과를샀다. [ 딸기 /NNG+ 와 /JC] 과 나 그기계는사람과컴퓨터를구별하지못한다. [ 사람 /NNG+ 과 /JC] 사과나배는모두몸에좋은과일이다. [ 사과 /NNG+ 나 /JC] 랑머루랑다래랑먹으며청산에살고싶어라. [ 머루 /NNG+ 랑 /JC] 하고이번준비물로칼하고연필을샀다. [ 칼 /NNG+ 하고 /JC] (1) 주의사항 1 함께함 의뜻을나타내는접속조사는부사격조사와형태상동일하므로주의할 필요가있다. 26

철수와영희가왔다. [ 철수 /NNP+ 와 /JC] 철수와같이놀았다. [ 철수 /NNP+ 와 /JKB] 2 표준국어대사전에조사로등재 ( 주로구어체의경우 ) 된 하며 는조사로인정하지 않고 ' 하 /VV+ 며 /EC' 로분석한다. 5.2.5.3. 보조사 (JX) 체언이나부사또는용언의연결어미나종결어미의뒤에쓰여특별한뜻을더해 주는조사를말한다. 그려 먹습니다그려. [ 먹 /VV+ 습니다 /EC+ 그려 /JX] 까지 ( 꺼정 / 까장 ) 너까지나에게이럴줄이야. [ 너 /NP+ 까지 /JX] 깨나너도사람깨나울렸겠구나. [ 사람 /NNG+ 깨나 /JX] ( 이 ) 나너나가라! [ 너 /NP+ 나 /JX] ( 이 ) 나마빵이나마먹어라. [ 빵 /NNG+ 이나마 /JX] ㄴ / 은 / 는 이종이는어제사온것이다. [ 종이 /NNG+ 는 /JX] ㄴ커녕 / 은커녕 / 는커녕돈은커녕먹을쌀도없다. [ 돈 /NNG+ 은커녕 /JX] 다그물건을거기다놓아라. [ 거기 /NP+ 다 /JX] 그물건을거기에다놓아라. [ 거기 /NP+ 에 /JKB+ 다 /JX] 다가책상을어디다가둘까요? [ 어디 /NP+ 다가 /JX] 집에다가놓아두어라. [ 집 /NNG+ 에 /JKB+ 다가 /JX] 대로 ( 대루 ) 너는너대로살아라. [ 너 /NP+ 대로 /JX] 따라오늘따라택시도안잡힌다. [ 나 /NP+ 더러 /JX] 도 / 두강아지도주인은알아본다. [ 강아지 /NNG+ 도 /JX] ( 이 ) 란 코알라란호주에사는초식동물이다. [ 코알라 /NNG+ 란 /JX] ( 이 ) ㄹ랑그일에대해선걱정일랑하지말아라. [ 걱정 /NNG+ ㄹ랑 /JX] 마다 사람마다독특한개성이있다. [ 사람 /NNG+ 마다 /JX] 마저장미마저시들고말았다. [ 장미 /NNG+ 마저 /JX] 만 밖에 인간은빵만으로살수없다. [ 빵 /NNG+ 만 /JX+ 으로 /JKB] 그래봐야죽기밖에더하랴. [ 죽 /VV+ 기 /ETN+ 밖에 /JX] 부터 / 부텀 우선노인부터태워라. [ 노인 /NNG+ 부터 /JX] 뿐가진건고작집한채뿐. [ 채 /NNB+ 뿐 /JX] 27

서껀국물이나총각김치서껀한그릇만주시오. [ 총각김치 /NNG+ 서껀 /JX] ( 이 ) 사 내사그걸이미했지. [ 내 /NP+ 사 /JX] ( 이 ) 야그가인간성이야그만이지. [ 인간성 /NNG+ 이야 /JX] ( 이 ) 야말로 사과야말로가을의과일이다. [ 사과 /NNG+ 야말로 /JX] 요나는요그림을요예쁘게그립니다. [ 나 /NP+ 는 /JX+ 요 /JX] 조차이젠집조차빼앗기는구나. [ 집 /NNG+ 조차 /JX] 치고값싼물건치고쓸만하다. [ 물건 /NNG+ 치고 /JX] (1) 보조사분석기준 보조사는 이다 의활용어미와구분하기어려운경우가있다. 흔히보조사로간주되던 몇몇형태들은연결어미와의미상의차이가없으며, 분포상으로도구별되지않기때문에 이런대상들은보조사로분석하지않는다. [ 기준 1] 대상형태가용언의어미로사용되는가. [ 기준 2] 대상형태가체언에후행할때서술어의자격을가지고사용되는가. ( 가 ) [ 기준 1, 2] 에부합하는다음의형태들은모두 연결어미 로분석한다. ( 이 ) ㄴ들, ( 이 ) ㄴ즉, ( 이 ) 든, ( 이 ) 든지, ( 이 ) 라도, ( 이 ) 라서, ( 이 ) 라야 ( 나 ) [ 기준 1, 2] 에부합하지않는다음의형태들은 보조사 가된다. ( 이 ) 나마, ( 이 ) 야, ( 이 ) ㄹ랑, ( 이 ) 야말로, ( 이 ) 란 ( 다 ) [ 기준 1] 에부합하지않으나, [ 기준 2] 에는부합하는형태는 중의성 을가진다. ( 이 ) 나, ( 이 ) 요 ( 라 ) 다음의형태는서술격조사 이다 의활용형과는관계가없으므로모두보조사가된다. 까지, 깨나, 는 ( 은 / ㄴ ), 대로, 도, 따라, 마다, 마저, 만, 말고, 밖에, 부터, 뿐, 조차, 치고, ㄴ커녕 28

(2) 주의사항 ( 가 ) 다음의형태들은분석결과에중의성이생기므로, 이들을분석할때는특히주의해야한다. ( 이 ) 란코알라란동물은호주에주로서식한다. [ 코알라 /NNG+ 이 /VCP+ 란 /ETM] 코알라란매우귀여운동물이다. [ 코알라 /NNG+ 란 /JX] ( 이 ) 나밥이나빵을먹도록해라. [ 밥 /NNG+ 이나 /JC] 그가비록열심히하나능력은부족하다. [ 하 /VV+ 나 /EC] 어제내가술을마셨나? [ 마시 /VV+ 었 /EP+ 나 /EF+?/SF] ( 이 ) 야 철수야그일을할수있지? [ 철수 /NNP+ 야 /JX] 내가 좋아하는 것은 철수야. [ 철수 /NNP+ 이 /VCP+ 야 /EF+./SF] 철수야! 부르는소리 [ 철수 /NNP+ 야 /JKV] ( 이 ) 요 밥을먹다가요 [ 먹 /VV+ 다가 /EC+ 요 /JX] 밥이요빵이요 [ 밥 /NNG+ 이 /VCP+ 요 /EC] ( 나 ) 종결어미 + 요 ( 보조사 ) 는종결어미로통합하여분석한다. 마음이예쁜사람은좋아하는사람이많으니까요. [ 많 /VA+ 으니까요 /EF+./SF] ( 다 ) 비종결어미 + 요 ( 보조사 ) 는통합하지않고각각분석해준다. 제가몸이좀아파서요지각을했어요. [ 아프 /VA+ 아서 /EC+ 요 /JX] 내가요, 왜요 [ 내 /NP+ 가 /JKS+ 요 /JX], [ 왜 /MAG+ 요 /JX] ( 라 ) 말고 는용언 말다 의활용형으로처리한다. 돈말고지혜가필요하다. [ 돈 /NNG+ 말 /VV+ 고 /EC] 5.2.6. 의존형태 5.2.6.1. 어미 (EM) 5.2.6.1.1. 선어말어미 (EP) 용언이활용할때, 어간과어말어미사이에나타나는것으로높임법이나시제, 양태를 나타내는문법적인요소이다. 선어말어미의목록은연구자에따라다를수있으나이 분석에서는아래의것만을선어말어미로인정한다. 29

- 겠 - 그일은내일처리하겠다. [ 처리 /NNG+ 하 /XSV+ 겠 /EP+ 다 /EF+./SF] -( 으 ) 시 - 선생님께서손수만드신 [ 만들 /VV+ 시 /EP+ ㄴ /ETM] - 옵 - 어머님께선물을받치옵고 [ 받치 /VV+ 옵 /EP+ 고 /EC] - 았 / 었 - 우리가먹었던음식에문제가있다. [ 먹 /VV+ 었 /EP+ 던 /ETM] - 았었 / 었었 - 거기는우리가전에갔었던곳이야. [ 가 /VV+ 았었 /EP+ 던 /ETM] (1) 주의사항 1 선어말어미가한음절로통합된경우에는각각분리해서분석한다. -셨- 그일은어머니께서하셨다. [ 하 /VV+ 시 /EP+ 었 /EP+ 다 /EF+./SF] 2 다음의선어말어미는그어간이생략되었을경우에어간을복원해준다. -겠- 이것은그대로두어야겠다. [ 두 /VV+ 어야 /EC+ 하 /VX+ 겠 /EP+ 다 /EF+./SF] -았/ 었-철수가그것을가져오랬다. [ 가져오 /VV+ 라 /EC+ 하 /VV+ 았 /EP+ 다 /EF+./SF] -시- 선생님께서가자시오. [ 가 /VV+ 자 /EC+ 하 /VV+ 시 /EP+ 오 /EF+./SF] 3 위의선어말어미가포함되지않은어미형태는그대로연결어미로분석한다. -랠까-, -대야-, -래야- 5.2.6.1.2. 종결어미 (EF) 용언의어간이나선어말어미뒤에연결되어용언의형식을완성시키는어미로서한문장을끝맺는역할을하는어미이다. 그러나종결어미가문장의종결에만사용되는것은아니고, 문맥에따라서는연결어미로쓰이기도한다. 본지침에서는 SF 앞에서만종결어미를인정한다. - 게그만한돈이있으면좋게. [ 좋 /VA+ 게 /EF+./SF] - 구나넌정말멋지구나! - ㄴ가이것이무엇인가? [ 멋지 /VA+ 구나 /EF+!/SF] [ 무엇 /NP+ 이 /VCP+ ㄴ가 /EF+?/SF] - ㄴ걸이제시작인걸. [ 시작 /NNG+ 이 /VCP+ ㄴ걸 /EF+./SF] - ㄴ다이건말도안된다. - 나자네그리로가나? - 냐키가얼마나크냐? [ 되 /VV+ ㄴ다 /EF+./SF] [ 가 /VV+ 나 /EF+?/SF] [ 크 /VA+ 냐 /EF+./SF] 30

- 네정말큰일났네! [ 나 /VV+ 았 /EP+ 네 /EF+!/SF] - 느냐그것보다이것이낫느냐? [ 낫 /VA+ 느냐 /EF+?/SF] - 는걸그는벌써갔는걸. [ 가 /VV+ 았 /EP+ 는걸 /EF+./SF] - 는구나앞이잘안보이는구나. [ 보이 /VV+ 는구나 /EF+./SF] - 구려당신도가시겠구려. - 는구려잘도먹는구려. [ 가 /VV+ 시 /EP+ 겠 /EP+ 구려 /EF+./SF] [ 먹 /VV+ 는구려 /EF+./SF] - 는구먼공부를잘하는구먼. [ 잘 /MAG+ 하 /XSV+ 는구먼 /EF+./SF] - 는다아이가글을잘읽는다. - 는도다짐이조서를내리는도다. - 다그게사실이다. [ 읽 /VV+ 는다 /EF+./SF] [ 내리 /VV+ 는도다 /EF+./SF] [ 사실 /NNG+ 이 /VCP+ 다 /EF+./SF] - ㄹ게그렇게할게. [ 하 /VV+ ㄹ게 /EF+./SF] - ㅂ니까이제야옵니까? - ㅂ니다이렇게합니다. [ 오 /VV+ ㅂ니까 /EF+?/SF] [ 하 /VV+ ㅂ니다 /EF+./SF] - 세제대로좀하세. [ 하 /VV+ 세 /EF+./SF] - 습니까그래도되겠습니까? [ 되 /VV+ 겠 /EP+ 습니까 /EF+?/SF] - 습니다정말재미있습니다. - ㅂ시다다시만납시다. - ㅂ시오서둘러주십시오. [ 재미있 /VA+ 습니다 /EF+./SF] [ 만나 /VV+ ㅂ시다 /EF+./SF] [ 주 /VX+ 시 /EP+ ㅂ시오 /EF+./SF] - 아라 / 어라 웃기지말아라. [ 말 /VX+ 아라 /EF+./SF] - 으냐물이얼마나깊으냐? [ 깊 /VA+ 으냐 /EF+?/SF] - 은가그것이좋은가? [ 좋 /VA+ 은가 /EF+?/SF] - 자밥먹으러가자! [ 가 /VV+ 자 /EF+!/SF] - 오 / 으오 / 소물이깨끗하오. [ 깨끗 /XR+ 하 /XSA+ 오 /EF+./SF] - ㅂ디다 / 습디다참좋은곳입디다. [ 곳 /NNB+ 이 /VCP+ ㅂ디다 /EF+./SF] - 거든나는이것이좋거든! [ 좋 /VA+ 거든 /EF+!/SF] - ㄴ걸 / 은걸 - ㄹ걸 / 을걸 힘이꽤센걸. [ 세 /VA+ ㄴ걸 /EF+./SF] 모른다고할걸. [ 하 /VV+ ㄹ걸 /EF+./SF] - ㄹ까이제밥을할까? - 다오그가가지고있다오. [ 하 /VV+ ㄹ까 /EF+?/SF] [ 있 /VX+ 다오 /EF+./SF] - 다네일을망쳤다네 [ 망치 /VV+ 었 /EP+ 다네 /EF+./SF] - 다구돈이많다구? [ 많 /VA+ 다구 /EF+?/SF] - 다니까돈이없다니까! [ 없 /VA+ 다니까 /EF+!/SF] 31

-냐고/ 느냐고그가누구냐고? -도다꽃이아름답도다. -다니무엇을읽었다니? -는가그가집에있는가? [ 누구 /NP+ 이 /VCP+ 냐고 /EF+?/SF] [ 아름답 /VA+ 도다 /EF+./SF] [ 읽 /VV+ 었 /EP+ 다니 /EF+?/SF] [ 있 /VV+ 는가 /EF+?/SF] - ㅂ디까 / 습디까보기에좋습디까? [ 좋 /VA+ 습디까 /EF+?/SF] - 다면서술은싫다면서? - 다나그도가겠다나. [ 싫 /VA+ 다면서 /EF+?/SF] [ 가 /VV+ 겠 /EP+ 다나 /EF+./SF] - 렴 / 으렴맘대로해보렴. [ 보 /VX+ 렴 /EF+./SF] - 려무나책이나읽으려무나. [ 읽 /VV+ 으려무나 /EF+./SF] - 라니까그사람이아니라니까. [ 아니 /VCN+ 라니까 /EF+./SF] - 자잠이나자자. - 세일이나하세. [ 자 /VV+ 자 /EF+./SF] [ 하 /VV+ 세 /EF+./SF] - 자꾸나약속을좀미루자꾸나. [ 미루 /VV+ 자꾸나 /EF+./SF] - 자니까그만따지자니까. - 지그가언제오지? [ 따지 /VV+ 자니까 /EF+./SF] [ 오 /VV+ 지 /EF+./SF] - 아 / 어 / 여밥먹어! [ 먹 /VV+ 어 /EF+!/SF] - ㅁ세 / 음세 그날꼭옴세. [ 오 /VV+ ㅁ세 /EF+./SF] - 단다애들이다쳤단다. [ 다치 /VV+ 었 /EP+ 단다 /EF+./SF] - 니그게없니? [ 없 /VA+ 니 /EF+?/SF] (1) 주의사항 ( 가 ) 종결어미 + 요 는통합해서종결어미로분석한다. 말씀대로했는걸요. [ 하 /VV+ 았 /EP+ 는걸요 /EF+./SF] ( 나 ) - 세요 는다음과같이선어말어미까지분석한다. 어서출근하세요. [ 출근 /NNG+ 하 /XSV+ 시 /EP+ 어요 /EF+./SF] ( 다 ) - 죠 는축약형을그대로태깅한다. 어서출근하죠. [ 출근 /NNG+ 하 /XSV+ 죠 /EF+./SF] 5.2.6.1.3. 연결어미 (EC) 용언의어간이나선어말어미뒤에연결되어용언의형식을완성시키는어미로서 문장을종결시키지못하고뒤에오는절을연결시켜주는어미를말한다. - 거나누가오거나알은체할것없다. [ 오 /VV+ 거나 /EC] - 거니비가오겠거니생각했다. [ 오 /VV+ 겠 /EP+ 거니 /EC] 32

- 건대내가보건대, 네말이옳다. [ 보 /VV+ 건대 /EC] - 고일을하고밥을먹자. [ 하 /VV+ 고 /EC] - 곤숙제한것도빌려가곤한다. [ 빌리 /VV+ 어 /EC+ 가 /VX+ 곤 /EC] - 느니앉아서걱정하느니나가서하겠다. - 든지외모가어떠하든지무슨상관인가? [ 걱정 /NNG+ 하 /XSV+ 느니 /EC] [ 어떠하 /VA+ 든지 /EC] - 며노래하며춤을춘다. - 면서푸르면서검은물빛 - 자마자오자마자당했다. [ 노래 /NNG+ 하 /XSV+ 며 /EC] [ 푸르 /VA+ 면서 /EC] [ 오 /VV+ 자마자 /EC] - 락오르락내리락 [ 오르 /VV+ 락 /EC] - 거든가거든말해라. [ 가 /VV+ 거든 /EC] - 거늘이미늦었거늘어찌빨리가는가? - 건마는말렸건마는아직도축축하다. [ 늦 /VV+ 었 /EP+ 거늘 /EC] [ 말리 /VV+ 었 /EP+ 건마는 /EC] - 고자병을낫고자몸부림쳤다. - 기에실수했기에용서해주었다. [ 낫 /VV+ 고자 /EC] [ 실수 /NNG+ 하 /XSV+ 았 /EP+ 기에 /EC] - ㄴ다손 / 다손밉다손치더라도구박하지말자. [ 밉 /VA+ 다손 /EC] - ㄴ다기에 앞으로잘한다기에승낙했다. [ 하 /VV+ ㄴ다기에 /EC] - ㄴ데 / 는데예쁜데미워한다. [ 예쁘 /VA+ ㄴ데 /EC] - ㄴ들 / 는들 간다한들아주갈까? [ 하 /VV+ ㄴ들 /EC] - ㄴ즉배가고픈즉속이쓰리다. [ 고프 /VA+ ㄴ즉 /EC] ㄴ지라 / 는지라눈이온지라길이미끄럽다. [ 오 /VV+ ㄴ지라 /EC] - 나눈이오나비가오나같다. [ 오 /VV+ ㄴ나 /EC] - 나니멀리보이나니넓은들이로다. [ 보이 /VV+ 나니 /EC] - 나마맛이좋지못하나마많이드십시오. [ 못하 /VX+ 나마 /EC] - 노니묻노니, 포부가무엇이냐? [ 묻 /VV+ 노니 /EC+,/SP] -는다기에빵을먹는다기에주었다. [ 먹 /VV+ 는다기에 /EC] -니멍하니서있다. [ 멍하 /VA+ 니 /EC] -니까웃기니까좋다. [ 웃기 /VV+ 니까 /EC] -다가자랑하다가망신당했다.[ 자랑 /NNG+ 하 /XSV+ 다가 /EC] - 다기에그녀가예쁘다기에보러왔소. - 대도시간이있대도만나주질않는다. [ 예쁘 /VA+ 다기에 /EC] [ 있 /VV+ 대도 /EC] - 더라도가더라도꼭돌아와라. [ 가 /VV+ 더라도 /EC] - 던들진작알았던들방법을취했지. [ 알 /VV+ 았 /EP+ 던들 /EC] - 도록미치도록일했다. [ 미치 /VV+ 도록 /EC] - 되싸우되꼭지도록해라. [ 싸우 /VV+ 되 /EC] 33

- ㄹ뿐더러비가올뿐더러바람도분다. [ 오 /VV+ ㄹ뿐더러 /EC] - ㄹ수록갈수록태산이다. [ 가 /VV+ ㄹ수록 /EC] - ㄹ지비가얼마나올지천둥이다친다. [ 오 /VV+ ㄹ지 /EC] - ㄹ지라도이길지라도명예롭지는않다. [ 이기 /VV+ ㄹ지라도 /EC] - ㄹ지언정 죽을지언정그일은못하겠다. [ 죽 /VA+ 을지언정 /EC] - 라고바보라고생각한다. [ 바보 /NNG+ 이 /VCP+ 라고 /EC] - 랍시고그는반장이랍시고행패만부린다. [ 반장 /NNG+ 이 /VCP+ 랍시고 /EC] - 러청소하러가자. [ 청소 /NNG+ 하 /XSV+ 러 /EC] - 려웃으려한다. [ 웃 /VV+ 으려 /EC] - 려니와비용도문제려니와일꾼도문제다. [ 문제 /NNG+ 이 /VCP+ 려니와 /EC] - 련마는보면반가우련마는볼수가없네. - 면지옥이존재하면만원일것이다. [ 반갑 /VA+ 련마는 /EC] [ 존재 /NNG+ 하 /XSV+ 면 /EC] - 므로비가오므로가지않겠다. [ 오 /VV+ 므로 /EC] -아도/ 어도암만봐도모르겠다. [ 보 /VV+ 아도 /EC] -아서/ 어서덫을놓아서꿩을잡았다. [ 놓 /VV+ 아서 /EC] -아야이일은잘해야한다. [ 잘 /MAG+ 하 /XSV+ 아야 /EC] -으나밥을먹으나마나이다. [ 먹 /VV+ 으나 /EC] -으나마맛은없으나마많이드세요. [ 없 /VA+ 으나마 /EC] - 지마는비가오지마는가야한다. [ 오 /VV+ 지마는 /EC] - 게개를굶게하지마라. [ 굶 /VV+ 게 /EC] - 고일단먹고보자. [ 먹 /VV+ 고 /EC] - 아 / 어입을막아버렸다. [ 막 /VV+ 아 /EC] - 지우기지못해버렸다. [ 우기 /VV+ 지 /EC] (1) 주의사항 ( 가 ) 어미에따라서는분석의중의성이생길수있으므로문맥확인을통해 형태분석을결정한다. 너는내가왔는데기쁘지도않니? [ 오 /VV+ 았 /EP+ 는데 /EC] 내가지금있는데가어디지? [ 있 /VV+ 는 /ETM+ 데 /NNB+ 가 /JKS] 다들만족하는지아무런불평이없다. [ 만족 /NNG+ 하 /XSV+ 는지 /EC] 너를만난지도꽤오래구나. [ 만나 /VV+ ㄴ /ETM+ 지 /NNB+ 도 /JX] 34

( 나 ) '- 음직 ' 은 음직 /EC 로분석한다. 그러나 바람직, 먹음직 등은그자체가하나의 어근이므로더이상분석할수없다는것에유의한다. 어른답고믿음직하게행동해라. 그것참먹음직스럽다. 그것은매우바람직한일이다. [ 믿 /VV+ 음직 /EC+ 하 /VX+ 게 /EC] [ 먹음직 /XR+ 스럽 /XSA+ 다 /EF+./SF] [ 바람직 /XR+ 하 /XSA+ ㄴ /ETM] 5.2.6.1.4. 명사형전성어미 (ETN) 한문장의성격을임시로바꾸어다른문장속에서명사적인역할을하게하는어미를 말한다. - 기그일은정말중요하기때문이다. [ 중요 /XR+ 하 /XSA+ 기 /ETN] - ㅁ /- 음장사는신용을얻음이제일이다. [ 얻 /VV+ 음 /ETN+ 이 /JKS]] (1) 주의사항 ( 가 ) 불규칙용언어간에명사형전성어미가붙어있을경우 -음 이아닌 -ㅁ 으로분석한다. 김철수지음 [ 짓 /VV+ ㅁ /ETN] ( 나 ) 음, 기 가붙은말이단순히명사형이냐아니면굳어진명사이냐하는것은물론문맥에따라결정되어야하지만먼저그것이 사전 에등재되어있느냐의여부를살펴보아야한다. 책을읽기가어렵다. [ 읽 /VV+ 기 /ETN+ 가 /JKS] 읽기교육이문제가된다. [ 읽기 /NNG] 5.2.6.1.5. 관형사형전성어미 (ETM) 용언의성격을임시로바꾸어다른문장속에서관형사적인역할을하게하는 어미이다. - ㄴ / 은 어제먹은빵에이상이있었다. [ 먹 /VV+ 은 /ETM] - 는읽어버린물건을찾는일은요즘은어렵다. [ 찾 /VV+ 는 /ETM] - 던이제까지미루던일을오늘해치웠다. [ 미루 /VV+ 던 /ETM] 35

- ㄹ / 을나에게는아직처리할일이있다. [ 처리 /NNG+ 하 /XSV+ ㄹ /ETM] - 런어제런듯하다. [ 어제 /NNG+ 이 /VCP+ 런 /ETM] (1) 주의사항 ( 가 ) 불규칙용언어간에관형사형전성어미가있을경우 - 은, - 을 이아닌 - ㄴ, - ㄹ 로분석한다. 그녀의고운얼굴 [ 곱 /VA+ ㄴ /ETM] 그녀는매우아름다울것이다. [ 아름답 /VA+ ㄹ /ETM] ( 나 ) 종결어미에이어서전성어미가올경우통합해서전성어미로처리한다. 어느쪽에더비중을두느냐는것이 [ 두 /VV+ 느냐는 /ETM] 5.2.6.2. 접두사 (XP) 접두사는명사와수사에결합하는접사류를묶어서체언접두사만을설정하기로한다. 5.2.6.2.1. 체언접두사 (XPN) 명사접두사에는한자어계접두사와고유어계접두사가있는데, 그목록의풍부함에비해대개가생산성이그리높지않다. 일단여기서는비교적생산성이높다고인정되는접두사와, 접두사를분리했을경우단일한표제어로등재될수있는경우에한해서접두사분석을하기로한다. 가 ( 假 ) 고 ( 高 ) 과 ( 過 ) 구 ( 舊 ) 날 노 ( 老 ) 대 ( 大 ) 맏 맨 무 ( 無 ) 미 ( 未 ) 반 ( 反 ) 가건물고물가과보호구소련날음식노부부대선배맏아들맨몸무의식미완성반독재 36

범 ( 汎 )) 부 ( 不 ) 불 ( 不 ) 비 ( 非 ) 생 ( 生 ) 소 ( 小 ) 신 ( 新 ) 왕 ( 王 ) 재 ( 再 ) 저 ( 低 ) 제 ( 第 ) 준 ( 準 ) 초 ( 超 ) 최 ( 最 ) 친 ( 親 ) 탈 ( 脫 ) 폐 ( 廢 ) 풋 피 ( 被 ) 한 헛 범세계부도덕불합리비논리생김치소강당신정당왕족발재충전저임금제 13 차준전시초만원최고급친러시아탈냉전시대폐광산풋살구피고소인한가운데헛고생 5.2.6.3. 접미사 (XS) 파생접미사에는어기의품사를바꾸는것과그렇지않은것이있는데, 이들을별도로 구별하여표지를부여하지는않는다. 5.2.6.3.1. 명사파생접미사 (XSN) 명사파생접미사는명사나다른어근에후행하여그것이명사의기능을수행할수있도록만들어주는의존형태이다. 그러나명사파생접미사는연구자에따라그목록이다르며, 실제로도구분이애매한경우가많다. 본분석에서는접미사의생산성과접미사를제외한형태의독립성을기준으로다음과같이목록을마련하였다. 37

가 ( 價 ) 매매가 가 ( 哥 ) 김가 경 ( 頃 ) 두시경 계 ( 系 ) 몽고계 계 ( 界 ) 교육계 광 ( 狂 ) 메모광 권 ( 圈 ) 운동권 권 ( 權 ) 참정권 당 ( 當 ) 한사람당 대 ( 臺 ) 억대 댁 ( 宅 ) 청주댁 론 ( 論 ) 비평론 별 ( 別 ) 가구별 여 ( 餘 ) 삼십여 류 ( 類 ) 자연류 률, 율 ( 率 ) 경쟁률 리 ( 裡 ) 비밀리 분 ( 分 ) 분량 일인분 분 ( 分 ) 3 분의 산 ( 産 ) 중국산 상 ( 上 ) 역사상 생 1( 生 ) 갑자생 생 2( 生 ) 견습생 성 ( 性 ) 인간성 시 ( 視 ) 영웅시 용 ( 用 ) 전쟁용 적 ( 的 ) 사상적 형 ( 型 ) 기본형 형 ( 形 ) 도시형 제 ( 制 ) 봉건제 층 ( 層 ) 선수층 치 ( 値 ) 보름치 풍 ( 風 ) 복고풍 화 ( 化 ) 도구화 38

기 께 꼴 끼리 꾼 네 님 들 들이 배기 뻘 씩 장이 쟁이 쯤 질 짜리 째 1 째 2 치레 기름기 10 분께십원꼴전우끼리노름꾼동이네선생님우리들 1l들이열살배기조카뻘만원씩간판장이심술쟁이내일쯤서방질백원짜리이틀째옹기째인사치레 투성이먼지투성이 (1) 주의사항 ( 가 ) 명사파생접미사인 -들 은그분포가매우다양하여일부에서는이를보조사와접미사로나누어분석하기도한다. 그러나, 본분석에서는이들을모두명사파생접미사로처리한다. 먹고들 의 -들 도선행성분이어미이긴하나, 일치하는대상은선행하는명사로해석할수도있기때문이다. 사람들이우리집에왔다. 그들은밥을먹고들싶었다. [ 사람 /NNG+ 들 /XSN] [ 먹 /VV+ 고 /EC+ 들 /XSN] ( 나 ) - 님 은다음과같이세가지의분석중의성을가지므로주의해서분석한다. 임 의의미로쓰인경우 : 보통명사 님과이별하다. [ 님 /NNG+ 과 /JKB] 39

사람의 이름 이나 성 뒤에서쓰인경우 : 의존명사 김철수님께서오셨습니다. [ 김철수 /NNP+ 님 /NNB+ 께서 /JKS] 그밖의경우 : 명사파생접미사 과장님이부르십니다. [ 과장 /NNG+ 님 /XSN+ 이 /JKS] 5.2.6.3.2. 동사파생접미사 (XSV) 동사파생접미사는어기또는어근에붙어서그것을동사로만들어주는기능을갖는접미사이다. 여기서는그러한접미사중현재생산성을가지고쓰이는것만을인정하여분석한다. 당하아군이공격당하는데에는이유가있다. [ 공격 /NNG+ 당하 /XSV+ 는 /ETM] 되아침식사가이미준비되어있었다. [ 준비 /NNG+ 되 /XSV+ 어 /EC] 시키오늘강아지를운동시키려고공원에나갔다. [ 운동 /NNG+ 시키 /XSV+ 려고 /EC] 하외국에서공부하는일이쉬운것은아니다. [ 공부 /NNG+ 하 /XSV+ 는 /ETM] 5.2.6.3.3. 형용사파생접미사 (XSA) 형용사파생접미사는어기나어근에붙어서그것을형용사로파생시키는접미사이다. 여기서는그러한접미사중현재생산성을가지고쓰이는것만을인정한다. 답 사람이사람답게행동해야사람이지 [ 사람 /NNG+ 답 /XSA+ 게 /EC] 되 자식된도리로어떻게그런짓을.. [ 자식 /NNG+ 되 /XSA+ ㄴ /ETM] 롭 어려운일일수록슬기롭게대처하라. [ 슬기 /NNG+ 롭 /XSA+ 게 /EC] 스럽 그녀의 사랑스러운 표정을 보거라. [ 사랑 /NNG+ 스럽 /XSA+ ㄴ /ETM] 하 멍청한표정을짓지말아라. [ 멍청 /XR+ 하 /XSA+ ㄴ /ETM] (1) 주의사항 표준국어대사전에따라, 기존에접미사로분석하던 만하 의지침을변경하여, 만 을 보조사로, 하 를동사로분석한다. 만하 는 만 /NNB+ 하 /XSA' 로분석되는경우도 있으므로주의해야한다. 40

그일을처리하는데철수만한인재가없다 [ 철수 /NNP+ 만 /JX+ 하 /VV+ ㄴ /ETM] 이음식은먹을만하다. [ 먹 /VV+ 을 /ETM] [ 만 /NNB+ 하 /XSA+ 다 /EF+./SF] 5.2.6.4. 어근 (XR) 국어에는하나의단어가조사에의해분리되는현상이있다. 즉, 파생된용언에서보조사등의삽입에의해어근과접사가분리되는현상이있다. 지금까지알려진형태소분석표지에서는이들에대해적절한표지를제공하지못한채어근을명사등의범주속에포함시켜왔다. 그러나, 세종표준안에서는어근단위에대한표지를설정하였으므로이들에어근이라는표지를할당할수있다. 따뜻도하다 [ 따뜻 /XR+ 도 /JX] [ 하 /VV+ 다 /EF] (1) 주의사항 ( 가 ) 본표준안에서는용언의어근인데, 보조사와결합되거나독립적인어절로 사용되는경우에만어근으로분석하고, 하다, 거리다, 대다 등과결합해서 용언으로사용되는경우는통합형으로전체를용언으로분석한다. 듬직하다 취하다 아른거렸다 따뜻도하다 [ 듬직하 /VV + 다 /EF] [ 취하 /VV+ 다 /EF] [ 아른거리 /VV + 었 /EP + 다 /EF] [ 따뜻 /XR+ 도 /JX] [ 하 /VV+ 다 /EF] 마포로정체극심 [ 마포 /NNP+ 로 /JKB 정체 /NNG 극심 /XR] ( 나 ) 어근으로분석되는대상은표준국어대사전에표제어로등록된어근만을대상으로 한다. 5.2.7. 기호 5.2.7.1. 일반기호 (ST) 영문이나한자, 기호등이어절중간에개입하여올바른분석이불가능한경우에는 각각의요소를분리하여분석한다. 이경우표지를줄수없는불완전한형태가생길수 있다. 41

이크로소프트 (microsoft) 사 [ 마이크로소프트 /NNP+ (/SS + microsoft/sl + )/SS + 사 /NNG] 농 수산물 초 중 고 [ 농 /NNG+ /SP+ 수산물 /NNG] [ 초 /NNG + /SP + 중 /NNG + /SP + 고 /NNG] 5.2.7.1.1. 마침표, 물음표, 느낌표 (SF) SF 대상은다음과같다. 기본적으로 1 바이트심볼이대상인데, 유니코드와그래픽문자로존재하는다른코드이지만형태가동일한심볼도대상으로고려한다. 마침표 :. 물음표 :? 느낌표 :! (1) 주의사항 ( 가 ). 의경우에는문장종료를나타내는경우에만 SF 로분석하고, 나열형이나숫자중간에사용되는경우에는 SP 로분석한다. ( 나 )? 와! 의경우에는문장종료를나타내는경우와이모티콘이나다른의미로문장중간에서사용되는경우에도모두 SF 로분석한다. 5.2.7.1.2. 쉼표, 가운뎃점, 콜론, 빗금 (SP) SP 대상은다음과같다. 기본적으로 1 바이트심볼이대상인데, 유니코드와그래픽문자로존재하는다른코드이지만형태가동일한심볼도대상으로고려한다. 쉼표 :, 가운뎃점 :. ㆍ 콜론 : : ː : 빗금 : / / 5.2.7.1.3. 따옴표, 괄호표, 줄표 (SS) SS 대상은다음과같다. 기본적으로 1 바이트심볼이대상인데, 유니코드와그래픽 문자로존재하는다른코드이지만형태가동일한심볼도대상으로고려한다. 따옴표 : ` " 42

괄호표 : ( ) { } [ ] < > < > 줄표 : _ - _ 5.2.7.1.4. 줄임표 (SE) SE 대상은다음과같다. 기본적으로 1 바이트심볼이대상인데, 유니코드와그래픽 문자로존재하는다른코드이지만형태가동일한심볼도대상으로고려한다. 줄임표 :.. (1) 주의사항 ( 가 ) 동일한줄임표기호가동이한어절에연속적으로나오는경우에는전체를 1 개의형태소로분석한다. 맞춘다.. [ 맞추 /VV + ㄴ다 /EF +../SE] 5.2.7.1.5. 붙임표 ( 물결 )(SO) SO 대상은다음과같다. 기본적으로 1 바이트심볼이대상인데, 유니코드와그래픽 문자로존재하는다른코드이지만형태가동일한심볼도대상으로고려한다. 물결 : ~ 5.2.7.1.6. 기타기호 (SW) SW 는일반기호하위분류의세분화된기호외의나머지기호를모두대상으로한다. 세부기호에포함되지않는그래픽문자와이모티콘등도모두기타기호에해당된다. 5.2.7.2. 외국어 (SL) SL 대상은한글, 한자를제외한모든외국어가대상이된다. 예를들면, 영어, 일본어 등이다. SL 은각외국어의의미와상관없이동일한어절에연속적으로나타난동일 외국어를 1 개의형태소로분석한다. 43

5.2.7.3. 한자 (SH) SH 는모든한자를대상으로한다. 한자의의미와상관없이동일한어절에연속적으로 나타난한자를 1 개의형태소로분석한다. 5.2.7.4. 숫자 (SN) SN 은모든숫자가대상이된다. 기본적으로 1 바이트숫자가대상인데, 유니코드와 그래픽문자로존재하는다른코드이지만형태가동일한숫자도대상으로고려한다. 동일한어절에연속적으로나타난숫자를 1 개의형태소로분석한다. 5.2.7.5. 분석불능범주 (NA) 그자체가사전에등재되어있지도않으면서, 축약의정도가심하거나분석하기 어려운방언형의경우분석불능범주로처리한다. 담배가쪼매턴게하마자라서빼나? [ 쪼매턴게 /NA] 6. 기타 6.1. 준말 준말은, 그것이본딧말과대등하게사용되고분석결과가동일한어절단위를형성할경우에한해서만복원한다. 그러나다음에서처럼, 본딧말로복원할경우어절수에변화가생길뿐아니라본딧말로복원하는정도가일관성을띠지않게되는경우는굳이복원하지않는다. 그러나, 이러한원칙이모든경우에일관적으로적용될수있는것은아니다. 결국준말의처리는해당어절에따라임의적일수있다. 라는 [ 라는 /ETM] ( ) [ 라고 /JKQ+ 하 /VV+ 는 /ETM] ( ) 6.2. 합성어 합성어는표준국어대사전에등재되어있는것만을인정한다. (1) 주의사항 44

( 가 ) 표제어가사전의표제어로등록되어있는경우는그대로분석한다. 정치권력 ( 사전 : 정치 - 권력 ) [ 정치권력 /NNG] ( 나 ) 합성어로등재되어있되띄어쓰기를허용한합성어는세분하여분석하는것을 원칙으로한다. 학생운동 ( 사전표기 : 학생 ^ 운동 ) [ 학생 /NNG+ 운동 /NNG] ( 다 ) 합성어로등록되어있지않은표제어는분리해서분석하되, 사전표제어로등록되어있는최대한많은음절수의단어를생성하도록나눈다. 즉다음예와같은경우 3 음절어휘가생성되는첫번째분석을취한다. 언어학과 [ 언어학 /NNG+ 과 /NNG] (3 음절 +1 음절 ) 언어학과 [ 언어 /NNG+ 학과 /NNG] (2 음절 +2 음절 ) ( 라 ) 3 음절어휘와같이어느쪽으로나뉘어도음절수가같고, 양쪽분석이모두사전 표제어라면뒤쪽을먼저분석한다. 차창밖 [ 차 /NNG+ 창밖 /NNG] 이등품 [ 이 /NR+ 등품 /NNG] 45

부록 참고문헌 [1] 21세기세종계획, 형태분석말뭉치구축지침 (Ver. 2005-1), 2005. [2] 한국정보통신기술협회 (TTA), 품사부착말뭉치작성용품사태그세트표준 (TTA.KO-11.0010), 1999. [3] 서울대학교, 꼬꼬마형태소분석기, http://kkma.snu.ac.kr/ [4] 카이스트, 한나눔한국어형태소분석기, http://kldp.net/projects/hannanum [5] 권오욱, 정유진, 김미영, 류동원, 이문기, 이종혁, 음절단위 CYK 알고리즘에기반한형태소해석기및품사태거, 제1회한국어형태소분석기및품사태거평가워크숍논문집, 76-88 (1999) [6] 조용환, 형태소분석기 MORAN, http://www.moransoft.co.kr/ [7] 윤준태, 이충희, 김선호, 송만석, 연세대형태소분석기 morany : 말뭉치로부터추출한대량의어휘데이터베이스에기반한형태소분석, 1999년도제11회한글및한국어정보처리학술대회및제1회형태소분석기및품사태커평가워크숍, pp.92-98, 1999. [8] 김준석, 심준혁, 이근배, 품사태그세트의매핑을이용한한국어품사태거 (POSTAG) 이식, 1999년도제11회한글및한국어정보처리학술대회및제1회형태소분석기및품사태커평가워크숍, pp. 484-490, 1999. [9] 심광섭, 초고속한국어형태소분석기 MACH 1.0/2.0, http://cs.sungshin.ac.kr/~shim/demo/mach.html [10] 강승식, HAM: 한국어형태소분석라이브러리, http://nlp.kookmin.ac.kr/ham/kor/ham-intr.html 46

표준작성공헌자 표준번호 : 이표준의제정 개정및발간을위해아래와같이여러분들이공헌하였습니다. 구분성명위원회및직위연락처소속사 표준 ( 과제 ) 제안 최미란 메타데이터프로젝트그룹위원 miranc@etri.re.kr ETRI 표준초안작성자 최미란 메타데이터프로젝트그룹위원 miranc@etri.re.kr ETRI 표준초안에디터 최미란 메타데이터프로젝트그룹위원 miranc@etri.re.kr ETRI 표준초안검토 서태설 메타데이터프로젝트그룹의장외프로젝트그룹 tsseo@kisti.re.kr KISTI 위원 표준안심의 박승민 소프트웨어 / 콘텐츠기술위원회의장 minpark@etri.re.kr ETRI 외기술위원회위원 사무국담당 김영화부장 ykim@tta.or.kr TTA 이상호선임 sangho.lee@tta.or.kr TTA 47

정보통신단체표준 ( 국문표준 ) 형태소태깅말뭉치작성용품사태그세트 (Part-of-Speech Tag Set for Morphological Annotation of Written Texts) 발행인 : 한국정보통신기술협회회장발행처 : 한국정보통신기술협회 463-824, 경기도성남시분당구분당로 47 Tel : 031-724-0114, Fax : 031-724-0109 발행일 : 2015.06.