정보 사회와 컴퓨터

Similar documents
제5장 형태소분석


자연언어처리

2002년 2학기 자료구조

도약종합 강의목표 -토익 700점이상의점수를목표로합니다. -토익점수 500점정도의학생들이 6주동안의수업으로 점향상시킵니다. 강의대상다음과같은분들에게가장적합합니다. -현재토익점수 500점에서 600점대이신분들에게가장좋습니다. -정기토익을 2-3번본적이있으신분

자연언어처리

<28C3D6C1BE29C7D1B1B9BEEEB9AEB9FDB7D028317E D E687770>

Naver.NLP.Workshop.SRL.Sogang_Alzzam


강의계획서 과목 : JUN s TOEIC 700+( 도약 ) 2017년 3차강사 : 황준선 교재 : ETS 토익기본서 (RC&LC)+ 수업부교재 (JUN s TOEIC 700+) + 품사별추가문제 +Mini Test 수업목표 : LC & RC 필수기본전략수립및 GRAM

기철 : 혜영 : 기철 : 혜영 : ㄴ ㅁ ㅇ ㄴ ㅁ ㅇ ㅇ ㄴ ㅁ ㅇ

2016 년 1 학기국어학개론 형태론 (Morphology): 형태소와교체, 단어의구성요소 1. 형태론의개념과분야 1) 개념 : 단어의구조를연구하는분야 2) 분야 : (1) 단어형성법 ( 조어법 ) (2) 굴절법 ( 屈折法, inflection): 조사나어미가붙어문법적

서만설명되는이형태 1 과거시제를나타내는 -았-/-었- 은음운론적조건에따른교체양상을보이는데, 하 - 와결합할때는 -였- 으로바뀌게된다. -았-~-었- -였- 2 명령형어미 (-아라/-어라) 는형태소 하- 와결합할때음운론적조건에따라 -아라 가연결되지않고 -여라 가연결되며,

<BBE7C8B8C0FBC0C7BBE7BCD2C5EBBFACB1B820C3D6C1BEBAB8B0EDBCAD2E687770>

슬라이드 1

SW

1 SW

PHP & ASP

BOX

<C7D1B1B9C7D0BFACB1B820C1A63532C1FD28BABBB9AE E687770>

KCC2011 우수발표논문 휴먼오피니언자동분류시스템구현을위한비결정오피니언형용사구문에대한연구 1) Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion

Microsoft PowerPoint - WordNet(수업발표자료) 이인근

1수준

7.1 형태소 개념형태소 ( 形態素, morpheme) 는문법단위중에서의미를가진최소의단위 (minimal meaningful unit) 이다. 여기서의미는어휘적의미뿐만아니라문법적의미도포함된다. 사랑 을 ㅅ-ㅏ-ㄹ-ㅏ-ㅇ 응로쪼개면각각의요소들은아무런의미를가지지못하는것처럼

국어 순화의 역사와 전망

#1. 문법공부를위한필수! 기본용어 음운체계 1. 모음 : 음절 ( 소리마디 ) 을이룰수있는독립적인소리 하늘 땅 사람 [ 天地人 ] 삼재로기본 3 글자를만들고, 가획하여다른글자를만듦 1 단모음 : 소리내는중에입술모양이나혀의위치가고정되어달라지지않는모음 혀의최고점의위치앞

05 ƯÁý

슬라이드 1

04 Çмú_±â¼ú±â»ç

수능에문법더하기 3 다음중이중피동이사용된사례가아닌것은? 1 창문이커튼으로가려졌다. 4 < 보기 > 는외래어표기법의일부이다. 이를바탕으로제시된발음정보를탐구했을때, 그내용으로적절하지않은 2 산너머에구름이보여졌다. 것은? 3 그녀의기억속에서잊혀졌다. 4 그사기꾼이경찰에게잡혀

<Hit The Sheep> 양을 치자! 교육청 문법 고퀄해설!!


종류 보통명사 고유명사 어떤속성을지닌대상들에두루쓰이는 이름 전기용품, 꼬마, 눈등 특정한하나의개체를다른개체와 구별하기위해쓰이는이름 수남이, 청계천, 세운상가 대명사, 즉선행명사구를다시받을때, 일반적인대명사와다른형태를취하는것을재귀칭이라부른다. 저, 저희, 당신, 자기 하

Microsoft PowerPoint - [2009] 02.pptx

형태소란뜻을가진최소의단위이다. 예를들어 먹었다 와 먹겠다 를비교해보면, -었- 을넣으면과거의의미가있고, -겠- 은미래혹은의지의의미를담고있다. 그러므로선어말어미는형태소로취급해야한다. 사랑스럽다, 적막하다, 번쩍거리다 와같이용언의어근중어간과일치하지않는 사랑-, 적막-, 번


PowerPoint 프레젠테이션

< C617720BBF3B4E3BBE7B7CAC1FD20C1A632B1C72E687770>

S U M M A C U M L A U D E J U N I O R 중학국어문법연습을소개합니다. 2 문법을벌써공부해야하는가? 국어의문법은변하지않고, 정해져있습니다. 따라서중학교시기에배우는문법개념들이고등학교시기에배우는개념들과이어지고, 이는수능

정답과해설 본문 02 부록 25 중등문법


♡BASIC1 1강-8강♡


SNU =10100 =minusby by1000 ÇÁto0.03exÇÁto0.03exÇÁ=10100 =minusby by1000 ·Îto0.03ex·Îto0.03ex·Î=10100 =minusby by1000 ±×to0.

유의사항 Information marking example 1 3 4

SNU =10100 =minusby by1000 ÇÁto0.03exÇÁto0.03exÇÁ=10100 =minusby by1000 ·Îto0.03ex·Îto0.03ex·Î=10100 =minusby by1000 ±×to0.



Microsoft Word - src.docx


<Hit The Sheep> - 양을 치자! 교육청 문법 선별 4탄 (고퀄해설)

PowerPoint 프레젠테이션

3장 어휘분석

Ruby 프로그래밍 5 한글 자소 처리

4장 질의 언어

1. 단어의분류 1. 품사 : 성질이공통된단어들을모아서분류한범주 ( 형태 / 기능 / 의미 ) => 단어의선천적인기질을가지고분류 2. 품사의분류 기능 의미 - 체언 명사 대명사 주격조사 수사 보격조사 목적격조사 - 관계언 조사 격조사 부사격조사 보조사 관형격조사 접속조

3 < 보기 > 를참고할때, 밑줄친부분의발화성격이다른하나는? 4 < 보기 > 를바탕으로 관형어 에대해탐구한다고할때, 그내용으로적절하지않은것은? 발화는맥락에따라 명령, 요청, 제안, 약속, 경 다른사람들은어디있지? 고, 축하, 위로, 칭찬, 비난 등의실제적인행위를 형제지

The Korean Alphabet:

<3234B1C75F34C8A35FB1B3C1A4BABB2831C2F720BFCFBCBABABB292DBCF6C1A42E687770>

<B8AEC6F7C6AEBAE4BEEE20C0CEBCE2>

<323620B1E8B0E6C0CF2DB3B2BACFC7D120B9E6BCDBBEF0BEEEC0C720C2F7C0CCBFA120B4EBC7D120B1E2C3CA20BAD0BCAE2E687770>

08( ) CPLV15-64.hwp

????-???_???-???? hwp

PowerPoint 프레젠테이션

<C3D6C0E7C3B528BAB8B5B5C0DAB7E1292D322E687770>


저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

23 Lesson 1. What are you going to do tomorrow? [개념강의] 24 Lesson 1. What are you going to do tomorrow? [실전강의 A] 25 Lesson 1. What are you going to do

<Hit The Sheep> 양을 치자! 교육청 문법 고퀄해설 7탄

소프트웨어개발방법론

[1 강 ] 2017 학년도사관학교 1 차시험문법기출분석 [ 관련개념정리하기 ] - 2 -

중학영어듣기 1학년

전산학부전공과목이수요건 (2015 학년도이전입학생학사과정용 ) 공통이수요건은반드시따로확인하시기바랍니다. 졸업이수학점 : 총 130 학점이상이수 ( 특이사항 ) 기초선택이수요건 : - 기초선택교과목으로선형대수학개론을반드시포함하여야하며, 복수전공이수자는선형대수학개론을반드시

ÃѼŁ1-ÃÖÁ¾Ãâ·Â¿ë2

PowerPoint 프레젠테이션

<BCF6B4C9BFA120C7CABFE4C7D120B8F0B5E720B9AEB9FD E687770>

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

Microsoft PowerPoint - CSharp-10-예외처리

<B1E2C8B9B3EDB4DC325FC0D3C0BBC3E25FB1B9C1A6BDC3C0E5C1A2B1D92E687770>

Microsoft PowerPoint - kandroid_for_HI-CNU.ppt

화판_미용성형시술 정보집.0305

src.xls

<28C6EDC1FD FBBF5B1B9BEEEBBFDC8B C3D6C1BE2E687770>

Next Generation Search Engines ( 차세대검색엔진의발전방향및전망 ) 박민우

10-2 삼각형의닮음조건 p270 AD BE C ABC DE ABC 중 2 비상 10, 11 단원도형의닮음 (& 활용 ) - 2 -


ȸ¿ø»ç¸®½ºÆ®

Windows 8에서 BioStar 1 설치하기

Rabbi ( 김기덕) 학력 ) 한양대학교사범대학졸업 - 국어교육, 교육학전공 조교 1 재림 약력 ) 오르비클래스국어과강사 대치, 교대오르비학원출강 미금, 영통명인학원출강 저서 ) 국어영역마스터키 ( 지공신공) 훈련도감비문학, 문학 ( 쏠티북스) 학력 ) 서울대학교약력

#7단원 1(252~269)교

< FBBF5B1B9BEEEBBFDC8B028BABDC8A3295FC3D6C1BEBABB2E687770>

<B0B3BFE42E687770>

(지도6)_(3단원 074~101)

<31C7D0B3E25FB1B9BEEE5F34B4DCBFF820B1B3BEC828BAF1BBF3B1E8292E687770>

7 주차강의목표 NEW TOEIC WRITING Chapter 1 토익라이팅테스트 Question 6-7 Respond to a written request: 이메일답변작성하기 - 유형별접근하기 - Writing tips: Strategies for Successful


pagoda21.com/pagodatoeic 319_Part 5 [ 문법 : 어휘 = 21 : 전치사, 3 2 문장구조 / 수일치, 2 명사, 2 형용사, 2 부사, 2 대명사, 2 접속사, 2 1 태, 1 관계사, 1 부정사, 1 분사, 1 0 시제, 0

<4D F736F F D20C7D1B3AAB4AE20C7D1B1B9BEEE20C7FCC5C2BCD220BAD0BCAEB1E220B8C5B4BABEF E646F6378>


Transcription:

17. 전자사전구축 2002 년 7 월 국민대학교컴퓨터학부 강승식

목차 1. 전자사전의필요성 2. 전자사전종류 : 분석 / 변환 / 생성등 3. NLP에필수적인사전정보 4. 사전구조와탐색방법 5. 맺음말 2009-03-03 2

전자사전을구축하는이유? 형태소분석의예 < 입력어절, 분석결과 > 기분석사전 < 단어, 품사정보 > + 규칙 + 기분석사전 기계번역의예 < 원시문장, 대역문장 > 기번역사전? < 원시언어단문, 목적언어단문 > + 규칙 < 단어, 대역어 > + 규칙 2009-03-03 3

사전의용도 전자사전과기존사전 (I) 일반용, 학생용, 컴퓨터용, NLP 용 사전정보내용 뜻풀이위주 ( 백과사전식 ), NLP 용 사전정보표현방식 인간위주, 컴퓨터프로그램위주 2009-03-03 4

전자사전과기존사전 (II) NLP 목적의사전 복합조사 / 어미, 시소러스등 NLP 사전의특징 사람 : 통계적 / 경험적지식을갖추고있다컴퓨터 : 통계적 / 경험적지식을사전에수록 < 예 > 가는, 가시는 의형태소분석 예외처리사전 or 예외규칙의필요성 2009-03-03 5

사전 vs. 규칙 사전의모든내용을규칙으로표현가능 모든규칙은사전으로구축할수있다. 사전 or 규칙으로표현 적용범위의넓고좁음에따라결정 처리의효율성과편의성을고려 기억공간의효율성고려 2009-03-03 6

전자사전종류 : 분석 / 생성 형태소분석 문법형태소, 어휘형태소, 복합어사전 (?), 사용자사전, 기분석사전등 구문 - 의미분석 문장패턴사전, 의미사전, 중의성해결사전 (?) 등 생성 : 생성사전, paraphrase 사전 (?) 2009-03-03 7

전자사전 : 응용 S/W 정보검색, 자동색인시소러스, 불용어 맞춤법검사 / 교정분야별전문용어사전, 인명 / 지명사전, 속어 / 은어사전, 철자교정사전등 기계번역대역어사전, 변환사전, 중의성해결등 자연언어이해 : 개념어사전? 2009-03-03 8

형태소분석사전예 가 N:VI RG:VX 가가 N 가가례 N 가가호호 ADV:N... 가감 DEIV:DOTV:N... 가격 N 가격표 N 가결 DEIV:DOIV:DOTV:N 가결의 DEIV:DOTV:N 가경 DODJ:N 2009-03-03 9

형태소생성사전예 알다 V REG <NEG 모르다 > 사랑하다 V YEO <PAS 에게 사랑받다 > 그러나 ADV SENTMOD 너무 ADV VERBMOD 일찍이 ADV VPMOD 를가로질러 POST MWPOST 에관하여 POST MWPOST 때문에 POST PWORD 2009-03-03 10

한영변환사전예 가늘다 (SBJ slender ( 글씨 writing) ( 목 neck) ( 팔 arm)... fine ( 모래 sand) ( 베 linen) ( 비 rain)... delicate ( 뼈 bones) IDM sharp ( 끝 : 이 =: ㄴ ) slender in the middle ( 가운데 : 가 =: ㄴ ) tapering ( 차츰 :b =: 어지는 ) a fine pointed fountain pen ( 촉 : 이 =: ㄴ만년필 :p) sharpen A:OBJ thin ( 끝 : 을 =: 게하 : 다 ) make A:OBJ thin (A: 을 =: 게하 : 다 ) sharpen a pencil ( 끝 : 을 =: 게깎 : 다 ) with *POS eyes halfclosed ( 눈 : 을 =: 게뜨고 ) live on a slim income (=: 게먹 : 고살 : 다 ) DFT thin) 2009-03-03 11

영한변환사전예 give (vt < 주다 > OBJ OBJ: 을전하다 (information 정보 ) (knowledge 지식 ) OBJ: 을베풀다 (favor 은혜 ) (kindness 친절 )... OBJ: 을열다 (party 잔치 )... vi < 주다 > IDM A: 을발하다 (give forth A) A: 을야기시키다 (give rise to A) A: 을낳다 (give birth to A) A: 을포기하다 (give up A) [if A = (smoking 담배 ) or (drinking 술 ) then V = 끊다 ] [if A = (habit 버릇 ) then V = 그만두다 ] ) 2009-03-03 12

영어 WordNet 동의어집합 synset 품사 : 명사, 동사, 형용사, 부사 어휘수 : 83,000 여개 명사 57K, 동사 11K, 형용사 13K, 부사 1.7K synset 개수 : 59,000 여개 명사 41K, 동사 7K, 형용사 10K, 부사 0.9K 2009-03-03 13

영어 WordNet 예 sugar Sense 2 : <sugar, refined sugar> => <sweetening> => <foodstuff> => <food, nutrient> => <substance, matter> => <object, inanimate object> => <entity> 2009-03-03 14

한국어 WordNet 예 기계 Sense 1 : < 기계, 단순기계 > => < 기계적장치 > => < 장치 > => < 수단 > => < 인공물 > => < 물건, 무생물, 실제물 > => < 실체 > 2009-03-03 15

영어 WordNet : synset 항목 Antonym : 반대어 synset 포인터 Hypernym : 상위개념 synset 포인터 Hyponym : 하위개념 synset 포인터 Meronym : 부분개념 synset 포인터 Holonym : 소속개념 synset 포인터 Entailment : 연어 synset 포인터 Troponym : 동사의구문형식 Pertainym: 수식어구 2009-03-03 16

사전의부작용? 사전어휘수 반드시많다고좋은것은아니다! 사전정보세분화 세분화할수록좋은것은아니다! 사전정보과잉성 많은정보가수록된다고좋은것은아니다! 2009-03-03 17

사전의부작용예 어휘수 : 형태소분석시 하고 명사 법의 명사 망의 명사 복합명사분해정확도가낮아진다! 품사세분화 : 형태소분석시 체언 : 명사 / 대명사 / 수사 / 의존명사구분? 불필요한정보 시스템이복잡해지고사전의크기만커진다! 2009-03-03 18

어휘수와사전정보 어휘수가많을수록좋다! 빈도수등사전정보가충분히수록된다면... ( 필요에따라소규모사전으로변환이가능하므로 ) 사전정보를세분화할수록좋다! 계층적분류등에의해특정목적에적합하게상위범주정보들로변환이가능하다면... 다양한목적으로사용되는범용사전구축 2009-03-03 19

NLP 에서꼭필요한정보 모든경우에대한 data list 예 : 복합조사, 어절유형, 아 / 어 의이형태 일반규칙과예외처리 부사의수식대상은부사, 형용사? 매우빨리, 매우빠르다부사, 형용사사과또는 / 및배??? 농사를짓는한편, 농사를지었다??? 유형별, 특성별로 grouping : 태그셋 2009-03-03 20

형태소태그 : 형태소분석용 체언, 동사, 형용사, 부사, 독립언 체언 ( 명사, 대명사, 수사, 의존명사 ) 세분화? 독립언 ( 관형사, 감탄사 ) 구분필요성? -하다, -되다, -시키다, -답다, -스럽다? 형태소분석용도에따라다르다. 체언, 독립언 : 분석결과출력할때만... 기계번역시, 명사만추출시, 파싱시 2009-03-03 21

대분류중분류소분류 체언 용언 수식언 독립언 접사 조사 어미 명 사 대명사 수 사 의존명사 동 사 형용사 보조용언 부 사 관형사 감탄사 접두사체언접미사용언화접미사조사 어말어미 선어말어미 단일명사복합명사외래어미등록명사 인칭대명사지시대명사 수사아라비아숫자 일반의존명사단위의존명사자동사타동사일반형용사존재형용사보조동사보조형용사일반부사접속부사지시관형사수관형사성상관형사감탄사 접두사체언접미사용언화접미사격조사보조사접속조사종결어미연결어미전성어미선어말어미 2009-03-03 22

형태소태그 : 어절유형용 N1. PTN_N 체언 /* N/PN/NM/XN/CN/UN/AS/HJ/ET */ N2. PTN_NJ 체언 + 조사 N3. PTN_NSM 체언 + 용언화접미사 + 어미 N4. PTN_NSMJ 체언 + 용언화접미사 + ㅁ / 기 + 조사 N5. PTN_NSMXM 체언 + 용언화접미사 + 아 / 어 + 보조용언 + 어미 N6. PTN_NJCM 체언 + 에서 / 부터 / 에서부터 + 이 + 어미 V1. PTN_VM 용언 + 어미 V2. PTN_VMJ 용언 + ㅁ / 기 + 조사 V3. PTN_VMCM 용언 + ㅁ / 기 + 이 + 어미 V4. PTN_VMXM 용언 + 아 / 어 + 보조용언 + 어미 V5. PTN_VMXMJ 용언 + 아 / 어 + 보조용언 + ㅁ / 기 + 조사 A1. PTN_AID 단일어 /* 부사, 관형사, 감탄사 */ A2. PTN_ADVJ 부사 + 조사 /* 빨리도 */ X1. PTN_NVM 체언 + 동사 + 어미 /* 밥먹다 */ 2009-03-03 23

형태소태그 : 결과생성용 조사의이형태정보 이가 / 을를 / 와과 / 은는, 이 / 으 / 에탈락여부, 에게 / 게 / 께 / 한테 어말어미의이형태정보 아 / 어 : 아 / 어 / 여 / ㅏ / ㅓ / ㅕ / ㅐ / 돼 / 러, 아 / 어탈락 ㄴ / ㄹ / ㅁ / ㅂ : 으 탈락정보 ㄹ / ㅁ 시작어미 : 으 탈락정보 선어말어미 : 았 / 었, ( 으 ) 시 2009-03-03 24

형태소태그 : 아 / 어 이형태 EOMI_VAR_Wb -- 아 EOMI_VAR_Wf -- 어 EOMI_VAR_Wj -- 여 : 여 / 거 / 너 / 러 / 라 EOMI_VAR_Wb_tal -- 아 탈락 EOMI_VAR_Wf_tal -- 어 탈락 EOMI_VAR_b -- ㅏ EOMI_VAR_f -- ㅓ EOMI_VAR_j -- ㅕ EOMI_VAR_c -- ㅐ : 해서, 하얘서 ( ㅎ불 ) EOMI_VAR_lc -- ㅙ : 되다 만적용 EOMI_VAR_Ib,If -- 라 / 러 : 러 불규칙 2009-03-03 25

형태소분석 : 빈도정보 어휘형태소빈도정보 문법형태소빈도정보 어절유형빈도정보? 어절유형쌍의공기정보 형태론적중의성해결에활용! 2009-03-03 26

가시는 형태소분석중의성예 가동사 + 시선어말어미 + 는어말어미가시명사 + 는조사가시동사 + 는어말어미갈동사 + 시선어말어미 + 는어말어미 접두사 / 접미사분리중의성 대 + 동강, 흥부 + 가, 철수 + 가 2009-03-03 27

NLP 에서불필요한정보? 모든경우를포괄하지못하는정보 < 예 > 하다 / 되다 / 스럽다 등 형태로결정되는정보 < 예 > 은 / 는, 이 / 가 의구분정보 적용범위가매우좁은규칙 < 예 > 푸 불규칙 거의발견되지않는어휘나규칙 < 예 > 하고, 법의, 망의 2009-03-03 28

부족할때문제 사전정보의양면성 분석 / 생성정확도가낮아진다. 과다할때문제 분석 / 생성정확도가낮아질수있다. 적절한수준은... 시행착오과정에서발견? 2009-03-03 29

사전구축접근방식 Top-down 방식 Bottom-up 방식 기계번역을위한의미중의성해결 1. 기계번역시스템에서중의성어휘수집 2. 각경우에대한해결방안모색 3. 여러경우를고려하여의미표지설정 2009-03-03 30

사전탐색기법 선형탐색 (linear search) : non-sorted dic 이진탐색 (binary search) : sorted dic 해싱기법 (hashing) : 스펠러사전 트라이 (trie) 구조 : 동일한탐색속도 오토마타구조 : 자소 / 음절단위 계층적구조 : WordNet 2009-03-03 31

사전의구조 (I) 평균탐색속도가가장빠른구조 기억공간의크기도고려 빈도수에따른사전 / 규칙 1. 초고빈도어사전 (Ultra-high Freq. Dic) 2. 고빈도어사전 (High Freq. Dic) 3. 저빈도어사전 (Low Freq. Dic) 4. 초저빈도어사전 (Ultra-low Freq. Dic) 2009-03-03 32

사전의구조 (II) 사전탐색편의성에따라 품사별사전 길이별사전 품사별, 길이별사전 역순사전 2009-03-03 33

사전의구조 (III) 선형적구조 : < 어휘, 태그 > 쌍 프레임구조 : < 어휘, 프레임 > 쌍 DDL(Dic. Description Language) 규칙과사전의중간형태기계번역변환사전의미중의성해결사전? 2009-03-03 34

전자사전을구축할때 전자사전의목적을명확히한다. 범용 ( 모든정보 ), 특정용도 전자사전이어떤역할을하는지 형태소분석, 파싱, 의미분석, 중의성해결등 어떤정보들을기술할것인지 실제로어떻게활용될것인지 2009-03-03 35

전자사전의구축방향 범용사전구축 : 바람직한방향 다양한응용목적충족목적 / 기능에따라재가공루틴제공 통계 - 경험정보의중요성 규칙의범용성, 빈도정보, 예외처리등 모든정보는개별적으로추출가능 : MRD 2009-03-03 36

향후과제 구문표지와의미표지설정 생성규칙의빈도정보 : 통계적파싱 구조중의성, 의미중의성해결정보 연어정보의설정및기술방법 2009-03-03 37

맺음말 사전정보설정의중요성 다양한활용목적에적합하게설정유형별 / 특성별로 grouping : 부사유형계층적 ( 대 / 중 / 소분류 ) 으로융통성있게 각응용분야에대해구체적으로정의 각유형들에대한모든 data list 일반규칙과예외규칙의구분 2009-03-03 38

맺음말 시행착오에의한 feedback 예 : 형태소태그형태소분석 : 불필요하게많음파싱고려 (?): 충분한지 vi/vt 구분 2009-03-03 39