자연언어처리

Similar documents
untitled

EA0015: 컴파일러

Microsoft PowerPoint - chap5.ppt

PART

Part Part

£01¦4Àå-2

½ºÅ丮ÅÚ¸µ3_³»Áö

272*406OSAKAÃÖÁ¾-¼öÁ¤b64ٽÚ

170

006- 5¿ùc03ÖÁ¾T300çÃâ

Ch 23 - Supplement

자연언어처리

PowerPoint Presentation

n 정의 정규표현 (Regular Expression) n 정규문법 G 를대수학적인성질로표현 n 정규언어에속해있는스트링의모양을직접기술 n 정규문법은문법이나타내는언어의형태를체계적으로구하여정규표현으로나타낼수있음. 정규문법 (Regular ) 정규표현 (Regular ) 유

chap 5: Trees

<B8AEC6F7C6AEBAE4BEEE20C0CEBCE2>


#KM-250(PB)

Microsoft PowerPoint - PLT_ch04_KOR

푸른21탄소중립행사내지확정

#KM-250š

Chapter 4. LISTS

Microsoft PowerPoint - PL_03-04.pptx

원위부요척골관절질환에서의초음파 유도하스테로이드주사치료의효과 - 후향적 1 년경과관찰연구 - 연세대학교대학원 의학과 남상현

PowerSHAPE 따라하기 Calculate 버튼을 클릭한다. Close 버튼을 눌러 미러 릴리프 페이지를 닫는다. D 화면을 보기 위하여 F 키를 누른다. - 모델이 다음과 같이 보이게 될 것이다. 열매 만들기 Shape Editor를 이용하여 열매를 만들어 보도록

CONTENTS SUMMARY PART 1 MARKET MARKET STRATEGY MARKET ISSUE MARKET ISSUE PART 2 CREDIT CREDIT ISSUE CREDIT ISSUE CREDIT ISSUE CREDIT ISSUE CREDIT STRA

컴파일러

산선생의 집입니다. 환영해요

중간코드생성

Semantic Consistency in Information Exchange

2015 경제ㆍ재정수첩

chap8.PDF

Observational Determinism for Concurrent Program Security

untitled



4.18.국가직 9급_전산직_컴퓨터일반_손경희_ver.1.hwp

#KM560

#한국사문제7회4급

전용]

³»Áö¼öÁ¤

# KM

형식 언어

(......).hwp

MAX+plus II Getting Started - 무작정따라하기

#KM-235(110222)

April 2014 BROWN Education Webzine vol.2 생명을 꿈꾸다 목차 From Editor 아침에는 다리가 4개,점심에는 2개, 저녁에는 3개인 것은? Guidance 익숙해지는 일상 속에서 우리아이 자립심 키우기 환경을 지키는 아이들의 좋은 습

歯RCM

- 이 문서는 삼성전자의 기술 자산으로 승인자만이 사용할 수 있습니다 Part Picture Description 5. R emove the memory by pushing the fixed-tap out and Remove the WLAN Antenna. 6. INS

?

KCC2011 우수발표논문 휴먼오피니언자동분류시스템구현을위한비결정오피니언형용사구문에대한연구 1) Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion

01_60p_서천민속지_1장_최종_출력ff.indd

12Á¶±ÔÈŁ

2011년 10월 초판 c 2011 Sony Corporation. All rights reserved. 서면 허가 없이 전체 또는 일부를 복제하는 것을 금합니다. 기능 및 규격은 통보 없이 변경될 수 있습니다. Sony와 Sony 로고는 Sony의 상표입니다. G L

슬라이드 1

PowerPoint 프레젠테이션

<30352DC0CCC7F6C8F B1B3292DBFACB1B8BCD2B1B3C1A42E687770>

국문요약 한국 중 근세사회의 농법과 수리시설의 변화, 발달과정 등을 문헌 자료 검토와 발굴 보고서 분석을 통해 정리하였다. 고려시대의 경지이용방식은 文宗代 田品 규정에서 볼 때 1년 또는 2년 休閑法이었다. 벼 경작법이 고려말에 이르러 休閑法에서 連作法으로 변화 발전하

#KM-350AB..

<32B1B3BDC32E687770>

<BFB9BCFAB0E6BFB5C1F6BFF8BCBEC5CD5F BFB9BCFAB0E6BFB520C4C1BCB3C6C FB3BBC1F628C3D6C1BEBBF6BAAFC8AF292E706466>

**더모바일10월호_N0.13

2

#KLZ-371(PB)

**더모바일04호_N0.7

**더모바일03호_N0.6

#DPK5(PB)(9.8.19)

RVC Robot Vaccum Cleaner

유의사항 Information marking example 1 3 4

UML

Microsoft PowerPoint - ch09 - 연결형리스트, Stack, Queue와 응용 pm0100

12¾ÈÇö°æ 1-155T304®¶ó

¹Ì¼ú-°¢·ÐÁß¿ä³»¿ëb74öÁ¤2š

KM-380BL,BLB(100908)

화판_미용성형시술 정보집.0305

기사스크랩 (160504).hwp

6. Separate HDD by pulling in the arrow direction. * Cautions Avoid lifting HDD excessively, because Connector can be damaged ODD Remove

step 1-1

아니라 일본 지리지, 수로지 5, 지도 6 등을 함께 검토해야 하지만 여기서는 근대기 일본이 편찬한 조선 지리지와 부속지도만으로 연구대상을 한정하 기로 한다. Ⅱ. 1876~1905년 울릉도 독도 서술의 추이 1. 울릉도 독도 호칭의 혼란과 지도상의 불일치 일본이 조선

<31325FB1E8B0E6BCBA2E687770>

05-28-여름-기고

whitepaper6-KR

#KM-340BL

C++-¿Ïº®Çؼ³10Àå

**더모바일11월호_N0.14

목차 BUG 문법에맞지않는질의문수행시, 에러메시지에질의문의일부만보여주는문제를수정합니다... 3 BUG ROUND, TRUNC 함수에서 DATE 포맷 IW 를추가지원합니다... 5 BUG ROLLUP/CUBE 절을포함하는질의는 SUBQUE

Service-Oriented Architecture Copyright Tmax Soft 2005

PowerPoint 프레젠테이션


VOL /2 Technical SmartPlant Materials - Document Management SmartPlant Materials에서 기본적인 Document를 관리하고자 할 때 필요한 세팅, 파일 업로드 방법 그리고 Path Type인 Ph

4. 스위치재부팅을실시한다. ( 만약, Save 질문이나오면 'no' 를실시한다.) SWx#reload System configuration has been modified. Save? [yes/no]: no Proceed with reload? [confirm] (

Mentor_PCB설계입문

Homework 1 SNU , Fall 2012 Kwangkeun Yi Due: 9/14, 24:00 Exercise 1 리스트합 큰순서대로 (descending order) 나열된정수리스트두개를받아서하나의 순서리스트로만드는함수 merge: int lis

#Ȳ¿ë¼®

0125_ 워크샵 발표자료_완성.key

975_983 특집-한규철, 정원호

Microsoft PowerPoint - semantics

PowerPoint プレゼンテーション

Page 2 of 5 아니다 means to not be, and is therefore the opposite of 이다. While English simply turns words like to be or to exist negative by adding not,

[동고동락한다] [가슴 아프다] [비서관] 2013년 8월 19일 9.[비서관]덕에 아이가 탄생해서 [미역국] [맛있다] [처음엔 어떤 사연인 줄 몰랐었지만] 마귀와[동고동락한다]하였으니[가슴 아프다]하지만[처음엔 어떤 사연인 줄 몰랐었지만]여러 가지 말 못할 역경을

Transcription:

제 7 장파싱

파싱의개요 파싱 (Parsing) 입력문장의구조를분석하는과정 문법 (grammar) 언어에서허용되는문장의구조를정의하는체계 파싱기법 (parsing techniques) 문장의구조를문법에따라분석하는과정 차트파싱 (Chart Parsing) 2

문장의구조와트리 문장 : John ate the apple. Tree Representation List Representation N V John ate DET the N apple ( ( (N John)) ( (V ate) ( (DET the) (N apple)) ) ) 의미 (meaning) 는 와 로이루어졌다. 는 NAME 인 John 으로이루어졌다. 는 VERB 인 ate 와다른 로이루어졌다. 는 DET 인 the 와 NOUN 인 apple 로이루어졌다. 3

문맥자유문법 (Context-Free Grammar) 문법의구성요소 단어및품사기호 (terminals) ate, the, apple 등 V, DET, N 등 구문기호 (nonterminals),, 등 문법규칙 (productions) N DET N V V V 4

하향식파싱 하향식파싱 (Top-Down Parsing) 문장기호 로부터입력문장방향으로진행 문법규칙의 LH (left-hand side) 기호를 RH (right-hand side) 기호로대체하는과정의반복 하향식파싱의예 (leftmost derivation) N John John V John ate John ate DET N John ate the N John ate the apple G : N DET N V N John DET the V ate N apple Input entence : John ate the apple 5

하향식파싱과정 Grammar G N DET N V N John V ate DET the N apple N V DET N Input entence John ate the apple John ate the apple 6

상향식파싱 상향식파싱 (Bottom-Up Parsing) 입력문장으로부터문법기호 방향으로진행 문법규칙의 RH 를 LH 로대체하는과정의반복 상향식파싱의예 (reverse rightmost derivation) John ate the apple N ate the apple ate the apple V the apple V DET apple V DET N V G : N DET N V N John DET the V ate N apple Input entence : John ate the apple 7

상향식파싱과정 Grammar G N DET N V N John V ate DET the N apple Input entence John ate the apple N V DET N John ate the apple 8

자연언어의중의성 (1) 구조적중의성 (tructural Ambiguity) 하나의문장이다수의구조로해석될수있는성질 구조중의성의예 G : Input entence : N DET N John saw Mary in the park. V P N V N P DET N John saw Mary in the park N V N P DET N John saw Mary in the park 9

자연언어의중의성 (2) 어휘적중의성 (Lexical Ambiguity) 하나의단어가복수의품사로서사용되는경우 어휘적중의성으로구조적중의성발생 어휘적중의성의예 G : Input entence : D N A N N Time flies like an arrow V P A N V D N Time files like an arrow N V P D N Time files like an arrow 10

차트파싱 차트 (chart) 파싱의진행과정을기록하는테이블 Bookkeeping mechanism Keep track of constituents that were built up during part of parse, but may be used by other rules 차트파싱 (chart parsing) 차트를이용하는파싱 Backtracking 에의해동일한분석을반복하는 overhead 제거 구체적인 parsing strategy 에대해서는 no comments top-down or bottom-up left-to-right, right-to-left, or island-driven 일반적인 CFG parsing algorithm (CYK, Early algorithm 등 ) 이용 11

차트파싱의장점 A Grammar G G : DET N V P entence : The rabbit with a saw nibbled on an orange Traditional Parsing (with backtracking) 규칙을적용하여실패할경우 backtracking 한후, 규칙을적용하여파싱 이규칙에서 와 는 규칙에서분석했던내용과동일한데도처음부터다시분석해야함 ( 비효율적 ) 차트파싱 규칙을적용하여실패하였다고해도, 부분결과로만들어진, 구조를버리지않고 chart 에기록해둠 규칙에서, 는새로분석할필요없이 chart 에기록된내용을그대로이용 12

차트파싱과정 (1) Early algorithm 을이용한차트파싱 시작 tate entence symbol 이 LH 인규칙의 RH 처음에 Dot( ) 를삽입한규칙 Closure 연산 Dot 가 Nonterminal 앞에있으면, 해당 Nonterminal 이 LH 인모든규칙의 RH 처음에 Dot 를첨가하여해당 state 에삽입 파싱방법 Initial tate 현재의입력심볼이 A 이면현재 active 한규칙중에서 A 앞에 dot 가있는규칙의 dot 를 A 의뒤로이동 Dot 가해당규칙의맨오른쪽에있고그규칙의 LH 를 B 라고하면, active 한규칙중에서 B 앞에 dot 가있는규칙의 dot 를 B 뒤로이동 DET N DET N P DET N V P DET N The rabbit with a saw nibbled on an orange 13

차트파싱과정 (2) Next item : DET DET N Next item : N DET N V P DET N P DET N V P DET N The rabbit with a saw nibbled on an orange Next item : P V P DET N Next item : DET V P DET N 14

차트파싱과정 (3) Next item : N V P DET N P DET N P DET N V P DET N The rabbit with a saw nibbled on an orange Next item : V V P DET N P DET N V P DET N The rabbit with a saw nibbled on an orange 15

차트파싱과정 (4) Next item : P P DET N Next item : DET P DET N Next item : N P DET N DET N P DET N V P DET N The rabbit with a saw nibbled on an orange 16

차트표현 DET N P DET N V P DET N The rabbit with a saw nibbled on an orange 0 1 2 3 4 5 6 7 8 9 차트표현의한예 [(start position, end position), Category, (constituents)] 1 [(0,1), DET] 7 [(6,7), P] 13 [(0,5),, (10,12)] 2 [(1,2), N] 8 [(7,8), DET] 14 [(5,6),, (6)] 3 [(2,3), P] 9 [(8,9), N] 15 [(0,6),, (13,14)] 4 [(3,4), DET] 10 [(0,2),, (1,2)] 16 [(7,9),, (8,9)] 5 [(4,5), N] 11 [(3,5),, (4,5)] 17 [(6,9),, (7,16)] 6 [(5,6), V] 12 [(2,5),, (3,11)] 18 [(0,9),, (13,14,17)] 17