Naver.NLP.Workshop.SRL.Sogang_Alzzam

Similar documents
RNN & NLP Application

(JBE Vol. 24, No. 1, January 2019) (Special Paper) 24 1, (JBE Vol. 24, No. 1, January 2019) ISSN 2287-

KCC2011 우수발표논문 휴먼오피니언자동분류시스템구현을위한비결정오피니언형용사구문에대한연구 1) Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion

텀블러514


DIY 챗봇 - LangCon

딥러닝 첫걸음

Delving Deeper into Convolutional Networks for Learning Video Representations - Nicolas Ballas, Li Yao, Chris Pal, Aaron Courville arXiv:

%eb%8f%99%ec%9d%b8-[NO_09]%20%ec%9d%98%ea%b3%bc%eb%8c%80%ed%95%99%20%ec%86%8c%ec%8b%9d%ec%a7%80_F(%ec%b5%9c%ec%a2%85)-2.pdf

목차 AI Boom Chatbot Deep Learning Company.AI s Approach AI Chatbot In Financial service 2

<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DC0E5C7F5>

R을 이용한 텍스트 감정분석

PowerPoint 프레젠테이션

17....

웹 기반 네트워크 모니터링 및 분석 시스템의 설계와 구현

Ch 1 머신러닝 개요.pptx


PowerPoint 프레젠테이션

정보기술응용학회 발표

자연언어처리

슬라이드 1

_ _0.xls

< 목 차 > 제1 장. 조사 개요 1 1. 조사의 목적 2 2. 조사의 설계 2 3. 조사항목 2 4. 조사 진행 3 5. 조사 응답 현황 4 제2 장. 조사 결과 분석 5 1. 결제수단 비중 6 2. 신용카드 수수료 인하율 7 3. 우대수수료 적용 상한선 8 3-1

ePapyrus PDF Document

Multi-pass Sieve를 이용한 한국어 상호참조해결 반-자동 태깅 도구


딥러닝NLP응용_이창기

<4D F736F F F696E74202D F ABFACB1B8C8B85FBEF0BEEEC3B3B8AEBFCDB1E2B0E8B9F8BFAAC7F6C8B228C1F6C3A2C1F829>

Software Requirrment Analysis를 위한 정보 검색 기술의 응용

*º¹ÁöÁöµµµµÅ¥-¸Ô2Ä)

BFCReportb60¡À»£03ÖÁ¾

이학석사학위논문 규칙과기계학습을이용한한국어 상호참조해결 박천음 강원대학교대학원 컴퓨터과학과

제5장 형태소분석

Structural SVMs 및 Pegasos 알고리즘을 이용한 한국어 개체명 인식

000논문집-목차

<BFACB1B831382D31355FBAF2B5A5C0CCC5CD20B1E2B9DDC0C720BBE7C0CCB9F6C0A7C7E820C3F8C1A4B9E6B9FD20B9D720BBE7C0CCB9F6BBE7B0ED20BFB9C3F8B8F0C7FC20BFACB1B82D33C2F7BCF6C1A E687770>

자연언어처리

Structural SVMs 및 Pegasos 알고리즘을 이용한 한국어 개체명 인식

A Hierarchical Approach to Interactive Motion Editing for Human-like Figures

PowerPoint 프레젠테이션

< FBEC8B3BBB9AE2E6169>

DeepDive_ APT_....

<28C3D6C1BE29C7D1B1B9BEEEB9AEB9FDB7D028317E D E687770>

2

untitled

보고싶었던 Deep Learning과 OpenCV를이용한이미지처리과정에대해공부를해볼수있으며더나아가 Deep Learning기술을이용하여논문을작성하는데많은도움을받을수있으며아직배우는단계에있는저에게는기존의연구를따라해보는것만으로도큰발전이있다고생각했습니다. 그래서이번 DSP스마

서강대학교공과대학컴퓨터공학과 (1/5) CSE3081 (2 반 ): 알고리즘설계와분석 < 프로그래밍숙제 2> (v_1.0) 담당교수 : 임인성 2015 년 10 월 13 일 마감 : 10 월 31 일토요일오후 8 시정각 제출물, 제출방법, LATE 처리방법등 : 조교가

목차 BUG 문법에맞지않는질의문수행시, 에러메시지에질의문의일부만보여주는문제를수정합니다... 3 BUG ROUND, TRUNC 함수에서 DATE 포맷 IW 를추가지원합니다... 5 BUG ROLLUP/CUBE 절을포함하는질의는 SUBQUE

°æ¿µ°ü·ÃÇÐȸFš

ȲÁø°æ


OCW_C언어 기초

< E20C6DFBFFEBEEE20C0DBBCBAC0BB20C0A7C7D12043BEF0BEEE20492E707074>

424

420

392

PowerPoint Presentation

2017 년 AI 에대한전망 5 predictions for artificial intelligence in 2017, Stuart Frankel, CEO, Narrative Science Interactions Computer Computer Human Compute

Sequences with Low Correlation

Microsoft PowerPoint - WiseNLU(ETRI, 임수종) 배포본

PHP & ASP

PowerPoint 프레젠테이션

년 2월 15일~2월 28일 제104호 종합Ⅱ 무인민원발급기, 시간 제약없이 빠르게 라더니 거스름돈 500원 채워지지 않아 무인발급기 중단 오히려 불편 겪는 시민들 무인민원발급기 이용률이 날로 증가하면서 기기의 한정된 이용시 간과 일부 발생하는 결함으로 이

Electronics and Telecommunications Trends 인공지능을이용한 3D 콘텐츠기술동향및향후전망 Recent Trends and Prospects of 3D Content Using Artificial Intelligence Technology

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

Slide 1

QYQABILIGOUI.hwp

Microsoft PowerPoint - 실습소개와 AI_ML_DL_배포용.pptx

Microsoft PowerPoint - [2009] 02.pptx

단순 베이즈 분류기

Introduction to Deep learning


레이아웃 1

SuaKITBrochure_v2.2_KO

PowerPoint 프레젠테이션

<30342DBCF6C3B3B8AEBDC3BCB33228C3D6C1BE292E687770>

<91E6308FCD5F96DA8E9F2E706466>

제 26 회한글및한국어정보처리학술대회논문집 (2014 년 ) 한국어 NLP2RDF 프레임워크 원유성 한국과학기술원, Semantic Web Research Center {styner0305, jiwoo35, prismriver, hahmyg,

S O L U T I O N I N N O V A T I O N T P C M E C H A T R O N I C S TPC TPC SERVO & STEP MOTOR, DRIVER Series TDB2000 (일체형/분리형,

02( ) SAV12-19.hwp

PowerPoint 프레젠테이션

제목을 입력하십시오

Reinforcement Learning & AlphaGo

PowerPoint 프레젠테이션

02본문


2002년 2학기 자료구조

Vector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표

Microsoft Word - _Kyobo_Daily_FaBcxeK9d47z9zU4SOGa

USER GUIDE

웹진디자인3차

2015 년도 제 27 회한글및한국어정보처리학술대회 위원회 Ÿ 대회장 : 김재훈 ( 한국해양대 ) Ÿ 조직위원장 : 이상곤 ( 전주대 ) Ÿ 조직위원 (34 명 ) : 강승식 ( 국민대 ) 강현규 ( 건국대 ) 권혁철 ( 부산대 ) 김경선 ( 다이퀘스트 ) 김덕봉 (

(b) 연산증폭기슬루율측정회로 (c) 연산증폭기공통모드제거비측정회로 그림 1.1. 연산증폭기성능파라미터측정회로

공학석사학위논문 텍스트데이터를활용하는 추천시스템에서의행렬분해법 Matrix Factorization for Recommendation Systems Utilizing Text Data 2017 년 12 월 서울대학교대학원 전기 정보공학부 손동희

디지털TV솔루션 브로셔

PowerPoint 프레젠테이션

빅데이터_DAY key

BibLaTeX을 이용한 한국어 참고 문헌 처리의 가능성

08( ) CPLV15-64.hwp

Microsoft PowerPoint - DSD03_verilog3b.pptx

Transcription:

: Natra Langage Processing Lab 한국어 ELMo 모델을이용한의미역결정 박찬민, 박영준 Sogang_Azzam Naver NLP Chaenge 서강대학교자연어처리연구실

목차 서론 제안모델 실험 결론 2

서론 의미역결정이란? 문장의술어를찾고, 그술어와연관된논항들사이의의미관계를결정하는문제 논항 : 의미역이부여된각명사구의미역 : 술어에대한명사구의의미역할 누가, 무엇을, 어떻게, 왜 등의의미관계를찾아내는작업 ARG0 ARG1 네이버가리멤버를인수한다고발표했다. ARG0 ARG1 3

서론 의미역결정문제를순차레이블링문제로간주 Step1) 서술어인식 / 분류 O O P1 P1 네이버가리멤버를인수한다고발표했다. Step2) 논항인식 / 분류 인수한다고 의논항 발표했다 의논항 ARG0 ARG1 P1 O ARG0 O ARG1 P1 네이버가리멤버를인수한다고발표했다. 네이버가리멤버를인수한다고발표했다. 4

서론 입력문장전체에대한논항인식 / 분류모델사용 5

제안모델 제안모델 Bi-LSTM-CRFs ELMo 패러디극화는뛰어나도그원작을본사람들은수긍이어렵다는게장점이다. 6

제안모델 Bi-LSTM-CRFs 순차레이블링문제에서우수한성능을보이는딥러닝모델 문장의양방향어순을모두사용 문장의언어적특성을고려한모델 출력태그간의존성을고려하기위해 otpt ayer 에 CRF 적용 7

제안모델 Bi-LSTM-CRFs ( 의미역결정 ) 입력어절에대한임베딩 형태소임베딩품사태그임베딩음절포지션인코딩음절임베딩 ELMo 임베딩 ( 학습시, fine-tning 되지않음 ) - 첫번째형태소의 ELMo 임베딩 - 마지막형태소의 ELMo 임베딩 8

제안모델 어절임베딩 -> 형태소임베딩의조합으로어절표현 -> 4 개의형태소를결합 (concatenate) 하여사용 1) 한개의형태소로구성된어절 2) 두개의형태소로구성된어절 3) 세개의형태소로구성된어절 9

제안모델 어절임베딩 -> 품사태그임베딩의조합으로어절표현 -> 4 개의품사태그를결합 (concatenate) 하여사용 1) 한개의형태소로구성된어절 2) 두개의형태소로구성된어절 3) 세개의형태소로구성된어절 10

제안모델 ELMo(Embedding From Langage Mode) 문맥정보를포함하고있는임베딩 Bi-LSTM Langage Mode Highway LSTM 사용 LM의 Hidden state 를 weighted sm하여사용 한국어 ELMo 형태소단위입출력구조 입력형태소는음절단위로분리되어 CNN 을거쳐입력으로사용됨 다음단어로품사태그가포함된형태소예측 11

제안모델 한국어 ELMo 약 16GB 뉴스데이터를형태소분석하여사용 (Komoran 형태소분석기 ) -> perpexity : 약 8.xx 의미역결정학습 / 검증데이터를사용하여 fine-tning -> SRL perpexity : 약 1.xx -> NER perpexity : 약 2.xx 다음과같은 symbo 을사용한데이터전처리작업 <bos> : begin of sentence. <eos> : end of sentence. <bow> : begin of word. <eow> : end of word. 1024 차원의 ELMo embedding 사용 12

제안모델 Bi-LSTM-CRFs ( 의미역결정 ) 입력어절에대한임베딩 형태소조합임베딩품사태그조합임베딩음절포지션인코딩음절임베딩 ELMo 임베딩 ( 학습시, fine-tning 되지않음 ) - 첫번째형태소의 ELMo 임베딩 - 마지막형태소의 ELMo 임베딩 13

제안모델 Bi-LSTM-CRFs ( 개체명인식 ) 입력어절에대한임베딩 형태소임베딩품사태그임베딩음절포지션인코딩음절임베딩 ELMo 임베딩 ( 학습시, fine-tning 되지않음 ) - 첫번째형태소의 ELMo 임베딩 - 마지막형태소의 ELMo 임베딩개체명사전자질 ( 챌린지배포사전 ) 14

실험 실험데이터 Komoran 형태소분석기사용 의미역결정 학습데이터 : 31,856 문장검증데이터 : 3,000 문장 개체명인식 학습데이터 : 81,000 문장검증데이터 : 9,000 문장 15

실험 하이퍼파라미터 단어임베딩 음절임베딩품사임베딩 100 차원 (Xavier init) 50 차원 (Xavier init) ELMo 사이즈 1024차원 LSTM 사이즈 200차원 LSTM 레이어 1 드랍아웃 0.7 배치사이즈 32 최적화알고리즘 Adam Learning rate 0.001 16

실험 성능비교 의미역결정 Dev F1 Test F1 Bi-LSTM-CRFs 77.3 75.9 BI-LSTM-CRFs + ELMo. 78.1 77.6 17

실험 의미역결정 (SRL) 18

실험 개체명인식 (NER) 19

실험 그외추가실험 Sef-attention Mti-head attention 을 RNN 의 otpt ayer 에적용한모델 Tan, Zhixing, et a. "Deep semantic roe abeing with sef-attention." AAAI-2018. 20

실험 그외추가실험 Highway-LSTM Resida connection의일종 Vanishing gradient를해결하기위해제안된 LSTM ce 비선형변환을거친결과 (otpt) 와거치지않은결과 (raw inpt) 를 gate 연산을통해계산 He, Lheng, et a. "Deep semantic roe abeing: What works and what s next." Proceedings of the 55th Anna Meeting of the Association for Comptationa Lingistics (Vome 1: Long Papers). Vo. 1. 2017. 21

실험 그외추가실험 Affix featres 학습데이터에서빈도수가높은접두사 / 접미어를추출하여 vocabary 생성입력형태소 / 어절에대한접두사 / 접미어를추출하여임베딩학습 Yadav, Vikas, Rebecca Sharp, and Steven Bethard. "Deep Affix Featres Improve Nera Named Entity Recognizers." Proceedings of the Seventh Joint Conference on Lexica and Comptationa Semantics. 2018. 22

결론 결론 한국어특성에적합한 ELMo 모델학습 사전학습된 ELMo 를의미역결정, 개체명인식에적용하여성능향상 향후계획으로한국어 ELMo 학습시, 품사태그정보를활용한모델을실험예정 23

QnA 새해복많이받으세요. 감사합니다. 24