<333820C0D3C7D8C3A22DBFB9C1A620B1E2B9DD20C3AABABFC0BB20C0A7C7D1B1E2B0E820C7D0BDC020B1E2B9DDC0C720B9DFC8AD20B0A320C0AFBBE7B5B520C3F8C1A420B9E6B9FD2E687770>

Similar documents
Software Requirrment Analysis를 위한 정보 검색 기술의 응용

KCC2011 우수발표논문 휴먼오피니언자동분류시스템구현을위한비결정오피니언형용사구문에대한연구 1) Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 29, no. 10, Oct ,,. 0.5 %.., cm mm FR4 (ε r =4.4)

05( ) CPLV12-04.hwp

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Nov.; 26(11),

Curriculum Vitae 2 Sangkeun Jung, Cheongjae Lee. Gary Geunbae Lee. Using utterance and semantic level confidence for interactive spoken dialog clarifi

Journal of Educational Innovation Research 2019, Vol. 29, No. 1, pp DOI: (LiD) - - * Way to

서론 34 2

Microsoft PowerPoint - 26.pptx

大学4年生の正社員内定要因に関する実証分析

DBPIA-NURIMEDIA

지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월

2017 년 6 월한국소프트웨어감정평가학회논문지제 13 권제 1 호 Abstract


230 한국교육학연구 제20권 제3호 I. 서 론 청소년의 언어가 거칠어지고 있다. 개ㅅㄲ, ㅆㅂ놈(년), 미친ㅆㄲ, 닥쳐, 엠창, 뒤져 등과 같은 말은 주위에서 쉽게 들을 수 있다. 말과 글이 점차 된소리나 거센소리로 바뀌고, 외 국어 남용과 사이버 문화의 익명성 등

High Resolution Disparity Map Generation Using TOF Depth Camera In this paper, we propose a high-resolution disparity map generation method using a lo

<313120C0AFC0FCC0DA5FBECBB0EDB8AEC1F2C0BB5FC0CCBFEBC7D15FB1E8C0BAC5C25FBCF6C1A42E687770>

2

김경재 안현철 지능정보연구제 17 권제 4 호 2011 년 12 월

Journal of Educational Innovation Research 2018, Vol. 28, No. 1, pp DOI: * A Analysis of

<30352DC0CCC7F6C8F B1B3292DBFACB1B8BCD2B1B3C1A42E687770>

°í¼®ÁÖ Ãâ·Â

정보기술응용학회 발표

에너지경제연구 제13권 제1호

Journal of Educational Innovation Research 2018, Vol. 28, No. 4, pp DOI: * A S

Microsoft PowerPoint Relations.pptx

232 도시행정학보 제25집 제4호 I. 서 론 1. 연구의 배경 및 목적 사회가 다원화될수록 다양성과 복합성의 요소는 증가하게 된다. 도시의 발달은 사회의 다원 화와 밀접하게 관련되어 있기 때문에 현대화된 도시는 경제, 사회, 정치 등이 복합적으로 연 계되어 있어 특

DBPIA-NURIMEDIA

DIY 챗봇 - LangCon

Journal of Educational Innovation Research 2018, Vol. 28, No. 4, pp DOI: A Study on Organizi

09권오설_ok.hwp

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

<C3D6C1BE2DBDC4C7B0C0AFC5EBC7D0C8B8C1F D32C8A3292E687770>

Ch 1 머신러닝 개요.pptx

Journal of Educational Innovation Research 2018, Vol. 28, No. 3, pp DOI: NCS : * A Study on

08( ) CPLV15-61.hwp

Multi-pass Sieve를 이용한 한국어 상호참조해결 반-자동 태깅 도구

3. 클라우드 컴퓨팅 상호 운용성 기반의 서비스 평가 방법론 개발.hwp

<31325FB1E8B0E6BCBA2E687770>

<32382DC3BBB0A2C0E5BED6C0DA2E687770>

À±½Â¿í Ãâ·Â

, ( ) 1) *.. I. (batch). (production planning). (downstream stage) (stockout).... (endangered). (utilization). *


19_9_767.hwp


DBPIA-NURIMEDIA

(JBE Vol. 21, No. 1, January 2016) (Regular Paper) 21 1, (JBE Vol. 21, No. 1, January 2016) ISSN 228

09구자용(489~500)

Journal of Educational Innovation Research 2017, Vol. 27, No. 4, pp DOI: A Study on the Opti

세종대 요람


I

September Vol

October Vol

DBPIA-NURIMEDIA

< FBEC8B3BBB9AE2E6169>

WHO 의새로운국제장애분류 (ICF) 에대한이해와기능적장애개념의필요성 ( 황수경 ) ꌙ 127 노동정책연구 제 4 권제 2 호 pp.127~148 c 한국노동연구원 WHO 의새로운국제장애분류 (ICF) 에대한이해와기능적장애개념의필요성황수경 *, (disabi

<30362E20C6EDC1FD2DB0EDBFB5B4EBB4D420BCF6C1A42E687770>

09오충원(613~623)

Microsoft PowerPoint - 27.pptx

학습영역의 Taxonomy에 기초한 CD-ROM Title의 효과분석

<353420B1C7B9CCB6F52DC1F5B0ADC7F6BDC7C0BB20C0CCBFEBC7D120BEC6B5BFB1B3C0B0C7C1B7CEB1D7B7A52E687770>

목 차 요약문 I Ⅰ. 연구개요 1 Ⅱ. 특허검색 DB 및시스템조사 5

무선데이터_요금제의_가격차별화에_관한_연구v4.hwp

Journal of Educational Innovation Research 2016, Vol. 26, No. 2, pp DOI: * Experiences of Af

이용석 박환용 - 베이비부머의 특성에 따른 주택유형 선택 변화 연구.hwp

Microsoft PowerPoint - CSharp-10-예외처리

#Ȳ¿ë¼®

Journal of Educational Innovation Research 2018, Vol. 28, No. 1, pp DOI: A study on Characte

MySQL-.. 1

공연영상

04서종철fig.6(121~131)ok

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 27, no. 8, Aug [3]. ±90,.,,,, 5,,., 0.01, 0.016, 99 %... 선형간섭

1. 서론 1-1 연구 배경과 목적 1-2 연구 방법과 범위 2. 클라우드 게임 서비스 2-1 클라우드 게임 서비스의 정의 2-2 클라우드 게임 서비스의 특징 2-3 클라우드 게임 서비스의 시장 현황 2-4 클라우드 게임 서비스 사례 연구 2-5 클라우드 게임 서비스에

위해 사용된 기법에 대해 소개하고자 한다. 시각화와 자료구조를 동시에 활용하는 프로그램이 가지는 한계와 이를 극복하기 위한 시도들을 살펴봄으로서 소셜네트워크의 분석을 위한 접근 방안을 고찰해 보고자 한다. 2장에서는 실험에 사용된 인터넷 커뮤니티인 MLBPark 게시판

에너지경제연구제 16 권제 1 호 Korean Energy Economic Review Volume 16, Number 1, March 2017 : pp. 35~55 학술 전력시장가격에대한역사적요인분해 * 35

레이아웃 1

[ 영어영문학 ] 제 55 권 4 호 (2010) ( ) ( ) ( ) 1) Kyuchul Yoon, Ji-Yeon Oh & Sang-Cheol Ahn. Teaching English prosody through English poems with clon

Vol.258 C O N T E N T S M O N T H L Y P U B L I C F I N A N C E F O R U M

<333820B1E8C8AFBFEB2D5A B8A620C0CCBFEBC7D120BDC7BFDC20C0A7C4A1C3DFC1A42E687770>

07_À±ÀåÇõ¿Ü_0317

08원재호( )

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Dec.; 26(12),

<C7D1B1B9B1B3C0B0B0B3B9DFBFF85FC7D1B1B9B1B3C0B05F3430B1C733C8A35FC5EBC7D5BABB28C3D6C1BE292DC7A5C1F6C6F7C7D42E687770>

<BEEEB9AEB7D0C3D13630C8A32836BFF93330C0CFBCF6C1A4292E687770>

Æ÷Àå½Ã¼³94š

목차 AI Boom Chatbot Deep Learning Company.AI s Approach AI Chatbot In Financial service 2

Rheu-suppl hwp

1)2) 1

데이터베이스-4부0816

음악의 구성 형식에 따라 추출된 대표 선율을 이용한 내용 기반 음악 검색 시스템

<B9CCB5F0BEEEB0E6C1A6BFCDB9AEC8AD5F31322D32C8A35FBABBB9AE5FC3CAC6C731BCE25F6F6B5F E687770>

09한성희.hwp

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Jun.; 27(6),

08( ) CPLV15-64.hwp

대한한의학원전학회지24권6호-전체최종.hwp

DBPIA-NURIMEDIA

에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 -

R을 이용한 텍스트 감정분석

Journal of Educational Innovation Research 2017, Vol. 27, No. 1, pp DOI: * The

Transcription:

한국산학기술학회논문지 Vol. 11, No. 8, pp. 3021-3027, 2010 예제기반챗봇을위한기계학습기반의발화간유사도측정방법 양민철 1, 이연수 1, 임해창 2* 1 고려대학교컴퓨터 전파통신공학과, 2 고려대학교컴퓨터 통신공학부 A Machine Learning based Method for Measuring Inter-utterance Similarity for Example-based Chatbot Min-Chul Yang 1, Yeon-Su Lee 1 and Hae-Chang Rim 2* 1 Department of Computer and Radio Communications Engineering, Korea University 2 Division of Computer and Communications Engineering, Korea University 요약예제기반챗봇은사용자발화와가장유사한예제발화를대화예제데이터베이스로부터검색하여응답을생성한다. 가장유사한발화를찾는것은응답의적절성과직결되는것임에도불구하고, 유사발화검색을위해어떠한자질을사용할것인지, 어떠한방식이좋은지에대한기존연구는부족하였다. 본연구에서는검색의정확도와예제의활용도를높이기위해다양한어휘적, 의미적자질을이용한기계학습방법을제안한다. 실험결과 1) 대화예제데이터베이스의활용도 2) 예제발화의매칭의정확률 3) 답변의질적인측면에서제안하는방법은기존의방법에비해더나은성능을보였다. Abstract Example-based chatbot generates a response to user s utterance by searching the most similar utterance in a collection of dialogue examples. Though finding an appropriate example is very important as it is closely related to a response quality, few studies have reported regarding what features should be considered and how to use the features for similar utterance searching. In this paper, we propose a machine learning framework which uses various linguistic features. Experimental results show that simultaneously using both semantic features and lexical features significantly improves the performance, compared to conventional approaches, in terms of 1) the utilization of example database, 2) precision of example matching, and 3) the quality of responses. Key Words : Dialogue system, Example-based chatbot 1. 서론 챗봇 (chatbot) 은사람과컴퓨터가자연어형태로다양한주제의일상적인대화를주고받는시스템이다. 개발초기에는정신병환자의치료에쓰이거나단순한재미를위해사용되었지만최근에는정보획득, FAQ 시스템등목적지향시스템과통합되어자연스러운대화인터페이스를제공하는요소기술로사용되고있다. 하지만채팅은표-1과같이대화의목적이나도메인이미리정해져 있지않기때문에사용자가입력한광범위한주제의발화들에대해적절히응답하는것이매우어렵다. 따라서대부분의채팅시스템은예제대화또는말뭉치에서광범위한대화지식을습득한후입력된사용자발화에대해가장유사한예제발화를검색한후이에대한응답또는규칙을이용하여시스템응답을생성하는기법을사용한다. 예제의형태와응답생성방식이약간의차이가있으나유명한 ELIZA[1], ALICE[2], WOZ[3] 도일종의예제기반방식이라고할수있다. 본연구는교육과학기술부한국연구재단 (KRF-2007-361-AL0013) 및 2 단계 BK21 사업의지원을받아수행되었음. * 교신저자 : 임해창 (rim@nlp.korea.ac.kr) 접수일 10년 06월 14일수정일 10년 06월 24일게재확정일 10년 08월 10일 3021

한국산학기술학회논문지제 11 권제 8 호, 2010 [ 표 1] 목적지향시스템과채팅시스템의비교목적지향적채팅특정서비스혹은정보를미리정해진목적이없음사용자에게제공하는것이목적도메인에따른한정된내자유롭고일상적인대화로용의발화만을처리광범위한내용의발화를처리 ex) TV 편성안내대화시 ex) 오늘본영화는너무슬스템펐어오늘밤 10시 KBS에서어떤드라마하지? 예제기반챗봇은더유사한발화를찾을수록더적절한응답이될것이라는가정을한다. 따라서어떠한기준으로입력된사용자발화와가장유사한예제발화를찾을것인가는매우중요한문제이다. 이를위해서는다음과같은것을고려해야한다. 첫째, 대화시스템에서발화간유사성을비교할때는화자의의도를고려해야한다. 대화에서는화자와청자가있다. 따라서상대방에대한명령이나요청, 질문, 칭찬, 비난등다양한양태가나타나고, 동일한사건이라도대화가이루어지는시제에따라현재, 미래, 과거로다르게표현할수있다. 따라서자연스러운대화가되기위해서는이러한다양한상황에대해다르게답변을해야한다. 둘째, 예제기반대화시스템에서대화예제의양이아무리크더라도정확히일치하는경우는거의없기때문에최대한유사한발화를찾아활용할수있는전략이필요하다. 특히채팅시스템의경우목적지향적시스템과달리정확한응답이아니더라도대화를중단하는것보다는가능하면이어가는것이중요하므로유사발화검색에서도이러한점이고려되어야한다. 셋째, 발화간유사도를측정하는기준은보유하고있는예제데이터베이스의특성이반영되어야한다. 만약데이터베이스의크기가매우크고유사한발화들이매우많이분포하고있다면단순화된패턴매칭만으로는분별력이없어지게된다. 반대로대화집합의크기는매우작은데여러가지기준으로완전 (exact) 매칭만을고집한다면매칭된발화가거의없어대부분의대화가이어질수없을것이다. 따라서유사발화를검색하는기준에는사용자의의도를반영하는다양한의미적자질과어휘적자질이고려되어야하고또한이기준을적용할때는유사한예제가많을때는분별력이있도록다양한자질을고려하되예제가적을때에는완전히일치하지않더라도다양한자질들의중요도를고려하여유사도를측정할수있어야한다. 본연구에서는이를위해최근정보검색에서많이사용하는기계학습기법중하나인랭킹학습을이용하였다. 본연구에서사용한 SVM 기계학습은자동으로자질간의관계를파악하여비슷한경향성을가진자질끼리는가중치를배분하여상대적으로적은가중치를할당해주고, 경향성이확연히다르고유사함의여부를분류하는데있어명시적인자질이라면높은가중치를할당해준다. 여기에더하여랭킹학습은단순히유사한지여부보다매우유사한발화쌍의자질과덜유사한발화쌍의자질간차이까지고려하여가중치를결정하기때문에가장유사한발화를찾는데유용한방법이라고볼수있다. 이런학습방법을예제기반챗봇에적용하면다음과같은이점이있다. 첫째, 다양한어휘적, 의미적자질들을동시에고려하고결합하는데있어매우효과적인방법이다. 둘째, 발화간유사한정도를측정함으로써예제데이터베이스에유사한발화들이매우많은경우혹은매우적은경우등어떠한상황에서든지가장유사한발화를선택할수있는분별력을가지게된다. 셋째, 예제데이터베이스의특성을자동으로반영하므로데이터베이스의크기와발화의분포에대해매우견고한기준이된다. 이후논문의구성은다음과같다. 2장에서는본연구와관련된기존연구를살펴보고 3장에서는기계학습을통한발화간유사도측정방법에대해설명한다. 4장은제안하는방법의검색정확률과응답성능에대한실험및평가를보여준다. 마지막으로 5장에서는결론과향후연구에대해논의하도록한다. 2. 관련연구 예제기반챗봇에서의예제검색에관한기존연구를살펴보면다음과같다. ELIZA[1], WOZ[3] 등의채팅시스템에서는키워드기반으로답변생성규칙을만들어놓고사용자발화가입력되면예제발화와키워드매칭으로대응하는답변생성규칙들을찾아이를조합하여응답을생성한다. 그러나이러한방식은동일한키워드열이라도다른의미의발화가될수있다는점에서응답의적절성이매우떨어질수있다. 3022

예제기반챗봇을위한기계학습기반의발화간유사도측정방법 [ 그림 1] 키워드완전매칭의오류 예를들어그림 1과같이 밥먹자 와 밥먹었어 는 [ 밥 /N 먹 /V] 이라는동일한키워드로검색되지만전자는 청유 의의미이고후자는단순한 서술 의의미로서이에대한시스템응답은반드시달라져야한다. 그러나단순한키워드매칭만으로는이러한차이를구분할수가없다. 이러한점을보완하여최근의목적지향적대화시스템에서는어휘적유사성뿐아니라대화히스토리 (discuss history), 화행 (dialog act) 등다양한의미적요소를고려한다 [4]. [4] 에서는자질간상관관계 (correlation) 를통해비교할자질들을줄여나가면서두발화의자질에대해완전매칭으로유사한발화를찾는다. 하지만매칭된자질이하나도없을때어떤대안으로답변을내줄지, 매칭된자질집합이같은발화가여러개있을때어떤방법으로그중하나를선택하여답변을내줄지에대한기준이없다. 예제기반챗봇은대량의예제를가정하지만이를확보하는것은쉽지않다. 일부주제에대해서는많을수있고일부주제는예제가부족할수도있다. 따라서많은예제가있을때는정확하게가장유사한것을선택할수있어야하고예제가부족할때에도대화를자연스럽게이어갈수있어야한다. 그러나기존연구에서는이러한것을해결하기에매칭기준이나방법적인측면에서부족함이있었다. 3. 유사발화검색방법 본장에서는예제기반채팅시스템에서사용자발화에대해가장유사한발화를검색하기위한방법에대해논한다. 유사도를학습하고이를이용하는예제기반챗봇의시스템구조는그림 2와같다. [ 그림 2] 시스템구조먼저대화예제데이터베이스의각예제는전처리와형태소분석, 키워드분석, 시제, 문형, 긍부정, 양태, 술어, 논항등의미분석이미리수행되어저장된다. 사용자가발화를입력하면전처리과정을거쳐교정되고, 자연어분석모듈은형태소분석및구문분석을수행하고시제, 긍부정, 양태등발화의의미를분석한다. 그다음 < 사용자입력발화, 예제발화 > 쌍에대해자질추출기가기계학습에서사용될자질값을계산한다. 학습된자질간가중치를기반으로전체데이터베이스의예제에대해유사도를계산하고그중가장높은발화에대응하는응답을시스템응답으로출력한다. 3.1 발화의의미분석 [ 표 2] 자연어분석발화정보설명형태소 / 품사열발화의형태소 / 품사열긍 / 부정 ex) 긍정문, 부정문시제 ex) 과거, 현재, 미래문형 ex) 평서문, 의문문, 명령문, 청유문화자의주관적인태도양태 ex) 지각, 추측, 희망, 금지등발화에서주어의움직임, 상태, 성질따술어위를서술하는말술어가나타내는의미를완성시키기위논항해필요한말 ex) 행동의주체, 대상, 목적, 도구등품사가체언, 용언, 수식어에해당하는키워드단어 3023

한국산학기술학회논문지제 11 권제 8 호, 2010 본연구에서는정확한분석을위하여사용자발화에대해철자오류, 띄어쓰기오류등의전처리단계를가진다. 그다음발화의어휘적, 의미적분석을위해표 2와같은자연어분석을수행한다. 3.2 발화간유사도학습 본연구에서사용한기계학습방법은랭킹학습기법이다. 예제기반챗봇의특성상예제데이터베이스의모든발화중사용자입력발화에대해가장유사한 1개를찾아이에대한답변을내주므로유사한가아닌가를분류하기보다는유사한발화들끼리도어떤발화가더유사한지판별하는것이중요하다. 그래서표-3과같이유사한발화쌍들끼리도 2점, 1점이라는유사한정도를나눔으로써발화간랭크를정하고이를기준으로서로짝지어랭킹학습하는 Pairwise Rank 방식을이용한다. [ 그림 3] 가중치학습과정본연구에서자질간가중치학습을위한절차는그림 3과같다. 먼저사용자가실제시스템에입력한발화집합에서임의적으로 N개를샘플링 (sampling) 한다. 그다음각발화별로전체예제데이터베이스에서임의적으로 M 개의예제를추출하여작은샘플데이터베이스를만든다. 이러한 N개의 < 입력발화-데이터베이스 > 쌍에대해사람이직접학습데이터를구축한다. 평가자는하나의발화에대해샘플데이터베이스상의모든발화를대상으로유사도를평가한다. 그러면총 N*M개의입력발화-예제발화유사도평가집합이생성될수있지만생성된학습데이터에는부정적인예 (negative example) 가너무많으므로기계학습에이용하기에는적당하지않다. 따라서비율이 1:1 이되는만큼만부정적인예를사용하도록하였다. 이렇게구축된학습데이터에자질을분석하여추가한후기계학습을통해자질의가중치를결정한다. [ 표 3] 발화간유사도기준과예유사도설명누가봐도동일한의미인경우 2 ex) 우리이제친구지 - 나랑친구하자넓게생각하면같은뜻으로해석가능하거나 1 같은반응 ( 답변 ) 이가능한경우 ex) 우리이제친구지 - 나너좋아누가봐도동일하지않거나반대의의미인 0 경우 ex) 우리이제친구지 - 나궁금해표 3은학습데이터를만들기위한발화간유사도기준과그기준에따른학습데이터의예이다. 본연구에서는유사한정도를 0-2까지 3단계로태깅 (tagging) 하였다. 3.3 자질집합 본연구에서는 3.1장에서분석한발화의어휘적, 의미적정보를이용하여기계학습에이용되는자질을만든다. 자질은크게어휘적자질 (Lexical feature) 과의미적자질 (Semantic feature) 로나눌수있다. 표 4는본연구에서고려한 26개의자질집합이다. [ 표 4] 자질집합 분류 No. 설명 속성 어휘적자질 F 1 형태소기반편집거리 0-1 표층통 F 2 품사기반편집거리 0-1 사 적 품사별키워드매칭비 자질 F 3-14 율 ( 용언, 체언수식언에 0-1 속하는 12 개품사 ) F 15 의미적거리를고려한편집거리 0-1 의미적 F 16 술어매칭 Y/N 자질 F 17 논항형태소매칭 매칭수 F 18-22 논항카테고리별매칭수 ( 행위주체, 대상, 영향 매칭수 주체등 ) F 23 긍부정매칭 Y/N F 24 시제매칭 Y/N F 25 문형매칭 Y/N F 26 양태매칭 Y/N 예를들어긍부정매칭은입력발화와예제발화의긍부정이일치하는지여부를말한다. 품사별키워드매칭비율방법은품사간매칭된형태소의개수에서전체형태소개수만큼나누어정규화함으로써얼마나서로매칭되는지비교할수있다. 편집거리는정규화된편집거리 (normalized edit distance)[5] 계산방법을사용하여발화간어휘적으로얼마나유사한지비교할수있다. 마지막으로의미적거리를고려한편집거리에서의미적거리는품사가일반명사 (NNG) 와고유명사 (NNP) 인형태소에대해서만한글워드넷 [7] 을이용하여 [6] 의방법에따라 3024

예제기반챗봇을위한기계학습기반의발화간유사도측정방법 계산한다. 실험을통해제안하는방법과비교하고자하는유사발화검색방법은표 5와같다. 4. 실험및평가 3장에서제시한각자질의유용성과 SVM Rank[8] 를통한유사도학습방법의효과를평가하기위해테스트집합에서실제 9만개의예제데이터베이스를대상으로유사발화를검색하고시스템응답을생성하여유사발화의정확도와사용자만족도 ( 답변적정도 ) 를평가하였다. 본장에서는먼저학습데이터구축등실험환경에대해살펴보고실험결과를소개한후이에대한분석을하도록한다. 4.1 실험환경실험에사용된대화예제데이터베이스는실제모바일채팅시스템을통해사용자가각입력발화에대한응답부분을입력한것으로사람이직접구축한것이다. 이런이유로각예제발화와이에대한답변은서로적절한질문과응답쌍이라고가정한다. 전체데이터크기는동일한예제를제외한 91,128개로구성되어있다. 가중치학습을위한학습데이터는입력발화와샘플데이터베이스쌍으로구성되는데입력발화는예제데이터베이스에사용되지않은발화 10,000개중무작위로 160개를추출하였다. 하나의입력발화당 3,000개로구성된샘플데이터베이스는실제 9만개의전체예제데이터베이스에서임의적으로샘플링하여구축하였다. 3.2장에서설명한방식을통해최종적으로총 4,851개의발화쌍이학습데이터로추출되었다. 평가데이터는예제데이터베이스에사용되지않은발화 10,000개중무작위로추출한 150개테스트발화에대해학습한가중치를기반으로검색한유사발화와답변을앞서 3.2장의유사도기준과 [9] 의사용자만족도기준에따라 3명의실제사용자가평가하여평균값을측정하였다. [ 표 5] 검색방법비교방법검색방법사용한자질 Key by Exact 완전매칭 F 3-14 Key + SEM by Exact 완전매칭 F 3-14 + F 23-26 Word class by Exact 완전매칭 F 3-15 NED by SVM 랭킹학습 F 1-2 SEM by SVM 랭킹학습 F 3-26 All by SVM 랭킹학습 F 1-26 ( 제안하는방법 ) 4.2 실험결과및분석 각검색방법이얼마나유사한발화를찾을수있는가를비교하기위해다음식 (1), (2) 와같이정확률과유사도점수를평가한다. sim( u 인경우의수정확률 i, e( ui)) 1 = 전체입력발화개수 유사도점수 = sim( ui, e( ui )) sim( x, y) = x발화와 y발화간유사도 ui = i번째입력발화 e( x) = x발화에대해시스템이내준가장유사한발화 정확률은테스트발화에대해 9만개의예제데이터베이스에유사한발화가있다고가정하며절대적인수치보다는각방법을비교하는데의미가있다. 유사도점수는전체테스트쿼리에대해서서로다른방법들이얼마나더유사한발화를찾는가를평가하기위한것으로서이것역시절대적인수치보다는각방법을비교하는데의미가있다. [ 표 6] 유사발화도성능 방법 정확률 (%) 유사도점수 Key by Exact 29.53 72 Key + SEM by Exact 28.19 62 Word class by Exact 44.97 92 NED by SVM 59.73 126 SEM by SVM 64.43 138 All by SVM 76.51 168 유사발화검색의기존연구와다양한자질을사용하는방법및 SVM을통해학습을한경우에대한비교실험결과는표 6과같다. NED by SVM, SEM by SVM, All by SVM을비교해볼때어휘적자질또는의미적자질만을각각사용하는것보다의미적, 어휘적자질을동시에고려하는것이성능이좋았다. 어휘적자질의가중치가높게나타났지만어휘적자질로구별할수없는것을의미적자질을이용함으로써더잘구별할수있었으며, 의미적자질이동일할때에는형태적자질이가장유사한것을찾는데결정적인역할을했다. 또한 Key by Exact, Key + SEM by Exact, Word class by Exact, All (1) (2) 3025

한국산학기술학회논문지제 11 권제 8 호, 2010 by SVM 방법들을비교해보면기존의완전매칭이위험할수있음을알수있다. 기존방법은한정된자질에대해서모두매칭이되거나하나도매칭이안되는경우에는대안을찾을수없었다. 하지만랭킹학습을통해학습한경우는유사도를계산함으로써발화간랭킹을매길수있고이를통해어떤상황에서든가장유사하다고판단할수있는발화를찾을수있었다. [ 표 7] 사용자만족도기준만족도설명 2 상황에맞는답변 (reasonable reply) 상황에어울리지않지만이해가능한답변 1 (weird but understandable reply) 상황에어울리지도않고무의미한답변 0 (non-sensical reply) 간직접적인연관관계는그림 3을통해볼수있다. 완전매칭은유사발화를찾지못하는경우가많아전체적으로랭킹학습방법에비해응답성능도낮다. 또한학습방법을사용하면서도의미적, 어휘적자질을동시에고려한제안하는방법이발화유사도, 답변적정도모두가장좋은성능을보였다. 마지막으로발화유사도가높을수록사용자만족도가높아짐을볼수있는데앞서말한예제기반챗봇의가정이참임을알수있다. [ 표 9] 무의미한응답반복비율 방법 repetition(%) Key by Exact 52.35 Key + SEM by Exact 59.73 Word class by Exact 30.20 All by SVM 0.00 다음은응답의질에관한평가로서평가기준은 [9] 에서사용한다음의표 7과같은기준을적용하였다. [ 표 8] 사용자만족도성능 방법 0 1 2 총점수 Key by Exact 0.67 0.14 0.18 75 Key + SEM by Exact 0.71 0.15 0.13 63 Word class by Exact 0.50 0.33 0.17 101 NED by SVM 0.36 0.36 0.28 138 SEM by SVM 0.27 0.44 0.29 152 All by SVM 0.21 0.41 0.39 177 답변에대한사용자만족도분포결과는표 8과같다. 모든자질을동시에고려하고학습을하는방법이응답의전체점수뿐아니라다른방법에비해 2점의분포가높은것을알수있다. [ 그림 3] 발화유사도와사용자만족도간관계 발화유사도와사용자만족도의종합적인분포와이들 응답에대한또다른평가로서표 9와같이기본적이거나무의미한응답반복 (repetition)[9] 의비율을평가하였다. Word class by Exact는단어클래스를이용한일반화를통해매칭비율이향상되어무의미한반복이줄어들긴하였으나, 대부분기존연구에서사용하는완전매칭은채팅시스템에서유사발화가반이상검색이안되어서무의미한응답을반복하였다. 제안하는방법은이완매칭 (relaxed matching) 을이용해한정된양의데이터베이스내에서예제를최대한활용하여모든사용자발화에대해가능한답변을내줌으로써기존매칭방법의문제점을해결함을볼수있었다. 5. 결론및향후연구 본논문에서는예제기반챗봇에서가장중요한기술중하나인유사발화검색을위한새로운방법을제안하였고제안하는방법은발화간유사성을파악하는데유용한자질들을추출하고기계학습을이용하여선별한자질을활용한방법이다. 실험을통해단순히어휘적인자질만이아니라다양한의미적자질을동시에고려하는것이유사발화검색의정확도를향상시킴을알수있었고, 완전매칭보다는기계학습방법을이용하여각자질에최적의가중치를적용하고자연스럽게이완매칭이되도록하는방식이정확도뿐아니라예제의활용도측면에서성능향상이크다는것을알수있었다. 또한이러한유사발화검색의성능향상이응답성능향상에매우직접적으로연관된다는것을응답평가를통해알수있었다. 3026

예제기반챗봇을위한기계학습기반의발화간유사도측정방법 향후에는사용자발화와예제발화간의관계뿐아니라답변의정보까지고려할것이다. 또한기계학습을통한유사도의임계값을설정하는문제및검색속도의향상을위한자동화방법등을연구하여좀더완벽한챗봇을개발할것이다. 참고문헌 양민철 (Min-Chul Yang) [ 학생회원 ] 2010 년 2 월 : 고려대학교컴퓨터 통신공학부 ( 공학사 ) 2010 년 3 월 ~ 현재 : 고려대학교대학원컴퓨터 전파통신공학과석사과정 [1] Weizenbaum, J. Eliza - a computer program for the study of natural language communication between man and machine, Communications of the ACM, Vol. 9, pp. 36-45, 1965. [2] Levin et al., The ALICE System: A Workbench for Learning and Using Language, CALICO Journal Vol. 9, No. 1, pp. 27-56, 1991. [3] H. Murao, N. Kawaguchi, S. Matsubara, Y. Yamaguchi, and Y. Inagaki. Example-based spoken dialogue system using WOZ system log, SIGdial Workshop on Discourse and Dialogue (SIGDIAL 2003), pp. 140-148, 2003. [4] C Lee et al. "Correlation-based Query Relaxation for Example-based Dialog Modeling", ASRU, pp. 474-478, 2009. [5] Andr es Marzal and Enrique Vidal. "Computation of normalized edit distance and applications", IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 15. pp. 926-932. 1993. [6] Jay J. Jiang and David W. Conrath. "Semantic similarity based on corpus statistics and lexical taxonomy", In Proceedings of International Conference on Research in Computational Linguistics, Taiwan. 1997. [7] 윤애선외, 한국어어휘의미망 KorLex 1.5의구축, 한국정보과학회논문지, 제36권, 제1호, pp. 92-108. 2009. [8] T. Joachims. "Training Linear SVMs in Linear Time", Proceedings of the ACM Conference on Knowledge Discovery and Data Mining (KDD). 2006. [9] B.A. Shawar, and E. Atwell. Different Measurement metrics to evaluate a chatbot system Academic and Industrial Research in Dialog Technologies Workshop Proceediings. Association for Computational Linguistics. pp. 89-96. 2007. < 관심분야 > 대화시스템, 정보검색 이연수 (Yeon-Su Lee) [ 정회원 ] < 관심분야 > 대화시스템, 기계번역 2008 년 8 월 : 고려대학교대학원컴퓨터 전파통신공학과 ( 컴퓨터학석사 ) 2008 년 9 월 ~ 현재 : 고려대학교대학원컴퓨터 전파통신공학과박사과정 임해창 (Hae-Chang Rim) [ 정회원 ] < 관심분야 > 자연어처리, 정보검색 1983년 12월 : University of Missouri-Columbia 대학원전산학과 ( 전산학석사 ) 1990년 12월 : University of Texas-Austin 대학원전산학과 ( 전산학박사 ) 1991년 9월 ~ 현재 : 고려대학교컴퓨터학과 ( 현컴퓨터 통신공학부 ) 교수 3027