Software Requirrment Analysis를 위한 정보 검색 기술의 응용



Similar documents
DBPIA-NURIMEDIA

Curriculum Vitae 2 Sangkeun Jung, Cheongjae Lee. Gary Geunbae Lee. Using utterance and semantic level confidence for interactive spoken dialog clarifi

<3130BAB9BDC428BCF6C1A4292E687770>

DIY 챗봇 - LangCon

입장

DBPIA-NURIMEDIA

<C0CEBCE2BABB2D33C2F7BCF6C1A420B1B9BFAAC3D1BCAD203130B1C72E687770>

교사용지도서_쓰기.hwp

민주장정-노동운동(분권).indd

0429bodo.hwp


최우석.hwp

과 위 가 오는 경우에는 앞말 받침을 대표음으로 바꾼 [다가페]와 [흐귀 에]가 올바른 발음이 [안자서], [할튼], [업쓰므로], [절믐] 풀이 자음으로 끝나는 말인 앉- 과 핥-, 없-, 젊- 에 각각 모음으로 시작하는 형식형태소인 -아서, -은, -으므로, -음

E1-정답및풀이(1~24)ok

6±Ç¸ñÂ÷

時 習 說 ) 5), 원호설( 元 昊 說 ) 6) 등이 있다. 7) 이 가운데 임제설에 동의하는바, 상세한 논의는 황패강의 논의로 미루나 그의 논의에 논거로서 빠져 있는 부분을 보강하여 임제설에 대한 변증( 辨 證 )을 덧붙이고자 한다. 우선, 다음의 인용문을 보도록

< BDC3BAB8C1A4B1D4C6C75BC8A3BFDC D2E687770>

<C1B6BCB1B4EBBCBCBDC3B1E2342DC3D6C1BE2E687770>

untitled

伐)이라고 하였는데, 라자(羅字)는 나자(那字)로 쓰기도 하고 야자(耶字)로 쓰기도 한다. 또 서벌(徐伐)이라고도 한다. 세속에서 경자(京字)를 새겨 서벌(徐伐)이라고 한다. 이 때문에 또 사라(斯羅)라고 하기도 하고, 또 사로(斯盧)라고 하기도 한다. 재위 기간은 6

cls46-06(심우영).hwp

<C3D6C1BE5FBBF5B1B9BEEEBBFDC8B0B0DCBFEFC8A C3D6C1BEBABB292E687770>

초등국어에서 관용표현 지도 방안 연구

¸é¸ñ¼Ò½ÄÁö 63È£_³»Áö ÃÖÁ¾

177

제주어 교육자료(중등)-작업.hwp

01Report_210-4.hwp

<C3D1BCB15FC0CCC8C45FBFECB8AE5FB1B3C0B0C0C75FB9E6C7E D352D32315FC5E4292E687770>



교육 과 학기 술부 고 시 제 호 초 중등교육법 제23조 제2항에 의거하여 초 중등학교 교육과정을 다음과 같이 고시합니다. 2011년 8월 9일 교육과학기술부장관 1. 초 중등학교 교육과정 총론은 별책 1 과 같습니다. 2. 초등학교 교육과정은 별책

시험지 출제 양식

우리나라의 전통문화에는 무엇이 있는지 알아봅시다. 우리나라의 전통문화를 체험합시다. 우리나라의 전통문화를 소중히 여기는 마음을 가집시다. 5. 우리 옷 한복의 특징 자료 3 참고 남자와 여자가 입는 한복의 종류 가 달랐다는 것을 알려 준다. 85쪽 문제 8, 9 자료

상품 전단지

::: 해당사항이 없을 경우 무 표시하시기 바랍니다. 검토항목 검 토 여 부 ( 표시) 시 민 : 유 ( ) 무 시 민 참 여 고 려 사 항 이 해 당 사 자 : 유 ( ) 무 전 문 가 : 유 ( ) 무 옴 브 즈 만 : 유 ( ) 무 법 령 규 정 : 교통 환경 재

2

DBPIA-NURIMEDIA

화이련(華以戀) hwp

ÆòÈ�´©¸® 94È£ ³»Áö_ÃÖÁ¾

歯1##01.PDF

<5BC1F8C7E0C1DF2D31B1C75D2DBCF6C1A4BABB2E687770>

120229(00)(1~3).indd

KCC2011 우수발표논문 휴먼오피니언자동분류시스템구현을위한비결정오피니언형용사구문에대한연구 1) Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion

<C5F0B0E82D313132C8A328C0DBBEF7BFEB292E687770>

정보기술응용학회 발표


(자료)2016학년도 수시모집 전형별 면접질문(의예과포함)(최종 ).hwp

DBPIA-NURIMEDIA

< 목 차 > 제1 장. 조사 개요 1 1. 조사의 목적 2 2. 조사의 설계 2 3. 조사항목 2 4. 조사 진행 3 5. 조사 응답 현황 4 제2 장. 조사 결과 분석 5 1. 결제수단 비중 6 2. 신용카드 수수료 인하율 7 3. 우대수수료 적용 상한선 8 3-1

<C0CCBCBCBFB52DC1A4B4EBBFF82DBCAEBBE7B3EDB9AE2D D382E687770>

< B5BFBEC6BDC3BEC6BBE E687770>

11민락초신문4호


<B3EDBCFABDC7B7C2BDD7B1E22E687770>

제1절 조선시대 이전의 교육

사진 24 _ 종루지 전경(서북에서) 사진 25 _ 종루지 남측기단(동에서) 사진 26 _ 종루지 북측기단(서에서) 사진 27 _ 종루지 1차 건물지 초석 적심석 사진 28 _ 종루지 중심 방형적심 유 사진 29 _ 종루지 동측 계단석 <경루지> 위 치 탑지의 남북중심

새만금세미나-1101-이양재.hwp

??

652

歯 조선일보.PDF

5월영상등급 내지_최종

<33B1C7C3D6C1BEBABB28BCF6C1A42D E687770>


<C1DFB1DE2842C7FC292E687770>

96부산연주문화\(김창욱\)

???? 1

untitled

목 차 국회 1 월 중 제 개정 법령 대통령령 7 건 ( 제정 -, 개정 7, 폐지 -) 1. 댐건설 및 주변지역지원 등에 관한 법률 시행령 일부개정 1 2. 지방공무원 수당 등에 관한 규정 일부개정 1 3. 경력단절여성등의 경제활동 촉진법 시행령 일부개정 2 4. 대


THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 29, no. 6, Jun Rate). STAP(Space-Time Adaptive Processing)., -

종사연구자료-이야기방 hwp

정 답 과 해 설 1 (1) 존중하고 배려하는 언어생활 주요 지문 한 번 더 본문 10~12쪽 [예시 답] 상대에게 상처를 주고 한 사 람의 삶을 파괴할 수도 있으며, 사회 전체의 분위기를 해쳐 여러 가지 사회 문제를 발생시킬 수 있다. 04 5

○ 제2조 정의에서 기간통신역무의 정의와 EU의 전자커뮤니케이션서비스 정의의 차이점은

<34B1C720C0CEB1C7C4A7C7D828C3D6C1BEC6EDC1FD D28BCF6C1A4292E687770>

160215

71호 한소리.indd

1

참고 금융분야 개인정보보호 가이드라인 1. 개인정보보호 관계 법령 개인정보 보호법 시행령 신용정보의 이용 및 보호에 관한 법률 시행령 금융실명거래 및 비밀보장에 관한 법률 시행령 전자금융거래법 시행령 은행법 시행령 보험업법 시행령 자동차손해배상 보장법 시행령 자본시장과

감각형 증강현실을 이용한

2016년 제31차 통신심의소위원회 회의록(심의의결서,공개, 비공개).hwp

hwp

580 인물 강순( 康 純 1390(공양왕 2) 1468(예종 즉위년 ) 조선 초기의 명장.본관은 신천( 信 川 ).자는 태초( 太 初 ).시호는 장민( 莊 愍 ).보령현 지내리( 保 寧 縣 池 內 里,지금의 보령시 주포면 보령리)에서 출생하였다.아버지는 통훈대부 판무

<5BC6EDC1FD5DBFA9BCBAC0C720BFC2B6F3C0CE20C0CEB1C7C7C7C7D820C7F6C8B2B0FA20B0B3BCB1B9E6BEC82E687770>

장: 200 세외수입 관: 220 임시적세외수입 항: 223 기타수입 광역친환경농업단지사업 부가세 환급금 및 통장이자 79,440,130원 79, ,440 < 산림축산과 > 497, , ,244 산지전용지 대집행복구공사((주)하나식품)

<C1DFB0B3BBE7B9FD3128B9FDB7C92C20B0B3C1A4B9DDBFB5292E687770>

<312E B3E2B5B520BBE7C8B8BAB9C1F6B0FC20BFEEBFB5B0FCB7C320BEF7B9ABC3B3B8AE20BEC8B3BB28B0E1C0E7BABB292DC6EDC1FD2E687770>

Voice Portal using Oracle 9i AS Wireless

?

자료1 분기별 시청률 추이 (%) 사분기 2사분기 3사분기 4사분기 1사분기 2사분기 3사분기 4

ad hwp


3. 은하 1 우리 은하 위 : 나선형 옆 : 볼록한 원반형 태양은 은하핵으로부터 3만광년 떨어진 곳에 위치 2 은하의 분류 규칙적인 모양의 유무 타원은하, 나선은하와 타원은하 나선팔의 유무 타원은하와 나선 은하 막대 모양 구조의 유무 정상나선은하와 막대나선은하 4.

근대문화재분과 제4차 회의록(공개)

Microsoft Word - USW 英語課清單 Fall 2009

인천광역시의회 의원 상해 등 보상금 지급에 관한 조례 일부개정조례안 의안 번호 179 제안연월일 : 제 안 자 :조례정비특별위원회위원장 제안이유 공무상재해인정기준 (총무처훈령 제153호)이 공무원연금법 시행규칙 (행정자치부령 제89호)으로 흡수 전면 개


교육실습 소감문

-

1

치밀한 시간 계산으로 한 치의 오차 없이 여행일정을 계획하지만, 상황이 항상 뜻대로 돌 아가지는 않는다. 인도에서는 철로가 끊겨 있기도 하고, 미국에서는 인디언의 공격을 받 기도 한다. 하지만 그는 항상 침착하고 냉정한 태도를 유지하며, 때로는 일정에 차질이 생 겨도

Transcription:

EPG 정보 검색을 위한 예제 기반 자연어 대화 시스템 김석환 * 이청재 정상근 이근배 포항공과대학교 컴퓨터공학과 지능소프트웨어연구실 {megaup, lcj80, hugman, gblee}@postech.ac.kr An Example-Based Natural Language System for EPG Information Access Seokhwan Kim *, Cheongjae Lee, Sangkeun Jung and Gary Geunbae Lee isoft Lab., Dept. of Computer Science and Engineering, Pohang University of Science and Technology 요 약 본 논문에서는 EPG 정보 검색을 위한 자연어 대화 시스템에 대해 논한다. 자연어 대화 시 스템 구축을 위한, 대화 예제를 이용한 상황 기반 대화 관리 방법론은, 효율적이고 실용적 인 대화 시스템 구축을 가능하게 한다. 대화 시스템은 사용자 발화에 대해 적합한 시스템 응답 발화를 출력하는 과정으로 진행되며, 이를 위해, 사용자 발화 의미 분석, 대화 관리, 시스템 응답 발화 생성의 과정을 거친다. 정확하고 신속한 정보의 전달이 중요한 EPG 정 보 검색 도메인의 특성상 EPG 데이터베이스의 관리 및 갱신이 중요한 요소로 작용한다. 이를 위해 웹마이닝 기반의 EPG 데이터베이스 관리자를 구현함으로써 데이터베이스 구축 에 필요한 비용을 최소화하고, 신속하고 정확한 정보를 제공할 수 있었다. 1. 서론 케이블 TV 및 위성 방송의 보급으로 인해 사용자들 은 다양한 채널을 통해 다양한 방송을 시청할 수 있 게 되었다. 하지만 그에 따라 원하는 채널과 프로그 램을 리모컨만으로 찾는 일은 매우 어려워졌다. 디지 털 방송 서비스의 시작과 함께 디지털 방송 서비스의 대표적인 어플리케이션으로 자리매김한 EPG(Electronic Program Guide)는 방송 편성표 및 방 송 프로그램에 대한 상세한 정보를 디지털 TV 화면을 통해 제공함으로써, 원하는 채널과 프로그램을 좀 더 쉽게 찾을 수 있도록 도와주고 있다. 하지만 EPG 역 시 리모컨 인터페이스의 한계로 인해, 제한적인 정보 검색 기능만을 제공하고 있으며, 이로 인한 복잡한 사용법은 사용자의 편의성을 저해하고 있다. 이 논문에서는 사용자 편의성을 고려한 효율적인 EPG 정보 검색을 위한 자연어 대화 시스템을 제안한다. 자연어 대화 시스템(Natural Language System)은 자연어를 이용하여 컴퓨터와 의사소통을 본 연구는 산업 자원부 21C 프론티어 연구 인간생활자원 지능로봇 과제의 지원을 받아 수행되었음. 하는 차세대 인터페이스이다. 자연어 대화 시스템은 많은 분야에서 이용되고 있으며 21세기의 유비쿼터스 시대를 위한 필수적인 지능형 인터페이스로 활발한 연구가 진행되고 있다[1]. 자연어 대화 시스템은 일 반적으로 자연어 이해 (Natural Language Understanding), 대화 관리 ( Management), 자연어 응답 생성 (Natural Language Generation) 등 의 모듈로 구성된다. 본 연구에서는 EPG 영역의 데이 터베이스 검색을 위한 사용자 인터페이스로서의 기능 을 갖는 대화 시스템을 구현하였다. EPG 정보 검색 영역이 다른 정보 검색 영역에 비해 갖고 있는 특성은 검색 대상 정보가 주기적으로 갱신 되어야 한다는 점이다. 본 연구는 EPG 정보 데이터베 이스의 주기적인 갱신을 위한 웹 마이닝 (Web Mining) 기술을 포함한다. 인터넷의 발달과 보급으로 인해 웹 을 통해 다양한 정보를 얻을 수 있으며, EPG 정보의 주를 이루는 방송 프로그램 관련 정보 역시 방대한 양의 정보가 웹 상에 존재하고 있다. 웹을 통해 제공 되는 정보를 자동으로 추출하여 EPG 정보 데이터베이 스를 구축하고 갱신함으로써, 데이터베이스 구축 및 갱신에 필요한 비용을 절감하고, 신속하게 정보를 갱 신할 수 있다.

2. 대화 예제를 이용한 상황 기반 대화 관리 시스템 본 연구에서는 대화 예제를 이용한 상황 기반 대화 관리 (Situation-Based Management with Examples)[2] 방법론에 기반한 시스템을 개 발하였다. 상황 기반 대화 관리 시스템의 목적은 실 용적이며 유연한 대화 처리를 할 수 있고, 다양한 응 용 분야에 적용 가능한 높은 도메인 확장성을 갖는 시스템을 만드는 데에 있다. 2.1 기존의 대화 모델 대부분의 기존 대화 관리 시스템은 유한 상태 기반 방식 (Finite State-Based Model)에 바탕을 두고 있다 [3]. 현재 대화 상태를 특정 상태로 사상을 하여 그 상태에서 적절한 대화 진행을 하고 다음 상태를 예측 하는 방식이다. 이것은 실제로 고정된 상태 전이 모 델 위에서 대화를 진행하기 때문에 특정 도메인의 목 적에 맞는 상태 전이 네트워크를 디자인하여 빠른 대 화 관리 시스템을 구축할 수 있다. 이 모델은 전형적 으로 대화 형태가 고정되어 있는 대화 시스템에 많이 사용된다. 그러나 사용자의 현재 발화에 의해 다음 턴에 사용자의 발화가 제한이 되거나 도메인이 바뀌 면 모델 자체를 바꿔야 하기 때문에 도메인 간의 확 장성이 떨어지는 단점을 가지고 있다. 이를 개선하기 위해 제시된 방식이 프레임 기반 대화 모델 (Frame-Based Model)이다[4]. 이 모델은 자 연스러운 대화 처리를 위해 고안되었으며 사용자의 발화에서 필요한 정보를 추출하여 의미 프레임을 채 우고 그 정보를 바탕으로 대화를 진행하는 방식이다. 그러나 실제 대화 관리는 이러한 의미 프레임을 이용 한 상태 전이나 수작업으로 만든 규칙에 의존하는 경 우가 많아 유한 상태 모델과 같은 단점을 가지게 된 다. 또한 최근에는 복잡한 도메인을 처리하기 위해 계획 기반 모델 (Plan-Based Model)이 연구되고 있다 [5]. 이것은 사용자와 컴퓨터 간의 대화 목적을 정하 고 그것을 위해 다양한 대화 계획 스키마를 적용하여 대화를 진행하는 방식이다. 그러나 이 방식은 사용자 의 발화 자유도가 높고 어려운 작업을 위한 도메인을 처리하기 때문에, 대화 관리 성능의 저하로 상용성이 떨어진다는 단점이 있다. 최근에는 단순히 특정 도메인을 위한 음성 대화 시 스템을 벗어나 도메인 확장성을 향상시키기 위한 객 체 기반의 구현 방식이 연구되고 있다[6]. 이것은 대 화 시스템의 각 모듈을 객체로 구현하여 도메인에 무 관한 공통적인 처리 부분과 도메인에 관련된 처리 부 분을 나누어 도메인 확장성을 향상시킨 것이다. 그러 나 이 시스템도 대화 관리를 위해 수작업으로 많은 규칙을 인코딩해야 하기 때문에 실용적인 대화 관리 시스템 개발이 힘들다. User User Utterance Speech Dialog Frame Discourse History Management Dialog System Utterance Generation NLU Discourse Domain Expert Rule Parser Domain Database Example DB Meta-Rules <그림 1> 상황 기반 대화 관리 시스템 구조 2.2 상황 기반 대화 관리 시스템 상황 기반 대화 관리 시스템 (Situation-Based Management System) 의 기본적인 아이디어는 프레임 기반의 대화 모델을 취한다. 전반적인 상황 기반 대화 관리 시스템의 구조는 <그림 1>과 같으며 기본적인 구조는 [6]의 구조와 동일하다. 여기서 대 화 관리자( )는 필요한 도메인 전문가 (Domain Expert)를 호출해 자연어 이해 (NLU, Natural Language Understanding) 모듈에서 만들어진 의미 프 레임과 외부 도메인 데이터베이스, 대화 예제 데이터 베이스를 연결하여 현재 사용자의 상황에 맞는 적절 한 시스템 발화를 생성한다. 이 논문에서 정의된 상황 (Situation) 이라는 것은 현재 사용자의 발 화와 의도, NLU 결과인 의미 프레임, 담화 이력 (Discourse History) 등을 포함하는 전반적인 현재 대 화 상태를 말한다. 상황 기반 대화 관리 시스템은 유 한 상태 기반의 상태 전이를 지양하고 현재 대화 상 황에서 자유로운 상태 전이를 허락한다. 그러므로 현 재 턴에 규제된 대화 진행 규칙이 없고 사용자의 발 화를 입력 받아 현재 대화 상황을 분석하게 된다. 2.3 예제 기반 대화 모델링 기존의 규칙 기반 대화 모델링에서는 개발자가 미 리 지식 작업을 하여 일관성 있고 적용성이 큰 규칙 을 인코딩 해야 하며, 효과적인 상황 기반 대화 관리 를 위해서는 수작업에 의한 규칙 작성이 필요하다. 이러한 규칙이 일관성이 없거나 잘못된 경우에는 적 절한 대화 진행을 하지 못하는 경우가 있다. 즉, 대 화 관리 시스템에는 수많은 대화 상태가 존재하며, 이러한 대화 상태를 모두 처리할 수 있는 규칙을 수 작업을 통해 만드는 것은 불가능하다. 이와 같은 규칙 기반 대화 모델링의 단점인 규칙

학습의 인력 비용을 간소화하기 위해 대화 말뭉치로 부터 자동적으로 규칙을 학습하여 시스템 발화를 생 성하는 대화 예제 기반 대화 모델링을 사용한다. 우 선, 대화 모델링을 위해 대화 말뭉치로부터 자동으로 대화 예제 데이터베이스 ( Example Database) 를 만든다. 우리는 말뭉치의 태깅을 최소화하기 위해 NLU 모델을 훈련하기 위한 말뭉치를 재사용하였다. 즉, 프레임 기반의 대화 관리 시스템을 구축하기 위 해서는 기본적으로 사용자의 발화에 대한 의미 프레 임 태깅 작업이 필요하다. 여기서는 대화 모델링을 위한 추가적인 태깅 작업으로 담화 이력 벡터 (Discourse History Vector)와 시스템 응답 (System Response)만을 추가적으로 태깅하였다. 여기서 담화 이력 벡터는 현재 대화 상황까지 의미 프레임의 슬롯 이 채워졌는지 아닌지를 나타내는 이진 벡터로 표시 한다. 이러한 태깅 정보들은 대화 예제 데이터베이스의 색인 키로써 이용되고 이를 가지고 대화 예제 데이터 베이스에 질의를 던져 적절한 시스템 응답을 찾아낸 다. 대화 예제를 찾기 위한 질의에서 현재 대화 상황 을 바탕으로 검색한다면 항상 전체 일치 (Exact Match)가 가능하지 않을 수 있다. 그러므로 부분 일 치 (Partial Match)가 가능하도록 제약을 완화하여 사 용자의 의도 (Dialog Act and Main Action)만을 가지 고 대화 예제를 검색한다. 이것은 실제 시스템 응답 이 현재 상황의 사용자 의도에 주로 의존하기 때문이 다. 대화 예제 데이터베이스에서 현재 상황에 적합한 대화 예제들을 가져올 때, 여러 개의 예제 후보들이 생긴다. 이러한 것들 중에서 가장 적합한 예제를 찾 기 위해서 발화 유사성(Utterance Similarity)을 정의 하였다. 발화 유사성은 담화 이력 유사성(Discourse History Similarity)과 어휘-의미 유사성 (Lexico- Semantic Similarity)의 선형 보간 (Linear Interpolation)으로 정의하였다. 담화 이력 유사성은 담화 이력 벡터의 코사인 계수(Cosine Measure)로 나 타내며, 어휘-의미 유사성은 추출된 슬롯의 값을 미 리 정의된 슬롯 이름으로 대체하여 대화 예제의 사용 자 발화와 현재 사용자 발화의 유사성을 측정하였다. <그림 2>는 어휘-의미 유사성을 계산하기 위한 입력 예제를 보여준다. 대부분 대화의 상황은 대화 예제를 통해 시스템 발화를 결정할 수 있지만, 대화 예제가 없는 경우 등을 처리하기 위해 미리 만들어 놓은 메 타 규칙도 이용하였다. <그림 3>은 대화 예제 기반의 대화 모델링의 전반적인 전략을 나타낸다. User Utterance 그럼 SBS 드라마는 언제 하지? Component Slots [channel = SBS, genre = 드라마] Lexico-Semantic 그럼 [channel] [genre]는 언제 하지? Input <그림 2> 어휘-의미 유사성 입력 예제 System Responses User s Utterance Domain Expert Best Example User Intention Semantic Frame Query Generation Utterance Similarity Lexico-semantic Similarity Discourse history Similarity Tie-breaking Discourse History Corpus Example DB Retrieval Examples <그림 3> 대화 예제 기반 대화 모델링 전략 3. EPG 정보검색 대화 시스템 Automatic Indexing <그림 4>는 예제기반 대화 모델링 구조를 이용한 EPG 정보 검색을 위한 자연어 대화 시스템의 전반적 인 구조를 나타낸다. EPG 정보 검색 대화 시스템은 각 각의 사용자 발화 입력에 대한 시스템의 응답 발화를 출력하는 구조를 갖고 있으며, 이 때, 사용자 발화는 EPG DB 검색 요청에 대한 자연어 발화로 간주하며, 시 스템 발화는 사용자의 요청에 대한 EPG DB 검색 결과 를 주된 내용으로 포함한다. 이를 위해, 시스템은 사 용자 발화의 의미를 분석하는 NLU 모듈, 의미 분석 결과와 기존의 담화 기록 등에 기반하여 적합한 시스 템 발화 요소를 선정하는 대화 관리자( ) 모듈, 선정된 시스템 응답 요소에 기반하여 실제 시스템 발화를 생성하는 시스템 발화 생성 (System Utterance Generator) 모듈로 구성된다. 또한 EPG 데이터베이스 관리자(EPG Database )는 웹 상의 EPG 정보로부터 대화 시스템에 필요한 정보를 추출하여 EPG 데이터베이스를 구축 및 갱신하고, 시 스템의 각각의 모듈들은 EPG 데이터베이스에 기반하 여 구동된다. Meta-Rules For DM Example DB Meta-Rules For SUG User Utterance NLU Semantic Frame System Action System Utterance Generator System Utterance NLU MODEL EPG DB WEB EPG DB <그림 4> EPG 정보 검색 대화 시스템 구조

3.1 NLU 모듈 대화 시스템을 위한 의미 분석 기술은 사용자의 발 화로부터 의도나 상황을 분석하여 시스템이 처리 가 능한 의미 프레임(Semantic Frame) 구조 형태로 구성 하는 기술이다. 본 시스템에서 사용된 의미 프레임은 화행(Dialog Act)과 행위(Main Action), 그리고 구성 성분(Component Slot)으로 이루어진다. 화행은 일반적 으로 문형 정보를 나타내며 상황에 따라서 반드시 문 형과 일치하지는 않는다. 그리고 행위는 실제 사용자 가 그 도메인 내에서 원하는 행위를 나타내는 의미적 인 정보이다. 구성성분 요소는 실제 사용자 발화에 나타나는 도메인에 대한 개체 정보이다. 이것은 슬랏 과 그것에 해당하는 값을 추출하여 표현 된다. <그림 2>의 사용자 발화의 경우 화행은 wh-question 이, 행위는 search_start_time 이 된다. 그리고 사용자 가 말한 구성성분 요소는 채널(Channel)과 장르 (Genre)에 대응하는 값으로 SBS 와 드라마 가 된 다. NLU 모듈은 정보 추출 기술을 이용한 언어 이해 방법론에 기반하여 구현되었다[7]. 3.2 대화 관리자 모듈 대화 관리자( ) 모듈은 앞서 언급한 대화 예제를 이용한 상황 기반 대화 관리 방법론에 기반하여 구현되었다. 하지만 기본적인 상황 기반 대 화 관리 방법론이 다양한 도메인의 대화를 처리할 수 있는 확장성에 초점을 맞추고 있는 것에 비해, 본 시 스템은 EPG 정보 검색의 단일 도메인에 대한 대화 처 리에 초점을 맞추고 있다. 그러므로 대화 관리자 내 의 세부 모듈들은 EPG 정보 검색 도메인에 해당하는 각각의 단일 모듈들로 구성되어 있으며, 이는 앞서 언급한 상황 기반 대화 관리 구조의 단일 도메인에 대한 특별한 경우라 볼 수 있다. 하지만 기본적인 상 황 기반 대화 관리 방법론의 구조에 따르고 있기 때 문에, 추후 필요에 의해 별도의 도메인의 확장이 가 능하다. 시점에서의 정보의 가치를 좌우하는 기준이 된다는 점이다. 그러므로 EPG 정보 검색 시스템에서는 신속 하고 정확한 정보의 갱신 및 관리가 중요한 요소이다. EPG 데이터베이스 관리자 모듈은 EPG 정보의 갱신을 위해 웹을 통해 얻을 수 있는 HTML 형식의 EPG 정보 테이블로부터 원하는 정보를 추출하여, 데이터베이스 로 구축하는 기능을 수행한다. HTML 테이블로부터 정 보를 추출하는 과정은 규칙 기반으로 이루어지며, 이 결과 생성된 EPG 데이터베이스는 NLU 모델 구축과 대 화 관리, 시스템 발화 생성의 대화 시스템 전반에 걸 쳐 반영됨으로써, EPG 정보 검색 대화 시스템이 항상 최신의 정보를 제공할 수 있도록 한다. 4. 구현 및 실험 4.1 구현 결과 EPG 정보 검색을 위한 대화 시스템은 텍스트 입력 과 함께 HTK 기반의 음성 인식기를 이용하여 음성 입 력도 처리할 수 있도록 구현되었다. 시스템은 텍스트 입력이나 음성 인식 결과를 통해 입력된 사용자 발화 에 대한 처리 결과를 자연어 형태의 시스템 발화로 출력한다. 이 시스템 발화를 음성 합성 모듈(TTS)을 이용하여 음성으로 합성함으로써 음성 입력과 음성 출력으로 이루어지는 음성 대화 시스템 (Spoken Dialog System)을 구성할 수 있다. <그림 5>는 EPG 정 보 검색 대화 시스템의 실행 예제이다. 각각의 EPG 정보 검색 요청에 관련된 사용자 발화에 대한 시스템 의 정보 검색 결과에 기반한 응답 발화가 출력되고 있다. 3.3 시스템 발화 생성 모듈 시스템 발화 생성 모듈은 대화 관리자의 결과인 시 스템 발화 요소를 기반으로 자연어 시스템 응답 발화 를 생성한다. 시스템 발화의 생성은 앞선 과정들로부 터 얻은 의미 분석 결과와 시스템 응답 요소, EPG 데 이터베이스 검색 결과에 기반하여 메타 규칙 기반으 로 이루어진다. 3.4 EPG 데이터 베이스 관리자 EPG 정보의 가장 큰 특성은 주기적으로 새로운 정 보가 제공되며, 정보가 갖고 있는 시간적 특성이 각 <그림 5> EPG 정보 검색 대화 시스템 실행 예제

4.2 실험 실험을 위해 EPG 정보 검색 영역의 대화 말뭉치를 이용하여 대화 예제 데이터베이스를 구축하였다. 이 대화 말뭉치는 380개의 사용자 발화로 이루어진 88개 의 한국어 대화로 구성이 되어 있다. 각 사용자 발화 는 NLU 모델을 위한 태깅이 되어 있고 여기에 대화 예제 기반 대화 모델을 구축하기 위해 담화 이력 벡 터와 시스템 응답을 태깅하였다. 실험은 텍스트 입력과 음성 입력으로 나누어 진행 하였으며, 음성 인식기는 HTK를 기반으로 EPG 정보 검색 영역의 언어 모델로 훈련이 되어 있다. 이번 실 험 환경에서 단어 오인식률(WER)은 15.3%이며, 텍스 트 입력과 음성 입력 각각에 대한 NLU 모듈의 성능은 <표 1>과 같다[7]. Slot Type Textual Input Spoken Input (WER 0.0%) (WER 15.3%) Act 95.33 85.34 Main Action 93.50 81.78 Component Slot 90.85 80.12 <표 1> NLU 성능 대화 예제 기반의 대화 모델링 능력을 측정하기 위 해 대화 예제 일치 비율(Example Matching Rate, EMR) 과 그것에 따른 턴 성공 비율(Success Turn Rate, STR) 을 측정하였다. EMR은 사용자 발화 입력에 대한 대화 예제 일치의 평균 일치 비율로 전체 일치와 부분 일 치로 나누어서 측정하였다. 그리고 그것에 따라 시스 템 발화가 적절한지를 확인하기 위해 STR을 측정하였 다. 실험을 위해 5명의 사용자에게 EPG 정보 검색 영 역에 대한 10개의 임의의 텍스트 입력을 훈련에 사용 한 88개의 대화와 독립적으로 넣도록 하였으며 각 턴 마다 시스템 발화의 적절성을 평가하도록 하였다. <표 2>는 각 예제 일치 분류에 따라 EMR과 STR을 나타낸 다. 실험 결과를 통해 대부분의 대화는 전체 일치나 부분 일치로 진행이 가능하며 훈련에 사용하지 않은 입력에 대해서도 대부분 (94%의 커버리지) 원만한 대 화 진행이 이루어지는 것을 확인할 수 있다. Example Match Type EMR STR Exact Match 0.42 0.9 Partial Match 0.52 0.73 No Example 0.06 0.33 <표 2> EMR과 STR 또한 대화 관리 시스템의 성능 측정을 위해 텍스트 입력과 음성 입력에 대한 PARADISE 성능 측정법 [5] 의 평가가 이루어졌다. 사용자 만족도 (User Satisfaction)는 음성 인식률 (Mean Recognition Accuracy, MRA)과 대화 성공률(User Perception of Task Completion Rate, TCR), STR의 값들에 각각 1/3 씩의 가중치를 부여한 뒤, 선형 보간법을 이용하여 정의하였다. 평가는 5명의 사용자에게 5개의 다른 EPG 정보 검색 대화 시나리오에 기반한 대화를 수행 하도록 하고, 각각의 턴과 대화에 대해서 시스템 발 화의 정확성과 성공 유무를 평가하도록 하였다. <표 3>은 대화 성능 평가 결과를 나타낸다. Evaluation Textual Input Spoken Input TCR 0.92 0.76 STR 0.88 0.65 MRA 1.00 0.85 User Satisfaction 0.93 0.75 5. 결론 <표 3> 대화 성능 평가 결과 본 연구에서는 대화 예제를 이용한 상황 기반 대화 관리 방법론에 기반하여 EPG 정보 검색 대화 시스템 을 개발하였다. 대화 예제를 이용하여 대화 관리를 위한 규칙을 자동으로 구축함으로써 효율적이고 실용 적인 대화 시스템을 구축할 수 있었으며, 웹마이닝을 이용하여 EPG 데이터베이스를 자동으로 구축 및 갱신 함으로써 데이터베이스 구축을 위한 비용을 절감할 수 있었다. 향후 계획은 EPG 데이터베이스 구축 모듈 을 보강하여 테이블 형태의 자료뿐 아니라, 일반적인 자연어 문서에 대해서도 원하는 정보를 추출함으로써 좀 더 다양한 정보를 제공할 수 있는 EPG 대화 시스 템을 개발할 예정이다. 참고 문헌 [1] J. Allen, D. Byron, M. Dzikovska, G. Ferguson, L. Galescu, and A. Stent, Towards conversational human-computer interaction, AI Magazine, Vol. 22, no. 4, pp 27-37, 2001. [2] Cheongjae Lee, Sangkeun Jung, Jihyun Eun, Minwoo Jeong, and Gary Geunbae Lee, A Situation-based Management using Examples, Proceedings of the 2006 IEEE international conference on acoustics, speech and signal processing (ICASSP-2006). May 2006, Toulouse. [3] McTear, Modeling spoken dialogues with state transition diagrams : Experiences with the CSLU

toolkit, Proceedings of the 5th International Conference on Spoken Language Processing, Vol. 4, pp. 1223-1226, 1998. [4] O. Lemon, A. Gruenstein et al., Multi-tasking and collaborative activities in dialogue systems, Proceedings of the 3rd SIGDIAL Workshop on Discourse and, pp. 113-124, 2002. [5] J. Chu-Carroll, MIMIC: An adaptive mixed initiative spoken dialogue system for information queries, Proceedings of the 6th Applied Natural Language Processing Conference, pp. 97-104, 2000. [6] I. O Neil, P. Hanna et al., Implementing advanced spoken dialogue management in Java, Speech Communication, Vol. 54, no. 1, pp 99-124, January 2005. [7] J. Eun, C. Lee, and G. Lee, "An Information extraction approach for spoken language understanding", Proceedings of the 8th International Conference on Spoken Language Processing, pp. 2145-2148, 2004.