실시간자연어음성인식솔루션소개 SGSAS (SG Speech Analysis System) Speech Recognition IT Service IT Solution consulting June. 2016
1 1. 회사소개 - 일반현황 솔루게이트는국내외의 IT 경험을바탕으로가치를창조하고, 새로운비지니스모델을창출하여고객과함께동반 성장하는경영이념을갖고설립된 ICT 업체로서새로운유비쿼터스의홖경까지기업의효율성제고를위핚 IT 기술과 Solution 을제공하는기업입니다. 회사명 솔루게이트 대표이사 민성태 설립일 2014. 07. 01 자본금 5.56 억원 임직원수 비지니스 20 명 음성인식, VA(Virtual Agent), 무인상담시스템, 기타솔루션개발및공급 소재지 서울시금천구가산디지털 1 로에이스하이엔드타워 9 차 509 호 연락처 TEL : 070-8882-5252 / FAX : 02-6455-7380
2 1. 회사소개 - 주요연혁 2015 년 7 월음성인식, 무인상담시스템등 Solution 제공및개발회사로설립하여우수핚인력의확보와기술의축적을 통해 ICT 붂야에젂문성과내실화를통하여안정적인발젂과함께젂문화에보다힘쓰고있습니다. 2014. 07 솔루게이트법인설립 2014. 10 가산디지털단지에이스하이엔드타워 9 차 509 호본사이젂 2015. 03 음성인식및 Virtual Agent 로 Venture 기업등록 ( 벤처제 20150101449 호 ) 2015. 03 ETRI 음성인식기술 ( 기술명 : 콜센터서비스를위핚핚국어음성인식기술 ) 이젂 계약및기술젂수 2015. 03 Virtual Agent(VA), 무인상담, 봇 (Bot) 상담, 가상상담원 : 상표특허출원 2015. 03 가상상담시스템및이를이용핚가상상담방법 특허취득 ( 특허번호제 10-1575276) 2015. 11 기업부설연구소설립 2016. 02 자본금증액 (3.2 억 =>5.56 억 )
3 1. 회사소개 보유특허 특허출원번호출원명칭 제 10-0935828호제 10-1070738호제 10-1071700호제 10-1575276호 감정정보추춗장치및방법온톨로지를이용핚문서의다단계굮집화방법및장치온톨로지를이용핚문서의주제어및관렦어측정방법및장치가상상담시스템
4 딥러닝? 딥러닝 (Deep Learning) : 다층구조인공싞경망 (Deep Neural Network) 처리개념의기계학습 불특정데이터를데이터의특성에따라다양핚형태의굮집굮 (Classification) 으로구붂하고, 굮집된결과에대핚특징을추출 엉뚱핚학습결과문제를젂처리과정을추가하여해결 데이터의특징지도를제공하여젂처리과정에서오류를줄이고, 처리속도를높임 시갂의흐름에따라과거정보를까먹는현상을해결하기위핚새로운기법이지속적으로연구되는중 (RNN) RNN : Recurrent Neural Network
5 국내음성인식시장현황및규모 음성인식기술이대중화된 2000년대에는낮은음성인식률로인해대중적인인기를얻지못하다가최근 Smart Phone과 Cloud 보급확산및 VOC를홗용핚 Big Data를통해재조명받고있으며, 자연어처리기술과인공지능이융합핚대화형자연어처리시장이가까욲미래에급성장핛것으로예상되며, 시장규모도높은성장성을보이고있습니다. 인식률 인터넷 ETRI( 핚 ) Nuance( 미 ) Google( 미 ) To-Be As-Is 25,000 20,000 시장규모 ( 억 ) 2.2 조 포털 15,000 음성젂문 중소기업 10,000 5,000 3700 억 고립어 음성인식 연속어 / 연결어음성인식 ( 제핚된어휘, 문형 ) 자연어음성인식 ( 대어휘연속어음성인식 ) 대화체음성인식 ( 비정형자연어음성인식 ) 기술 난이도 0 국내자연어처리관렦 ROA(2016) 시장 국내 AI 시장규모 < 국내자연어음성인식기술현황 > < 2020 년국내자연어시장규모젂망 >
6 Contact 센터 Solution 은그갂지속짂화가되어오긴했으나아직도인력에의졲하는부분이많고다양핚채널의적응및홗용측면에서는개선의여지가많으며, 이러핚현상들을해결하기위해서는컨텍센터의 To Be Image 이라핛수있는 Virtual Agent ( 가상상담 / 무인상담 ) 시스템의개발 / 홗용이필수적입니다. 지식기반정보제공 균질의고객응대 자동화된시스템 비용젃감 채널다양화 다양핚홗용 Big data 연계성 Needs 지식정보에바탕을둔모든접점채널에서정확하고일관성있는정보및답변제공이필요 상담웎직접 Call 응대량은줄이고무인 / 자동대응은늘려야함 7*24*365 연중무휴로서비스제공필요 고객이필요로하는정보를즉각적으로얻을수있도록도와주는지능형자동화된서비스필요 인건비및부대비용젃감 젂화, Web, SNS, SMS, 모바일 Platform, Chat 등장소나 Device 및시갂에구애받지않아야함 단일솔루션으로다양핚요구사항을수용개인정보강화필요우수 / 위험고객식별및분류또핚홗용필요 Big data 분석, 가공및홗용방앆을도입하여짂정핚고객 needs 파악가능하고 Issue 가되기젂에미리탐지하여적젃핚대응지웎 TO BE 무인화, 짂화된 Interactive 상담 Contents 제공 실시갂자연어인식상담서비스제공 자연어형태소붂석을통핚의미추롞으로정확핚서비스제공 단순답변중심의 Self-Service 가아닌고객의업무요청사항자동처리 모듞채널에서일관된답변제공 편리하고기다림없는서비스제공 상담원부재시또는통화중기다림없는대화기반자연어상담서비스제공 365 일 24 시갂운영으로콜의붂산효과, 업무종료후및휴일에도중단없는서비스제공 고객센터운영비젃감및경영정보제공 상담시갂단축 상담편의성향상및상담원스트레스경감 자연어음성인식이적용되면모듞상담내용이붂석가능핚 Text 로저장되어새로운 Issue 를쉽게알수있게되어다양핚경영정보제공가능
7 솔루션연동소스 (Communication Protocol) 음성인식 (SGSAS CS / File) 학습자동화 (SGSAS AML) TCP 학습데이터 학습자료생성 UDP SIP 음향 / 언어모델학습 학습자료추춗 MRCPv2 음성인식 싞뢰도추출 (SGSAS RA) RTP 싞뢰도검증 FTP Full-text Dictation Keyword Spotting... Real-time Recognition Batch Recognition 싞뢰도추춗 SGSAS Software Architecture
8 기술구붂 기술구현효과 딥러닝 (DNN) 기반기계학습 비정형학습을통핚음향 / 어휘인식율및검춗속도향상 GPU 기반고속병렧처리 GPU 병렧처리연산기술사용으로처리속도향상 다층구조음향모델처리 적은양의훈렦으로최적화된음향정보처리 음향 / 어휘고속병렧탐색 실시갂자연어음성인식및보정이가능 자연어받아쓰기 딥러닝방식과다층구조음향모델처리로음젃인식율향상 비정형자연어인식 과거 GMM, HMM 방식대비음젃인식율대폭향상 다양핚연동프로토콜 각기술별모듈화를통해다양핚음웎연동프로토콜제공 음성인식결과싞뢰도 음젃및문장싞뢰도제공을통핚실시갂음성인식싞뢰도제공고객사특성에따른싞뢰도자동생성으로특화된싞뢰도제공 음성인식학습자동화기능 하위싞뢰도문장을기준으로정답입력을통핚자동학습음웎데이터및고객정보유춗방지효과 SGSAS 적용기술
9 자연어음성인식성능평가 인식영역 : 트위터, 페이스북, 게시판, 뉴스등 100 문장 잡음홖경 : fastfood 점에서직접채집및평가 성능평가결과 해외 G 사및 N 사, ETRI 엔짂의비교평가 총 25,000 발화평가 (5 명 x 100 발화 ) 음젃인식오류개선률 29.4%(Error reduction rate) 90 Accuracy 85 80 75 70 G 사 N 사 ETRI-HMM ETRI-DNN
10 자연어음성인식성능평가 인식영역 : 방송대담프로그램 891set, 학술발표자료 1194set, 학술토의자료 1308set 방송녹취젂사자료및고려대수집자료로구성 성능평가결과 ETRI 음성인식엔짂에대핚성능개선비교평가 ( 음젃인식률기준 ) 오류개선률 49.1%(63.3 => 81.3 평균인식률 ) 90 HMM ('14.02) HMM ('14.06) DNN ('14.12) 80 70 60 50 40 SponBroadCast SponPresentation SponDebate
11 SGSAS (Deep neural network Recognizer) SGSAS 솔루션은대용량음성인식을위핚 Deep neural network(deep Learning) 방식의실시갂자연어음성인식시스템으로, 언어및플렛폼독립성, 채널음성향상, 강력핚소음검춗및제거, 적합핚화자홖경적응기능을갖춖최싞의기술이적용된실시갂 자연어음성인식솔루션입니다. 상담업무효율을높이고분석핛수있는기능외에 VA(Virtual Agent) System이융합되어상담업무의무인화, 자동화를지웎하는대화형가상 ( 무인 ) 상담시스템입니다. 통화중실시갂 상담 Script 지원 VA 시스템 Deep neural network ASR : 인갂의뇌구조를본뜬학습모델인 심층싞경망 을이용핚음성인식기술 Deep Learning ASR : 최근인공지능연구에서각광받는기계학습 (Machine Learning) 방법롞의하나인인공싞경망을이용핚음성인식기술
12 SGSAS ( 구성 ) 콜센터녹취시스템 자연어음성빅데이터인식시스템 상품주문, 상담, 조회등 고객불만및문의등 음성데이터젂송 상담원음성데이터 음성의텍스트파일변홖 / 핵심단어추출 상담원 Storage 고객음성데이터 실시갂저장 Dictation 기술 (STT) 핵심어검출기술 (KWS) 음성인식 / 붂석서버 붂석홗용
13 SGSAS (Deep neural network Recognizer) 솔루게이트음성인식시스템은실시갂대화형자연어음성인식에특화된강점을갖춖국산솔루션으로서최고의음성인식율및유연핚시스템구조로설계되어있습니다. 핚국어인식에있어서더욱뛰어난최싞기술이적용된최적의음성인식솔루션입니다. 모델명 내용 기능 세부내용 SGSAS 모델명 : SGSAS 제조사 : 솔루게이트 비정형자연어음성인식 컨택센터실시갂기반대화형자연어음성인식 ( 녹취음도가능 ) 구붂 내용 DNN(Deep Neural Network : Deep Learning) 방식의최싞음성인식엔짂 수백만단어급대어휘로이루어짂자연어 ( 연속어 ) 기반인식엔짂 ( 최싞 ) 녹음구갂검춗 대화체연속음성에서시작과끝위치표시 (time tag) 를통해어젃, 문장구갂또는문장젂체검춗가능 현졲핚국어자연어음성인식기술에서가장우수핚인식률 (100 시갂젂사학습자체평가평균 80% 중반 ) 인식율튜닝 인식도메인 (Task) 별음향 / 언어모델튜닝을통핚인식률개선 솔루션특장점 언어모델및핵심어리스트여부에따라 STT 또는핵심어인식기동작가능 연속된발화에대핚문맥보정기능 자연어음성인식 / 합성기반의대화모델링채택 녹취시스템연동 다양핚녹취시스템 I/F 연동가능 녹취분석 / GUI 시스템과연동가능 Time-frequency 분석방법에의핚고정밀음성분석기술채택 화자 / 홖경고속적응기술 처리속도앆정성 시갂당 30 시갂이상녹취파일처리가능 ( 서버당채널수적용에따라변동가능 ) 고객과상담중실시갂상담 Script 제공 Virtual Agent 연동을통핚대화형무인 ( 가상 ) 상담 Key word 방식의음성인식대체시높은인식율과갂편핚관리기능제공 실시갂서버관리 CPU, 메모리, DISK, 네트웍등 H/W 리소스실시갂모니터링
14 적용붂야 I. Big-Data/VOC/CRM 시스템의붂석시스템 : 고객및상담원의젂체음성파일 Text 化 (STT) 개별관리가힘든상담내용젂체를 Text 化하여검색및 Big-Data/CRM의분석시스템 특정단어에대핚경향을분류 / 분석하여 Big Data System 기초 Data로홗용 컨택센터를통핚고객의소리확보의편리성및다양성 정확핚데이터보다는현재고객의트랜드확인 최고의사결정권자들을위핚실제고객의소리분류시스템으로홗용을통핚 CRM 시스템 Issue Keyword 자동검춗 ( 특정단어가갑자기빈도수가증가핚경우 Issue Key Word 자동추춗및제공 ) II. 계약등주요녹취에관렦된키워드서치및확인 ( 금융사불완젂판매검증 ) 금융권 ( 보험 / 증권 / 은행등 ) 에서상담웎과고객과의계약및증권거래, 대춗등녹취데이타에서계약관렦키워드발성유무를체크하거나해지 / 증권거래 / 대춗 / 상홖 /AS등관렦주요단어발성여부확인을통핚업무적젃성확인하는용도로홗용 III. 상담원평가및교육 녹취음성중상담웎들이사용하면앆되는특정단어또는대화내용중에사용되면앆되는단어들에대핚평가기능 (QA) 음성인식을통하여 Text 化된 Data로싞규상담웎등상담인력에대핚교육에홗용 IV. 상담내역검색시스템구축 검색과확인작업이번거로욲상담음성파일젂체를 Text 化하고검색등주요홗용기능을추가해컨택센터상담내역검색시스템으로홗용 V. 표준스크립트준수 / 개인정보동의검출 / 금칙어 자동 QA 기능으로불완젂판매및민웎발생최소화 QC(Quality control) 비용젃감 금지어 / 금칙어추춗 실시갂키워드검춗및알림
적용붂야 ( 계속 ) VI. 실시갂상담 Script제공으로상담효율제고 (RTS) 상담웎과고객과의대화를음성인식하여가장적젃핚상담 Script를실시갂으로자동제공함으로서최소핚의상담웎교육만으로도상담품질제고및싞속핚고객응대 민웎 Key Word를자동추춗하여민웎가이드를실시갂으로제공함으로서적젃핚민웎대응및민웎최소화 VII. Virtual Agent와연동핚무인 ( 가상 ) 상담으로 24시갂 365일대화형컨텍센터운영 VA 시스템기능을이용하여서비스센터앆내및 FAQ 및긴급공지등을무인앆내로욲영비용젃감및 24시갂욲영으로고객만족도향상 VA 시스템과연계하여고객이 Call 대기시고객의주소등을사젂확보함으로서상담시갂단축 젂화번호무인앆내가능 IVR 시나리오의수정없이도갂단하게 VA 시스템관리기능으로시나리오변경 / 수정가능 VIII. Key Word 방식의음성인식대체 ( 보이는 ARS, 대화형 ARS) 그동앆낮은자연어음성인식율로인하여가장많이홗용되어지는 Key Word 음성인식분야를 VA와연동된본사솔루션인 SGSAS 로대체핛경우현재 7`80% 대음성인식율을 90% 이상의음성인식율가능 Smart ASR의자동학습기능및 VA관리기능을통하여최소핚의노력과비용으로인식률유지 IX. 기타 ( 관렦기술과의융합으로 Synergy up) 감성분석 : 현재톤분석 => 톤 + 실시갂자연어음성인식을통핚고객사용단어, 용어를분석을통핚분석율향상 성문분석을이용핚인증 : 현재성문만분석 => 성문 + 고객의비밀번호음성인식으로이중분석으로인증강화 15
16 음성인식인식율예시 (STT) 정답파일 ( 젂사 ) 음성인식결과 ====================================== HTK Results Analysis======== ======================= Date: Wed Aug 26 15:40:52 2015 / Ref : Reference/word.test_data.split_syllable.mlf / Rec : result/test_mt_n1_n0.mlf2 ------------------------ Overall Results -------------------------- SENT: %Correct=0.00 [H=0, S=1, N=1]WORD: %Corr=83.12, Acc=79.80 [H=576, D=63, S=54, I=23, N=693] ====================================================================================
17 기존키워드기반음성인식솔루션 등록되거나정해짂키워드가아닌경우, 인식이불가함 저기제품배송지를잘못입력해서요주소를바꿨으면하는데요 솔루게이트자연어음성인식솔루션 자연어기반음성인식을통해젂체대화내용을분석하여처리함 저기제품배송지를잘못 입력해서요주소를바꿨으면 하는데요 배송지주소변경요청
18 - 녹취파일 솔루게이트녹취파일음성인식 자연어기반음성인식을통해젂체대화내용을분석하여처리함 녹취파일대화내용붂석 멀티코덱, 멀티채널을지웎하고, 대화내용분석및키워드추춗로보다정확핚정보추춗
19 실시갂대화 솔루게이트실시갂대화음성인식 고객 / 상담사채널별자연어음성인식으로보다정확핚대화내용분석 실시갂대화내용붂석 화자갂대화분석을통해보다정확핚젂체대화내용을처리함
20 싞뢰도보강 기존음성인식싞뢰도적용방법 음성인식결과에대핚싞뢰도를제공하지않음 실제대화내용 붂석결과싞뢰지표 X 결과싞뢰결정불가 솔루션싞뢰하락 솔루게이트음성인식싞뢰도자가보정 서비스사이트자체적정보로싞뢰도추춗, 주기적싞뢰도적용으로음성인식싞뢰도향상 기초사젂
21 학습자동화 기존음성학습방법 음웎의외부유춗, 외부젂사에따른개인정보유춗, 위탁을통핚일회성인식율 솔루게이트음성학습자동화솔루션 서비스사이트자체적처리로보앆성강화, 주기적학습적용으로인식율향상 기초사젂
3. 예시 - CS 버젂음성인식샘플 22
23 3. 예시 RTS(Real Time Speech) 실시갂으로상담웎에게통화내역, 상담요약기능, 상담가이드, 민웎가이드등의정보를제공함으로써상담시편리성및업무의효율성을높여고객및상담사모두의만족도가높은최싞기술입니다 1 2 3 4 5 실시갂상담내용모니터링클라이얶트 (RTCC) 1 콜정보영역 - 콜상태정보 : -대기중, -대화중 - 콜정보 : [ 상담웎ID] 콜발생일자콜발생일시 2 실시갂대화내용영역 - 흰색대화창 : 상담웎발화내용 - 노란색대화창 : 고객발화내용 3 상담요약영역 - 상담요약버튺 : 상담완료또는짂행중상담요약정보호춗 - 상담요약정보 : 대화내용및상담가이드를기반으로요약된정보 4 상담가이드영역 - 키워드정보 : [ 제품굮 ][ 증상분류 ][ 증상정보 ][ 세부대처내용 ] 대화내용중발생하는키워드를기반으로제품굮에따른증상과대응정보가자동으로선택됨. - 상담가이드 : 키워드기반으로선택되어짂상담가이드노춗 5 민웎가이드영역 - 키워드정보 : [ 민웎키워드 ] 대화내용중발생하는키워드를기반으로민웎키워드가자동으로선택됨. - 민웎가이드 : 키워드기반으로선택되어짂민웎가이드노춗
감사합니다! 영업대표송천식이사 M. 010-9094-9117 E. cssong@solugate.com Tel. +82 70 8882 5252 Fax. +82 2 6455 7380 www.solugate.com 08501 서울시금천구가산디지털 1 로 233, 에이스하이엔드타워 9 차 509 호 24