Insight Korea Big Data Solution: Insight Deep MininG Service
What is Big Data?
What is Big Data? Naver 빅데이타검색 Trend - 3 -
What is Big Data? - 4 -
What is Big Data? - 5 -
Insight Korea Big Data Solution : Insight Deep MininG Service System
Insight Korea Big Data Solution System Deep Learning 기반 Mining(STT, TTT) Technology Partner 한국전자통신연구원 (ETRI) 의뛰어난텍스트마이닝특허기술적용 ( 국내특허 10 건, 국제특허 6 건 ) 한국전자통신연구원 (ETRI) 의뛰어난음성인식특허기술적용 ( 국내특허 11 건, 국제특허 6 건 ) Insight Korea Big Data Service Deep Learning 기반 Big Data Solution Platform & SI System Partner Marketing Research& Consulting - 7 -
Insight Korea Big Data Solution System Framework 비정형데이터를정형데이터와결합하여빅데이터인프라를통해사용자요구에맞는서비스결과를제공합니다. Call ARS 전화상담 Virtual Agent ( 가상상담원 ) 대화관리 대화생성 음성합성 녹취서버 Batch Realtime STT ( 음성인식 ) 음성인식 음성학습 Deep Neural Network TA ( 텍스트분석 ) NLP Text Mining Detection 빅데이터분석인프라 Analysis Model STT/TA 결과소셜빅데이터정형데이터 Python R Solr Machine Learning Impala/Spark Customer e-mail Web 게시판상담 채팅상담 이메일상담 Legacy 고객 DB 상품 DB 거래 DB Hadoop 사용자 UI 분석가의사결정자사용자주도분석 Dashboard SNS Crawl ( 정보수집 ) 설정 수집 MINDs Insight ( 텍스트분석 ) NLP Text Mining Market Insight ( 데이터가공 ) 목적 / 관점 키워드정제 데이터추출 User-Driven Analysis ( 데이터분석 ) 목적 / 관점 키워드기준 저장 Issue/Risk Detect 시각화 데이터추출 - 8 -
Technology Partner 사와 R&R VOC 분석을위한핵심기술 음성인식및텍스트마이닝 원천 Data 수집 / 전처리 분석 활용 내부 Data 컨택센터, A/S 센터 E-Mail, 제품정보등 MINDs STT Pre-Processing 1 Taxonomy 2 Speech to Text Text Mining (Unstructured) 3 자연어처리 (NLU) 5 Classification MINDs Lab 4 Keyword 추출 6 감성분석 ( 긍정 / 부정, 선호도 ) Insight Deep MininG VoC Dashboard Insight Deep MininG SI Partner Report Insight Deep MininG 외부 Data Text Data Mining (Structured) 7 Statistics 8 Association Risk 대응 Marketing 활용 블로그까페지식인 SI Partner Web Crawling 9 Risk Scoring 10 Predictive Analysis ( 예측분석 ) 위기감지불만요인분석경영층보고서 : 제품개선마케팅효율화 SCM 운영개선 : - 9 -
Insight Korea Big Data Solution Technology Partner: MINDs Lab. Solution 차별점
MINDs Lab. Solution 차별점 1 최고의 STT 인식률 8 빅데이터분석인프라 2 음성톤분석통합 9 Power User 용 Flexible UI 3 강력한탐지력을가진다중탐지사전 10 자연어검색엔진 Solr 내장 4 딥러닝감성분석및분류엔진 11 최신머신러닝분석툴 H2O 내장 5 자동사전보강프로세스 12 표준 End User UI 및시각화도구 I/F 6 최고성능한국어 NLP 13 Big Data Platform 제공 7 실시간음성인식및텍스트분석 - 11 -
1. 최고의 STT 인식률 현재까지달성한인식률분석결과도메인별분리학습을실시할경우평균인식률이음절단위 85% 이상, 키워드단위 95% 이상도달. DNN 의로직으로볼때인식률의한계선은없으며학습에의해서계속개선. 인식률 현재시점키워드최고기록 95% STT 新버전 (DNN) 평균키워드인식률 95% 이상 85% 현재시점음절최고기록 : 94.78% 평균음절인식률 90% 이상 STT 키워드기준 77.3% STT 음절기준 舊버전 100 시간학습 新버전 100 시간학습 normal 新버전 100 시간학습최고기록 300 시간학습 - 12 -
2. 음성톤분석통합 Raw Data (pcm) 음성의 Volume / Pitch 분석등을추가해서고정밀감성분석가능 Pitch 산정위한가공데이터 Spectrum Analyzer ( 저 / 중 / 고음 ) Pitch & Volume Data by Time 최종판정 Volume - 13 -
3. 강력한탐지력을가진다중탐지사전 다중탐지어사전 (HMD) 은마인즈랩의 Text Analytics 엔진인 i-voc TA 에의해서지원됩니다. < 마인즈랩 i-voc 를활용한다중탐지어구현 > Hierarchical Multiple Dictionary ( 다중탐지어사전 ) i-voc TA + + 중요어휘도기술세부감성분석내용기반자동분류기술 - 14 -
4. 딥러닝감성분석및분류엔진 기존의알고리즘대비높은성능을보이는딥러닝감성분석엔진과분류엔진을내장 Data set Model Accuracy SVM (word feature) 85.58 Mobile Train: 4543 Test: 500 RAE (word feature) )+Word embedding 87.57 CNN(relu,kernel3,hid50) +Word embedding (word feature) 91.20 CNN(relu,kernel3,hid50)+Random init. 89.00-15 -
5. 자동사전보강프로세스 데이터가쌓일수록정확해지는딥러닝 & 탐지사전간자동사전보강프로세스내장됨 국민연급 국민연금보험료인상시기를놓치면국채발행이라는최후의수단을통해연명할수밖에없다는우려가제기됐다. 3 딥러닝학습 딥러닝 (Deep Learning) 엔진 Output 재해 Classifier Feature Extractor 다중탐지어사전 (HMD) L1 국민연금국민연금 $ 보험료국민연금 $ 국채발행인상 @ 시기 @ 놓치 어휘분류체계 (Taxonomy) L1 재해 L2 화산 폭발 국민연금 부과방식 고갈 레저 수상스포츠 한강홀릭 쇼핑 백화점 홈쇼핑 1 2 사전기반탐지 사전작업 일본화산폭발 ' ' 아소산분화 ' 일본각지에서자연재해가잇따르고있다. 원문원문 ( 연금 ) 원문 ( 연금 ) 국민연금보험료인상시기를놓치면국채발행이라는국민연금보험료최후의인상시기를수단을놓치면통해연명할국민연금보험료인상시기를놓치면국채발행이라는수밖에없다는최후의우려가수단을제기됐통해다국채발행이라는최후의수단을통해연명할. 수밖에없다는우려가제기됐연명할수밖에없다는우려가제기됐다. 국민연금은현재 9% 인국민연금일본다. 국민연금은현재 9% 인국민연금보험료율을화산폭발유지할 ' ' 아소산경우분화오는' 일본 2060각년지에서보험료율을유지할경우오는 2060년기금이자연재해가고갈될것으로잇따르고추산되고있다있다.. 기금이고갈될것으로추산되고있다. 6 엔진실행결과사전반영 Input Data, Label 재해 4 학습이미지획득 5 분류엔진실행 일본기상청은 15 일이분화가땅속의마그마에닿은지하수등이수증기가돼폭발하는 ' 마그마수증기폭발 ' 일가능성이높다고발표했다. 종합 사전방식과기계학습방식이결합된종합분석결과 - 16 -
6. 최고성능한국어 NLP( 자연어처리 ) 마인즈랩 NLP 는국책연구기관인한국전자통신연구원 (ETRI) 에서 30 여간연구 / 개발한한국어처리핵심기술로서한국어처리를위한대용량의분석사전과정확성향상을위한기계학습기반의기술이포함되어있음. 1 대한은행이인터넷을통해중도금대출서류작성을편리하게할수있는서비스를마련했다. 복잡한중도금대출을온라인으로신청 접수할수있는중도금대출온라인신청서비스를시행한다고 25 일밝혔다. 수집문서를기계학습에기반한문장분리모델을통해문장단위로분리 제안 NLP 특장점 2 문장분리 형태소분석 대한은행이인터넷을통해중도금대출서류작성을편리하게할수있는서비스를마련했다 복잡한중도금대출을온라인으로신청 접수할수있는중도금대출온라인신청서비스를시행한다고 25 일밝혔다 수집문서를가장작은의미단위인형태소단위로분할 대한 /nc+ 은행 /nc+ 이 /jc 인터넷 /nc+ 을 /jc 통하 /pv+ 어 /ec 중도금 /nc 대출 /nc 서류 /nc 작성 /nc+ 을 /jc 편리 /nc+ 하 /xsm+ 게 /ec 하 /px+ ㄹ /etm 수 /nb 있 /pa+ 는 /etm 서비스 /nc+ 를 /jc 마련 /nc+ 하 /xsv+ 었 /ep+ 다 /ef 국립국어원의세종계획말뭉치, 국내외대학 / 연구소의다양한언어자원및언어처리기술성과를바탕으로연구 / 개발된 ETRI 의한국어언어처리기술및노하우반영 3 4 개체명인식 구문분석 문장에포함된인물명, 기업명, 장소, 숫자표현등의개체명 (Named-entity) 인식 <<OGG_Economy: 대한 /nc+ 은행 /nc>>+ 이 /jc 인터넷 /nc+ 을 /jc 통하 /pv+ 어 /ec 중도금 /nc 대출 /nc 서류 /nc 작성 /nc+ 을 /jc 편리 /nc+ 하 /xsm+ 게 /ec 하 /px+ ㄹ /etm 수 /nb 있 /pa+ 는 /etm 서비스 /nc+ 를 /jc 마련 /nc+ 하 /xsv+ 었 /ep+ 다 /ef 문장에서주어, 목적어, 서술어등의수식관계문장구조식별 (((((( 대한은행이 /NP_SBJ 인터넷을 /NP_OBJ 통해 )/VP ((( 중도금 /NP 대출 )/NP 서류 )/NP 작성을 )/NP_OBJ 편리하게 /VP_AJT 할 )/VP_MOD 수 )/NP_SBJ 있는 )/VP_MOD 서비스를 )/NP_OBJ 마련했다 )/ROOT 170 여분류의개체명인식성능제공 ( 개체명분류관련세계최다분류체계구축 ) 각단계에걸쳐, 전처리 / 후처리를위한각종사전, 규칙등이적용가능하여신조어등에효과적으로대응가능 - 17 -
6. 최고성능한국어 NLP( 자연어처리 ) 산업도메인및고객특성에유연한대처가가능하도록대용량기본사전및사용자사전을제공 기본사전 30 만어휘 기분석사전 ( 부분어절에대한형태소분석결과를미리구축하고다양한복합명사에대한복합어분해사전포함 ) 160 만어휘 인명및기타분석사전으로약 10 만어휘구축 15 개대분류 : PERSON, STUDY_FIELD, THEORY, ARTIFACTS, ORGANIZATION, LOCATION, CIVILIZATION, DATE, TIME, QUANTITY, EVENT, ANIMAL, PLANT, MATERIAL, TERM 170 여유형에서약 360 만어휘에대하여개체유형을부착한사전을구축 축약형 ( 건국대학교 -> 건대 ), 혼용형 ( 국민학교 -> 초등학교 ), 약칭형 ( 미래창조과학부 -> 미창부 ), 별칭형, 이동형, 생략형 등다양한이형태표현에대하여원형복원사전을통해일관성있는어휘관리를지원함 약 8 만어휘에대한분석사전구축 - 18 -
7. 실시간음성인식및텍스트분석 마인즈랩 ivoc 는실시간 STT 뿐만아니라실시간 TA 까지완벽히지원됨 Real-Time STT-TA : 실시간 Text 전환, Keyword 분석, 패턴분석, 감성분석및콜분류와요약 REC 녹취파일 수집 / 분배서버 수집 분배 음성인식서버 STT STT STT TA 서버 NLP 키워드 패턴 감성분석 콜분류 요약 결과처리 분석서버 Impala Solr Hadoop Web/WAS Dashboard STT n 대 VOC 전사 QA 평가상담요약분류 실시간이슈 Keyword - 19 -
Cluster Classify Regression Trees Boosting Forests Solvers Gradients 8. 빅데이터분석인프라 i-voc 는비정형 ( 음성 / 텍스트 ) 과정형데이터, 내부와외부 VOC 를아우르는통합플랫폼입니다. 내부 시스템 내부 데이터 I/F 정형 데이터 고객사정형 DW 정형분석 STT/TA 영역 배치분석 외부 시스템 외부 데이터 I/F 비정형 데이터 STT NLP TM 음성인식결과 언어모델학습 음성모델학습 구문분석 개체명인식 형태소분석 문장분리 내용기반자동분류 감성분석 연관어분석 어휘중요도분석 H D F S H2O Prediction Engine SDK/API Rapids Query R-engine In-Mem Map Reduce Distributed fork/join Memory Manager Columnar Compression Impala Nano Fast Scoring Engine Deep Learning Ensembles 시 각 화 사용자 Streaming 영역 Spark R 실시간분석 - 20 -
9. Power User 용 Flexible UI Power User 나프로젝트수행인력을위한 Flow 구조의 UI 제공 - 21 -
10. System Infra & 자연어검색엔진 Solr 내장 - 22 -
11. 최신머신러닝분석알고리즘제공 선형모델 (GLM) Cox Proportional Hazards Naïve Bayes Random Forest Distributed Trees GBM R 패키지- Super Learner Ensembles Multi-layer Feed-Forward Neural Network Auto Encoder Anomaly Detection Deep Features K-Means Principal Component Analysis Generalized Low Rank Models Generalized ADMM Solver L-BFGS (Quasi Newton Method) Ordinary Least-Square Solver Stochastic Gradient Descent Integrated R-Environment Slice, Log Transform - 23 -
12. 표준 End User UI 및시각화도구 I/F ivoc 탐지결과는 Web 기반의표준 End User UI 또는 Tableau 등 BI Tool 과 Interface 됩니다. 1 HMD 토픽별언급문장현황 2 제품별언급토픽현황 3 대시보드로구성 - 24 -
13. Big Data Analytics Platform 제공 - 25 -
Insight Korea Big Data Solution: Insight Deep MininG Service 분야
Data Mining & Analysis Contents 문장분리 어휘중요도분석 이벤트분석 형태소분석 어절단위구문분석 연관어분석 감성 / 속성분석 Risk 탐지 개체명인식 이슈군집분석 경쟁관계분석 - 27 -
산업 What is Big Data? 금융기관리스크관리 빅데이터기반광고 소비재산업마케팅 콜센터효율화빅데이터분석 헬스케어빅데이터 IoT 홈오토메이션 비즈니스활용영역 음성인식자연어처리감성분석이미지분류데이터마이닝 빅데이터딥러닝질의응답 - 28 -
Insight Deep MininG Services 의 Marketing 활용분야 Consumer Needs NPD AD/Campaign/ Promotion 상담 /Call 센타 Marketing/ Brand 전략 Lifestyle/Trend 기업이미지 Customer Unmet 신상품 / 서비스 단계별매체인지 Consumer Brand Buzz 량 Consumer Life 기업이미지 Needs Consumer Usage Behavior Category Definition Key Buying Factor 분석 상품 / 서비스사용후만족 / 불만족 Idea 도출 New Recipe 발굴 신상품출시후초기반응및개선점도출 경쟁사신상품반응분석 Product Design 반응및벤치마킹 경로분석 Media Planning 광고 / 캠페인등의모델이미지분석 효과 /Performance 분석 Communication Concept Experience Management 분석 Customer Loyalty Management 인바운드상담업무효율화 TM 업무효율화 변화모니터링 Brand Image & Positioning 변화및원인분석 경쟁브랜드및경쟁력비교 각브랜드이슈발생후위험요인초기모니터링 Style 변화및영향요인파악 Issue Trend 분석 OL 특성및 Key Issue 진단 거시경제지표와 Life Style 관계분석 기업이미지변화방향 각종기업이슈발생에따른위험요인도출및리스크예측 점 디자인발굴 Development QA 업무효율화 가격인상 / 인하에 고객경험관리단 소재 / 원료 / 성분 Brand Image & RISK 관리 ( 상품 따른고객반응 계별 Trigger & 소비자효익표현 Positioning 영향 불만징후감지, 영 온라인몰 Barrier 언어개발 력분석 업 / 마케팅불만 유통상에서 User Journey Mapping 융복합상품아이디어 seed 도출 신상품 / 서비스 Concept Development 효율성분석 광고 / 캠페인구성요소별진단 요인감지, 서비스불만요인감지등 ) Operation 개선 ( 상품기획정보, 고객서비스운영개선정보, 영업활동개선정 판매가격파악 보등 ) - 29 -
Insight Deep MininG Services 상담 VOC 분석세부활용분야 상담업무효율화 VOC 빅데이터분석 1 1) 콜내용요약 4 1) 상품불만징후감지및분석 인바운드상담업무효율화 2) 통화내용에의한자동분류 3) 고객불만의근본원인분석 4) 통화내용파악을통한 Risk 관리 2) 영업 / 마케팅불만요인감지및분석 3) 고객 / 서비스불만요인감지및분석 4) 대외민원불만요인감지및분석 업무프로세스개선점제공 5) Compliance Risk 징후감지 2 TM 업무 활용 1) 불완전판매여부분석 ( 필수고지사항, 본인동의, 조건등 ) 2) 상담원별상담패턴분석정보제공 5 5. Operation 개선 1) 고객니즈기반상품기획정보제공 2) 고객서비스운영개선정보제공 3) 상담내역에대한각종키워드분석 3) 영업활동운영개선정보제공 3 1) 상담스크립트준수여부검출 ( 금칙어 / 규칙어 ) QA 업무 효율화 2) 통화내용전수검사를통한 QA 업무효율성향상 3) 실시간모니터링정보제공 4) 상담원성과차이분석 - 30 -
Insight Deep MininG Service 를 활용한통합 VOC Management
Integrated VOC Management VOC 관리체계에 Big data 가활용된배경 과거대부분의기업들은수집된 VOC 데이터를제대로활용하지못하고 VOC 해소여부만을모니터링하였으나이제는 Big data 분석, 가공및활용방안을도입하여진정으로고객이원하는것이무엇인지확인할수있게됨 통합 VOC 관리의의미 Ⅰ 콜센터중심 VOC 관리 Social Data 통합 VOC Blog 커뮤니티 SNS 콜센터 VOC Portal 검색 소셜데이터포함, 기업내 외부 VOC 통합관리 Blog SNS 콜센터 VOC 커뮤니티 Portal 검색 홈페이지 Q&A 홈페이지 Q&A 통합 VOC란 Call Center 등경로로유입된고객의직접적 Voice 뿐만아니라 Social Network상에서교환되고있는간접적 Voice까지 통합 관리하는모델을말합니다. - 32 -
Integrated VOC Management 통합 VOC 관리의성공요소 통합 VOC 관리의성공의열쇠는 Technology 측면의접근만이아닌정보를어디에활용할수있는지명확하게정의하는것 통합 VOC 관리의의미 Ⅱ Insight 추출 신상품개발 마케팅전략 상품 / 서비스개선포인트도출 고객응대개선 조기경보 담당부서로의적극적인피드백및활용프로세스구축 관련부서활용 제품 / 서비스개발마케팅고객관리리스크관리 서비스불만요인및추가필요기능정의 캠페인 ROI 평가체계구축 Customer Experience 체계연계 부정적평판조기대응 통합 관리의두번째측면은 Insight 추출후관련부서로의피드백프로세스까지 포함한다는것입니다. - 33 -
Integrated VOC Management Our Service Category_ 서비스유형 고객사의규모와요구사항, VOC 활용목적에따라통합 VOC 관리체계및데이터분석플랫폼을고객사에직접도입하거나분석서비스형태로제공받는크게두가지방식으로서비스유형을선택하시거나, 두가지방식을결합한하이브리드방식의도입도가능 VOC 분석서비스제공 (Analysis as a Service) 마인즈랩이보유하고있는 VOC 분석엔진과 Tool 을활용한분석및인사이트리포트제공서비스 마인즈랩이보유하고있는 VOC 분석엔진과 Tool 을활용하여콜데이터또는 SNS 상의데이터를분석하여찾아낸인사이트를리포트로제공하는서비스. 월별또는분기별등다양한주기로정기적인분석서비스를제공 + VOC 분석체계도입지원 (Embedding) 고객사의자체적인 VOC 분석체계구축을지원하는서비스 VOC 를수집 / 가공 / 분석 / 활용하는체계를자체적으로구축하고자하는고객사를종합적으로지원하는서비스 진단및마스터플랜, 개별고객사맞춤형통합 VOC 분석체계설계, 분석엔진및툴도입지원, 시스템구축지원 - 34 -
Activate 고객이탈방지 리스크관리 서비스개 선 잠재고객발굴 신규상품개발 Analyse CONTEXT EMOTION AUDIENCE ROOT-CAUSE PREDICTIVE Data Processing 음성인식 음성인식학습 감성분석 TextMining 자연어처리 산업별트렌드이벤트 / 리스트키워드 / 연관어분석 MINDs STT MINDs TA MINDs Insight 지도학습 비지도학습 MINDs Machine Learning Management 사용자사전 키워드 TEXONOMY HMD COLLECT CONNECT Voice ( 음성 ) Social (SNS) Web Crawling Log ( 로그 ) Structured Date ( 정형데이터 ) EXTERNAL DATA INTERNAL DATA - 35 -
기본통계 > Dashboard(Keyword) 2016-01-01 총콜건수 : 500(2016-03-07 14:11), 콜처리건수 : 350(2016-03-07 14:11), 평균콜처리시간 : 3Min(2016-03-07 15:11) 현재일기준으로한달전기간 - 현재일의기본통계가중심 - 기간검색은빅데이터분석에서가능 업무유형별 Keyword 빈도비율 업무유형별 많이사용한키워드순위로표시 계약 _42% 보상금신청 _33% 해지처리 _24% 불만유형별 Keyword 빈도비율 불만 _45% 불만유형별 고불만 _30% Keyword 빈도수 상품 312 계약 255 보험 100 키워드는 TOP 10 개까지 Keyword 클릭시빈도추이표시 - 화면로딩시첫 Keyword 빈도추이표시 - 36 -
빅데이터분석 > Keyword 업무유형별키워드비율 Volume of the Calls for the current selection Category Calls Count 고객요구사항 고객불만사항 Category 해지처리 30% 보상금신청 24% 업무유형클릭시키워드수표시 12 해지처리 보상금신청 계약 12 2 1 키워드기준업무유형별전체 Count, 업무유형별고객요구사항, 업무유형별고객불만사항표시 7 1 1 2 1 1 업무유형해지처리보상금신청계약 업무유형별고객요구사항과불만사항표시 - 업무유형클릭시달라짐 문서리스트 차트 or Count 수를클릭했을때해당문서리스트를표시 Volume of the Calls for the current selection 고객요구사항 or 고객불만사항 Count 문서리스트를클릭했을때팝업형태로표시 # PID DID Date File 유형 Sentence 8 체크한부분만화면에표시됨 - 업무유형은 Default 로 1 개이상체크되어야함 고객요구사항없음 RC교체보험 _ 대출보험 _ 계약고객불만사항없음불만고불만 Period 2016.03.01~2016.03.07 1 hli_data2 20160222 2000011U^KGIQ07811369_CONV RC 교체 여보세요. 네여보세요. 네고객님여기아까. 방금전에통화했던한화생명김현정인데요. 네도현진님되실까요. 네네고객님다름이아니고고객님아까. 외환은행으로약관대출이자변경해드렸는데네부분고객님이십오일날까. 구월달이십오일부터이자부분출금이되세요. 그러세지금네확인해보니까. 고객님아까. 가상계좌말씀해주셨는데요. 네약관대출은고객님그가상계좌가있습니다. 우리은행요. 네네예알겠습니다. 고객님근데우리은행계좌번호하구요. 금액도같이문자로좀보내드릴까. 알겠습니다. 네김현정었습니다. 늘건강하세요. 화살표를이동하여기간조정가능 2 hli_data2 20160222 2000110UW$TK$10411368_CONV 자동이체 행복을전하는상담원김은영입니다 3 hli_data2 20160222 200021-MQL2KA11311371_CONV 카드수납 행복을전하는상담원아라입니다 4 hli_data2 20160222 200031-G$HH($09911370_CONV 서비스불만 고객과함께하는상담원조희주입니다 - 37 -
빅데이터분석 > 업무유형별 Call 분석 업무유형별고객불만사항 10 8 6 4 2 0 5 1 2 1 1 1 해지처리보상금신청계약 업무유형별 HMD탐지어해지처리상위차트에표시되는고객의보상금신청 HMD 계약탐지어를 TreeMap으로표시 말 @ 없 소 @ 소송 안내 @ 안하 고불만 _ 민원 : 5 불만상담 @ 없말 @ 없얘기 @ 없 고객 : 홍길동 HMD탐지어설명 @ 없오래 : 소 @ @ 걸소송지금 @ 얘 Sum: 2 기리 @ 아니 얘기 @ 없이해 @ 없환급금 @ 차이 업무유형별불만사항표시 빨리 @ 하어주 빨리 @ 부탁 1 2 3 항의 전화 @ 얘기 @ 아얘기 @ 니시냐구없 고불만 _ 민원 불만 _ 보험 불만 _ 계약 보험 @ 얘기 @ 없 얘기 @ 없 사망 $ 전화 @ 안되 이해 @ 못하 잘못알 업무유형별고객요구사항 15 10 5 0 문장 4 HMD 탐지문장 업무유형별고객요구사항표시 5 2 2 1 1 1 1 3 1 2 해지처리보상금신청계약 HMD 탐지어클릭시문장을보여줌 3 기타 보험계약 보험대출 RC 교체 홍길동 >> 지금 $ 얘기 $ 아니내가얘기하는거는유지를원하는것이아니고지금한칠년동안육만얼마하는건데... 문서리스트를클릭했을때팝업형태로표시 14Page Audio Player 연결 체크한부분만화면에표시됨 -업무유형은 Default 로1개이상Category 체크되어야함 업무유형 해지처리 보상금신청 계약 고객요구사항 없음 교체 _RC 보험 _ 대출 보험 _ 계약 고객불만사항 없음 Period 불만 - 설명미흡 불만 - 수령금과소 고불만 _ 민원 2016.03.01~2016.03.07 # PID DID Date File 업무유형분류 1 분류 2 HMD Sentence 1 hli_data 2 20000 20160222 11U^KGIQ07811369_CONV 해지처리불만해지환급금관소수령금 / 과소 / 부족 - 38 - 여보세요. 네여보세요. 네고객님여기아까. 방금전에통화했던한화생명김현정인데요. 네도현진님되실까요. 네네고객님다름이아니고고객님아까. hli_data 차트2 or 20001 20160222 10UW$TK$10411368_CON 해지처리불만해지환급금설명부족설명 / 과소 / 부족행복을전하는상담원김은영입니다 2Count 수를클릭했을때V 해당문서리스트를 hli_data표시 3 20002 20160222 1-MQL2KA11311371_CON 보상금신청불만보상금신청복잡보상금 / 신청 / 복잡행복을전하는상담원아라입니다 2 V 4 hli_data 2 20003 20160222 1-G$HH($09911370_CONV 보상금신청 고불만 보상금과소 보상금 / 과소 고객과함께하는상담원조희주입니다 4 hli_data 2 20004 20160222 1-G$HH($09911370_CONV 계약 대출 보험금대출신청 보험 / 신청 / 조회 고객과함께하는상담원조희주입니다
빅데이터분석 > 감성분석 업무유형 60 40 20 0 고객요구사항 5 4 3 2 1 0 해지처리보상금신청계약기타업무 1 업무 2 업무 3 1 1 업무유형에해당하는고객요구사항표시 3 2 4 2 1 3 2 업무유형별 HMD 개수 3 1 RC 교체 보험대출 보험계약 요구 3 요구 4 요구 5 요구 6 요구 7 해지처리 보상금신청 계약 기타 업무 1 업무 2 Percentage of Emotion 업무유형별 or 고객요구사항별감성비율 # PID DID Date File 유형 Sentence 30% Volume of the Sentiment Type for the current selection 10% 20% 50 negative neutral positive Category 업무유형해지처리보상금신청계약 고객요구사항없음교체 _RC 보험 _ 대출보험 _ 계약고객불만사항없음불만-설명미흡불만-수령금과소고불만 _ 민원 Period 2016.03.01~2016.03.07 1 hli_data2 20160222 20000 11U^KGIQ07811369_CONV 불만 _ 설명미흡 차트 or Count 수를클릭했을때해당문서리스트를표시 여보세요. 네여보세요. 네고객님여기아까. 방금전에통화했던한화생명김현정인데요. 네도현진님되실까요. 네네고객님다름이아니고고객님아까. 외환은행으로약관대출이자변경해드렸는데네부분고객님이십오일날까. 구월달이십오일부터이자부분출금이되세요. 그러세지금네확인해보니까. 고객님아까. 가상계좌말씀해주셨는데요. 네약관대출은고객님그가상계좌가있습니다. 우리은행요. 네네예알겠습니다. 고객님근데우리은행계좌번호하구요. 금액도같이문자로좀보내드릴까. 알겠습니다. 네김현정었습니다. 늘건강하세요. 2 hli_data2 20160222 20001 10UW$TK$10411368_CONV 불만 _ 수령금과소행복을전하는상담원김은영입니다 - 39 -
빅데이터분석 > Audio Player - 40 -
Insight Korea Big Data Solution: Technology Partner MINDs Lab. 소개
Minds Lab 소개 마인즈랩은머신러닝과빅데이터기술을기반으로다양한솔루션과서비스를제공하는 ETRI 연구소기업입니다 회사명 마인즈랩대표자유태준 사업분야 주소 전화번호 031-625-4340 회사설립년도 음성인식, 텍스트분석소프트웨어및빅데이터분석컨설팅서비스제공 [ 본사 ] 대전광역시유성구가정북록 96, 307 호 ( 장동, 대전경제통상진흥원 ) [ 기술센터 ] 경기도성남시분당구대왕판교로 660 유스페이스 1-B 동 12 층 2014 년 1 월 해당부문종사기간 2014 년 1 월 ~ 2015 년 7 월 (1 년 7 개월 ) 2015. 12 삼성화재 Data 분석기반혁신과제추진프로젝트수주 2015. 12 현대카드 ' 콜센터음성인식율검증 POC 프로젝트 2015. 11 건강보험심사평가원 ' 지식기반심사시스템고도화사업 ' 텍스트분석부문수주 2015. 11 ' 딥러닝기반의스마트홈음성인식장치기술개발 ' 연구소기업 R&BD 프로젝트수주 2015. 10 LG 전자콜센터효율화프로젝트 ( 실시간 STT) 2015. 10 CJ 쇼핑음성분석시스템구축프로젝트참여 2015. 9 GS 쇼핑콜센터 STT PoC 프로젝트 2015. 9 인사이트코리아소셜빅데이터분석플랫폼구축프로젝트 ETRI 맞춤형기술지원지정기업 국가연구개발우수성과선정 2015. 8 VC 로부터투자유치성공 2015. 8 ING 생명 Big Data PoC 프로젝트 2015. 8 삼성화재 STT 솔루션 PoC 프로젝트 2015. 6 국민권익위원회행정심판내용분석프로젝트 2015. 4 스타벅스코리아트렌드센싱프로젝트 2014. 12 한화생명빅데이터 Assessment 수행 POC 2014. 12 MINDs Seminar II 성과창출의 New Agenda 빅데이터로찾아내는고객의소리 2014. 9 한국환경정책평가연구원보도자료를활용한우리나라과거기후변화관측영향자료구축및분석 2014. 7 미래창조과학부국가연구개발우수성과 100 선선정 2014. 7 덴츠코리아소셜빅데이터를통한토요타캠리 KBF 분석프로젝트 2014. 7 HS 애드 LG 전자페이스북분석리포트용역 - 42 -
Minds Lab 소개 한국전자통신연구원과기술협력파트너십을통해엑소브레인 SW 개발프로젝트에공동참여하여상시적인 핵심연구의공동협력체계를구축하고있습니다. 엑소브레인연구 엑소브레인과제는 세계최고인공지능기술선도 라는비전을달성하기위하여미래창조과학부소프트웨어분야의국가혁신기술개발형 R&D 과제임. 과제의목표는 자연어를이해하여지식을자가학습하며, 전문직종에취업가능수준의인간과기계의지식소통이가능한지식과지능이진화하는 SW 인엑소브레인 SW 를개발하는것으로현재엑소브레인연구과제참여기업으로연구중임. 엑소브레인 SW 개발프로젝트마인즈랩공동참여 < 관련기사 > 단계별연구목표와연구결과 세부과제별역할 지능진화형 WiseQA 개념도 - 43 -
Minds Lab 소개 마인즈랩은 Big Data 와 Deep Learning 을결합한첨단 Solution 과 Service 를제공하고있습니다. PwC 컨설팅 - 44 -
ETRI 특허기술 한국전자통신연구원 (ETRI) 의뛰어난음성인식특허기술적용 ( 국내특허 11 건, 국제특허 6 건 ) 채널정규화장치및방법 K 실내측위기술을사용한잡음제거방법및장치 엔베스트인식단어계산량감소를위한 2 단계발화검증구조를갖는음성인식장치및방법 발화검증기반대용량음성데이터자동처리장치및방법 K 화자변이정규화방법에기반한강인한음성인식시스템 음성인식장치및방법 한국어연속음성인식을위한컨퓨젼네트워크리스코어링장치및이를이용한컨퓨젼네트워크생성방법및리스코어링방법 K 연속어음성인식장치및방법 음성인식방법및이를위한시스템 K 언어모델군집화기반음성인식리스코링기술 자동음성인식을위한새로운동적특징추출방법 음성인식에있어유사어휘및어휘패턴을사용하는화자군에기반하는언어모델적응방법 Weighted Finite State Transducer 기반의끝점검출 US K 다중음향공간 GMM 을이용한음향모델생성방법 음성인식을위한실시간채널정규화방법 자동음성인식을위한새로운동적특징추출방법 US K 불확실성을이용한잡음환경에서의음성인식방법및장치 - 45 - US : 국제 ( 미국 ) 특허 K : 국내특허
ETRI 특허기술 한국전자통신연구원 (ETRI) 의뛰어난텍스트마이닝특허기술적용 ( 국내특허 10 건, 국제특허 6 건 ) US K 감성어휘정보구축방법및장치 US K 언어처리장치및그방법 K 이슈템플릿추출기반의웹동향분석방법및장치 이슈일지를제공하는단말기, 이슈일지를생성하는서버및이슈일지제공및생성방법 US K US K 토픽별오피니언과소셜영향력자를기반으로토픽을탐지하고추적하는시스템및방법 K 소셜미디어에서영향력있는사용자를검색하기위한장치, 시스템및그방법 상품정보자동추출방법및장치 US K K 소셜미디어분석을기반으로복합이슈를탐지하기위한장치, 시스템및그방법 US K 텍스트기반감성분석결과를제공하기위한장치, 시스템및그방법 K 소셜웹콘텐츠에서의예측기반리스크관리장치및그방법 - 46 - US : 국제 ( 미국 ) 특허 K : 국내특허
Insight Korea Ltd. 137-040 서초구반포4동 96-8 대선빌딩 2층 / 3층 2F/3F Daesun B/D 96-8 Banpo4-Dong, Seocho-Gu, Seoul 137-040, Korea T (82 2) 3483 0500 F (82 2) 3481 9033 http://www.insight-korea.com/