SAS Text Analytics: 텍스트분석기술의진화및활용사례 SAS Korea 구방본
Agenda 비정형텍스트분석이슈-진화 Text Analytics Framework 흥미로운주요기능 활용사례 LG CNS SMA 소개 Wrap Up
Quiz
텍스트분석의이슈 집근처에있는하이마트대리점판매점원이 LG 전자 3D TV 를보여주면서정말자세히설명을해주더라구요 ~ 처음본 3D TV 라그런지정말실감나고신기했어요, 디자인은삼성이좋아서알아봤는데가격은착하지않더라구요. 긍정의글? 무엇이긍정? 어느회사이야기? 제품의무슨속성이좋은지? 제품의어떤속성을안좋다고하는지?
텍스트분석의진화 비정형데이터 재난분야 침수침수 피해정도 물이발목까지물이허리까지 위치 강남역뉴욕제과서울역아울렛 정형데이터 강수량 100mm 148.5mm 하수관거 9.7m 5.31kgf/m^2 CCTV 침수확인침수확인
SAS Big Data Analytics Platform 내부데이터 기간계 Data End User Analytics Integration ODS E-DW M2M 데이터 외부데이터 Social Data Service Data Quality Crawler DataFlux@ Event Streaming ESP Engine Big Data Farm FDC ATM CDR Web Log Visual Visualization Analytics A-DW Packed-Model Analytic Sandbox Grid In-Database In-Memory EG+RPM Rule & Model Cloud Computing System Monitoring Data Management
SAS Text Analytics Framework Business Analysis for Structured Data Business Analytics Data Mining Media Portal Data Quality Data Integration Crawler 30 Language Text Analysis for Unstructured Data Content Categorization Text Summarization Social Network Analysis Text Mining Sentiment Analysis Business Analysis for Social Network Conversation Center Media Workbench
Text Analytics 주요제품 1. SAS TA 개요 Content Categorizer 계층및 Flat 분류를지원 목적성으로사전에만들어진분류 Template 제공 분류노드수의제한이없으며대용량의문서분류제공 손쉬운분류 Rule 편집기능제공 자동적으로자연어처리및단순 / In-Depth 규칙적용 Text Summarizer 주요키워드에대한컨셉정의 의미기반의문장에대한 Weight 스코어링 중요성에대한문장이나구문추천 문서의요약정보생성
Text Analytics 주요제품 1. SAS TA 개요 Text Miner 문서용어및핵심키워드추출 자체동의어 Parsing 기능 종합적인텍스트전처리능력및차원축소기법 텍스트클러스터링알고리즘 용어간의연관관계분석 Sentimental Analysis Manager 문맥을긍정 / 부정, 좋고 / 나쁨, 상향 / 하향중립으로분류 Statistical 모델링기능 Linguistic 모델링 Hybrid 모델링 제품이미지 Trend Tracking/ 모니터링
주요기능 - 30 개언어지원 지원언어 : Arabic, Chinese, Czech, Danish, Dutch, English, Finnish, French, German, Greek, Hebrew, Hungarian, Indonesian, Italian, Japanese, Korean, Norwegian, Polish, Portuguese, Romanian, Russian, Slovak, Spanish, Swedish, Thai, Turkish, and Vietnamese. Dialects included Simplified and Traditional Chinese, Parisian and Canadian French, Old and New World German, Nynorsk and Bokmål Norwegian, and both Portugal and Brazilian Portuguese, Spanish.
주요기능 - 의미기반정확한분류 복문의문장구조에서의미가다른문장을각각의미에따라분류
주요기능 - Rule-based 기반개체명인식기능 Rule 기반으로개체명인식이가능. 조직, 사람등의개체명인식을 Rule 을통해인식가능
주요기능 - Subject 관련 Keyword 찾기 북한 컨셉옆 2-3 줄내의복합명사와동사키워드추출
주요기능 - Target detection & opinion holder 기능 좋아하는대상찾기 (target). 좋아하는주체찾기 (holder).
SAS Text Analytics 활용사례 Mobile & Hi-Tech Retail Smart Search SMA 서비스
Mobile, High-tech Hot Risk Issue Alert TA 마이닝 신상품출시후품질조기경보 수많은 VOC 중 Hot Risk 도출 Top 20 Risk Alert 리스크확산방지 제품및회사에대한이미지지속
통합 VOC 분석 / 외부고객 Identification 빅데이터분석구조 내 / 외부 VOC 통합분석 Insight 신상품출시후품질조기경보 내외부 VOC 통합 Hot Risk 도출 포스팅 / 댓글한사람의구매 4 배, 2-3 주선행 외부고객 Identification 외부고객 Identification 성향 / 취향, 구매실적연계분석 전략적디지털마케팅활용 18% 18% Identify
기업내부 Smart Search 대상컨텐츠스마트검색시스템정보활용 컨텐츠자동분류 /Tagging 분석 Layer 관심정보추천 UI Layer 맞춤통합검색기능 필요정보검색시간감소 정보정확성 100 향상 1 만건 -> 100 건맞춤추천 전문가검색기능 전문가네트워크 용어관리 찾아오는검색기능 협업 / 소통증가 검색소요시간 80% 감소 업무리드타임 40% 단축 검색 Layer 창의적업무활성화 데이터 I/F 분석엔진 검색엔진 협업과제수행을위한기회발굴 색인 DB
SMA On-Demand 서비스 powered by SAS 시점별주요 Keyword 추이분석
LG CNS Smart SMA 데모
Wrap Up 18년역사의자연어처리기술 검증된 30개언어텍스트분석엔진 ( 하둡 +R ) 통합마이닝 ( 텍스트마이닝 + 데이터마이닝 ) 빅데이터분석의필수품
See Your Big Results with SAS Visual Analytics