PowerPoint 프레젠테이션

Similar documents
Slide 1

Microsoft Word - 국제중재

PowerPoint 프레젠테이션

2015

오늘날의 기업들은 24시간 365일 멈추지 않고 돌아간다. 그리고 이러한 기업들을 위해서 업무와 관련 된 중요한 문서들은 언제 어디서라도 항상 접근하여 활용이 가능해야 한다. 끊임없이 변화하는 기업들 의 경쟁 속에서 기업내의 중요 문서의 효율적인 관리와 활용 방안은 이

<C1A4C3A5B8DEB8F05FC1A C8A35F534E535FBAF220B5A5C0CCC5CD20C8B0BFEBB0FA20B0ADBFF8B0FCB1A42E687770>

FD¾ØÅÍÇÁ¶óÀÌÁî(Àå¹Ù²Þ)-ÀÛ¾÷Áß

본문1

비식별화 기술 활용 안내서-최종수정.indd


Model Investor MANDO Portal Site People Customer BIS Supplier C R M PLM ERP MES HRIS S C M KMS Web -Based

안철수.PDF

글로벌한류격주보고서 42호_.indd


Æí¶÷4-¼Ö·ç¼Çc03ÖÁ¾š

2. 박주민.hwp

목순 차서 v KM의 현황 v Web2.0 의 개념 v Web2.0의 도입 사례 v Web2.0의 KM 적용방안 v 고려사항 1/29

11.indd

Copyright by Korean Local-government Management Institute. ALL RIGHTS RESERVED. No part of this publication may be reproduced, stored in a retrieval s

2016_Company Brief

포맷

QYQABILIGOUI.hwp

PowerPoint 프레젠테이션

빅데이터를 통해 세상을 읽는다 부산광역시 해운대구 김혜정 해운대 관광? 빅데이터에 물어봐! 전국 최초로 빅데이터 분석팀을 신설해 수준 높은 서비스 제공과 과학적 예측 행정을 구현하고 있는 해운대구의 참신한 도전기. 해운대를 찾아오는 국내외 수많은 관광객들에게 즐거운 추

PDF

슬라이드 1

¿À¸®ÄÞ40

숭실브로슈어 표지 [Converted]

IT현황리포트 내지 완


(최종)2013년 방송통신광고비 조사_0609v2.hwp

CONTENTS Volume 테마 즐겨찾기 빅데이터의 현주소 진일보하는 공개 기술, 빅데이터 새 시대를 열다 12 테마 활동 빅데이터 플랫폼 기술의 현황 빅데이터, 하둡 품고 병렬처리 가속화 16 테마 더하기 국내 빅데이터 산 학 연 관

시안

글로벌인재양성기금 모금 캠페인 한국외국어대학교와 함께 성장하는 외대사랑후원업소의 무한한 발전을 기원합니다. 발전기금문의 ~2796 (한국외대 발전협력팀) 금강산 래미안2차 앞 이삭토스트 토스트 호프 디엠 설악산수 후즈후 음식업

121220_워키디_상세설명서.indd

歯목차45호.PDF

감사칼럼 (제131호) 다. 미국과 일본의 경제성장률(전기 대비)은 2010년 1/4분기 각각 0.9%와1.2%에서 2/4분기에는 모두 0.4%로 크게 둔화 되었다. 신흥국들도 마찬가지이다. 중국, 브라질 등 신흥국은 선진국에 비해 높은 경제성장률을 기

DW 개요.PDF

38이성식,안상락.hwp

the it service leader SICC 생각의 틀을 넘어 ICT 기술의 힘 으로 생각의 틀을 넘어 IT서비스 영역을 개척한 쌍용정보통신. ICT 기술력을 바탕으로 최적의 솔루션을 제공하며 세계로 뻗어나가는 IT Korea Leader 로 도약할 것입니다. Co

드림 워커 꿈은 내가 만든 일종의 스승이자 또 하나의 분신이다. 가장 나답게 성장한 미래의 나 인 셈이다. 꿈 은 모든 부분에서 나보다 낫다. 통찰력도 조금 더 있고, 인내력도, 나를 이끌어 갈 만한 리더십도 있다. 꿈 은 내 안의 가장 성실한 또 다른 나이기 때문이다

제주발전연구원 제주발전연구원 정책이슈브리프 2015년 11월 2일 Vol. 226 발행처 : 제주발전연구원 발행인 : 강기춘 주 소 : 제주특별자치도 제주시 아연로 253 TEL FAX 제주발전연구원은 지역사

민주장정-518(분권).indd

2 문화예술 분야 언론 홍보 가이드북 - 내지.indd 오후 4:35

¿À¸®ÄÞ38


LG Business Insight 1409

(최종) 주안도서관 소식지_7호.indd

09.10월킨스 최종

CONTENTS 숭실사이버대학교 소개 총장 인사말 교육이념 및 비전 콘텐츠의 특징 숭실사이버대학교 역사 숭실사이버대학교를 선택해야 하는 이유 숭실사이버대학교 학과 소개 1 1 학과 소개 30 연계전공 & 신 편입생 모집안내 숭실사이버대학교 C

<5BC6EDC1FD5DBFA9BCBAC0C720BFC2B6F3C0CE20C0CEB1C7C7C7C7D820C7F6C8B2B0FA20B0B3BCB1B9E6BEC82E687770>

02 BRAND REPORT 여기서 내 친구들도 따로 나와는 별도의 가까운 친구들이 있다는 것이 핵심이다. 즉 A와 B가 알 고 B와 C가 서로 알지만 A와 C가 서로 모를 때 B 가 A와 C를 서로 소개시켜줄 수 있고 A가 B를 거 쳐 우연하게 C까지 도달해 친구를

Microsoft PowerPoint - CoolMessenger_제안서_라이트_200508

Contents Intro 02 Keywords 04 Key Image Special Theme 사람과 문화를 잇는 음악의 힘 10 Column 1 음악 마케팅의 새로운 바람, 인터랙티브 14 Column 2 새로운 창작 플랫폼, 송 캠프 18 Sk


15_3oracle

SAMJONG Insight 제19호


Oracle Apps Day_SEM

일제.PDF

No

untitled

성도

본문01

자료1 분기별 시청률 추이 (%) 사분기 2사분기 3사분기 4사분기 1사분기 2사분기 3사분기 4

96부산연주문화\(김창욱\)

여자.PDF

정보화 산업의 발전단계 : 정보혁명의 진화 정보화 산업의 발전단계 1세기에 두 번 정도의 큰 기술혁명이 이루어져 경제성장의 원동력으로 작용 uit 시대는 정보혁명 중 인터넷 이후의 새로운 기술혁명인 컨버전스 기술이 핵심이 되는 시대 uit 시대는 정보화의 극대화와 타

<33B1C7C3D6C1BEBABB28BCF6C1A42D E687770>

동문회 소식 되었다. 진심으로 감사드린다. 문태인의 자 이 좋은 환경에서 더욱 건강하고 씩씩하게 긍심으로 겸손하고 더욱 강하고 담대하게 학업에 전념하여 명문고의 전통을 이어 갈 정권 재 창출을 위해 전진하겠다 고 전했 것을 부탁한다 고 축사하고 아울러 이경

Microsoft PowerPoint - XP Style

월간 CONTENTS 3 EXPERT COLUMN 영화 점퍼 와 트로이목마 4 SPECIAL REPORT 패치 관리의 한계와 AhnLab Patch Management 핵심은 패치 관리, 왜? 8 HOT ISSUE 2016년에 챙겨봐야 할 개인정보보호

< B3E220BDBAB8B6C6AE20BDC3B4EBC0C72033B4EB20BAAFC8AD20B5BFC0CE5F E687770>



CRM Fair 2004

pdf

<4D F736F F D20BACEB1B3C0E75FB5F0C1F6C5D0B6F3C0CCC7C15F3232C2F7BDC32E646F63>

<38BFF93232C0CF28BFF92920C0E7B3ADB0FCB8AE20C1BEC7D5BBF3C8B BDC320C7F6C0E7292E687770>

세종대 요람

SAMJONG-Insight-29호

???? 1

연속극 <가족끼리 왜 이래>, 2위는 KBS 1TV의 일일연속극 <당신만이 내사랑>, 3위는 MBC 주말드라마 <전설의 마녀>가 꼽혔다. 표1 2015년 시청률 상위 20개 프로그램 순위 프로그램(그룹) 채널 가구시청률(%) 1 주말연속극 <가족끼리 왜 이래> KBS2

2014년 5월 주요 행사 Cover Story 1999년 창업한 이후 3년 만에 매출 1,000억 원을 달성한 건강 생활용품 전문 기업 (주)한경희생 활과학은 세계적인 경쟁력을 갖 춘 기업으로 성장하고 있다. 한경 희생활과학은 여성 가정 인류 를 위해 삶의 질을 높이

untitled

歯CRM개괄_허순영.PDF

기업들의 SNS마케팅 전략 사례연구

IFEZ 03,04 국문

CONTENTS SUMMARY PART 1 MARKET MARKET STRATEGY MARKET ISSUE MARKET ISSUE PART 2 CREDIT CREDIT ISSUE CREDIT ISSUE CREDIT ISSUE CREDIT ISSUE CREDIT STRA

Data Industry White Paper

새만금세미나-1101-이양재.hwp

¿©±âÀÚ-À¥¿ë.PDF

슈먼2호내지_최종_표지포함

ecorp-프로젝트제안서작성실무(양식4)

Ç¥Áö-¸ñÂ÷

감사칼럼 (제119호) 지속가능성 사회적 책임 환경책임주의 품 질 종업원 건강, 안전 및 근로조건 기업 평판, 법규준수 1900S Today (그림1) 지속가능경영의 발전 기업은 이러한 이해관계자와의 상호관계를 유지하면서 성 장해 나가는 유기체이기 때문

326ƒÆ∂Û5.11

PowerPoint 프레젠테이션

??

untitled

Transcription:

Social Media와 Unstructured Data를 활용한 Text Analytics 사례 구방본 부장 SAS Korea

NYSE: 1 TB of new trade data per day Facebook: 20+ TB compressed per day. 10 billion photos ~ 2.5 PB of data and growth is accelerating!

Quiz

Big Data & Unstructured data Structured Data Semi-Structured Data Image/Multi Media Data Unstructured Data => Text Data in E-mail in Web in SNS in DB in Doc

Unstructured 데이터 분석? Unstructured Data Refined Information People 관심사항, 성향, 취향, 영향력, 위치, 연령대, 네트웍망 내 위치 HeonSh????: 사람 많지는 안았나요? RT @lh???: 하루 휴가라 우리 가족 롯데월 드를 다녀왔습니다. 삼바 리오 축제 엄청 좋았습니다. 삼성카드 자유이용권 50% 할인, 롯데카드 입장권 무료. 15,000원에 우리 식구 입... http://dw.am/l4qwi 수집 분류 Contents 관심 주제(브랜드, 서비 스, 상품, 품질, ), 긍/ 부정, 매체, 작성일 분석 (정성/정량) Relation 소속 그룹, 구성원, 그룹 성향, 관계 강도 Search KM, 검색

텍스트 분석 고도화 사례 A사의 TA 고도화 Text 분 석 수준 Precision 1단계-VOC + 고급 분석/ Global Lang 2단계-VOC - 대분류만 자동분류 3단계-VOC - Global Language - 대/중/소 자동 분류 - 리스크 스코어링 - Hot Issue Alert - 유의어 기반 분류 - 긍/부정어 사전 기반 - 현업 수작업 유도 - 세부 제품레벨 집계 2005 2008 2012 Time

Unstructured data 분석의 Pain Precision Insight Globalization

SAS Text Analytics Framework Business Analysis for Structured Data Business Analytics Data Mining Media Portal Data Quality Text Analysis for Unstructured Data Data Integration 30 Language Content Categorization Text Summarization Text Mining Sentiment Analysis Conversation Center Crawler Business Analysis for Social Network Social Network Analysis Media Workbench

Text Analytics Case Study Mobile, High-Tech Automobile Election

Mobile Hot Risk Issue Alert TA 마이닝 신상품 출시 후 품질 조기 경보 수많은 VOC 중 Hot Risk 도출 Top 20 Risk Alert 리스크 확산 방지 제품 및 회사에 대한 이미지 지속

Automobile Hot Issue/ 리콜 Alert XXX 자동차 사상 최대의 리콜 사태로 창사 이래 가장 큰 위기 직면 니혼게이자이신문, 2010 리콜사태 이전 기업 이미지가 100이었다면 리콜 후 50으로 떨어졌 다 세계일보, 2010 신차 출시 후 품질 모니터링 리스크 확산 조기 방지 리콜 이슈 조기 경보 품질 조기 경보 체제

Case. 선거 SNS분석을 통한 후보자 강/약점 분석

투표 2일전 당시 매스컴 및 타 분석 업체에서 온라인상 두 후보의 지지도가 박빙으로 가고 있다고 함 그러나 SAS의 분석결과는 확연하게 드러남

트위터 총량 비교 일평균 나: 17340건 박: 19230건 나경원 VVIP 피부과 논란 박근혜 나경원 지지 표명 단일 후보 확정 100분 토론 신지호 음주방송 논란 서울 시장 후보 등록, 재산 신고 KBS1 후보토론 박원순 병역 의혹 제기 MBC 100분 토론 공식 선거운동 시작 나경원 사학재단 이사 재임, 정치 후원금 의혹 나경원 가짜 트윗 논란 나경원 딸 편지 가짜 해명 박원순 학력 위조 의혹 제기 TV 토론 시작 박원순 천안함 발언 중앙선거관리위원회 SNS 가이드라인 발표; 나경원 2캐럿 다이아반지 재산 허위 신고, 부친 학교 회계장부 논란 안철수 박원순 지지 공식 선언

후보별 지지 트위터리안 추이분석 일평균 나: 1209명 박: 2377명

후보별 안티 트위터리안 추이분석 일평균 나: 818명 박: 411명

유권자 관심영역 호감도 분석

선거 - SNS분석을 통한 후보자 분석 동아일보 11.10.27

총선 공천 트위터 여론 분석 조선일보 12.3.13 구분 방법 해석 실제 현상 사안에 대한 긍정적인 글을 찾을래야 찾기 힘들 정도로 부정적 글이 많음 검색 기반의 텍스트 분석 S W SAS 문장의 문법과 의미 기반의 텍스트 분석 사람이 직접 육안으로 읽어 서 내용 파악 단어 기반으로 내용 파악 ( 민주당 과 좋다 가 등장 하면 민주당에 대한 긍정으 로 해석) 주어와 서술어 관계, 이중 부정 표현 등을 고려하여 내용 파악 부정적인 글이 훨씬 많네? 라는 느낌 긍정 46%, 부정 49% 로 판정 긍정 13%, 부정 87% 로 판정

Why SAS Text Analytics

솔루션 선정시 고려사항 텍스트 분류 정확도 - 자동 분류의 정확도 - 분류 체계 4 Level 이상 사용자 편의성 - 자연어 처리 룰 UI - 동의어 연관어 - 불용어 처리 84%, 92.5%, 84.5% Insight & 분석 고도화 - 세부 원인 분석 - 고급 분석 확장 타 부서로 확산 - 툴/패키지 형태 - 템플릿 공유

SAS Text Analytics in SAS Analytics SAS Text Analytics SAS Analytics Data Visualization Information Organization and Access Predictive Modeling, Discover Trends and Patterns Statistics Forecasting & Econometrics Data Mining Quality Improvement SAS Enterprise Content Categorization SAS Text Summarization SAS Sentiment Analysis SAS Text Miner Operations Research Text Analytics Model Management

텍스트 분석 엔진의 신뢰도 기존 SAS 문장예시 집 근처에 있는 대리점 판매 점원이 삼성전자 3D TV 를 보여 주면서 정말 자세히 설명을 해주더라구요~ 처음 본 3D TV라 그런지 정말 실감나고 신기했어요, 그런데 가격 은 착하지 않더라구요. 매칭 방법 단어 및 시멘틱 매칭 유의어, 긍/부정 사전 긍/부정 빈도수 언어 패턴 매칭(Linguistic) 주부 + 부사부 + 술부 문장 문맥 의미에 따른 분류 표현 논리구조 연산 결과 예시 기타로 분류(긍부정 빈도 유사) 자세한 분류 불가능 삼성전자, TV, 판매원, 가격 무엇이 긍부정 인지 분석 어려움 (단어 매칭의 한계) 삼성전자 대리점 접근 편의성 판매원에 대한 매우 만족 제품에 대한 만족 가격에 대한 불만

언어별 다양한 의미 표현을 정확하게 분류 Case: Case: 소나타 소나타 실내 실내 디자인 디자인 긍정의 긍정의 여러 여러 가지 가지 표현 표현 (영문) (영문) - - Sonata s Sonata s interior interior design design is is good good O O - - Sonata s Sonata s interior interior design design is is not not bad bad O O - - I like I like Sonata s Sonata s interior interior design design O O - - I don t I don t like like Sonata s Sonata s interior interior design design X X - - I don t I don t think think Sonata s Sonata s interior interior design design is is good good X X 위 Case의 표현 패턴에 대한 룰 Case: 한글 긍정의 여러 표현 - 실내 디자인이 좋다 O - 실내 디자인이 나쁘지 않다 O - 실내 디자인이 좋지 않다 X 만족 컨셉 부정어 컨셉 불만 컨셉 의견 컨셉

SAS TA엔진 분석결과 정확도는? 타사 사례

Language Support English German Spanish Italian French Portuguese Dutch Greek Swedish Finnish Norwegian Danish Russian Czech Slovak Polish Hungarian Romanian Turkish Arabic Farsi (in development) Hebrew Chinese Japanese Korean Thai Indonesian Vietnamese Bulgarian More languages under development No third party licensing.

Summary Copyright 2010, SAS Institute Inc. All rights reserved. 29

SAS Text Analytics Framework Data Source 데이터 통합 분석 영역 사용자 영역 Structured Data Analysis 1. Precision Business Analytics Data Mining 웹포탈/대시보드 Data Integration Unstructured Data Analysis Text Summarization Content Categorization Text Miner 2. 통합 분석(TA+마이닝) Sentiment Analysis 분석 보고서 Crawler (IR Studio) 예측/시뮬레이션 분석 30 Global Languages Support 3. Global Language Support Network Analysis Network Analysis

구방본 bang-bon.goo@sas.com 02-2191-7122 SAS Korea