빅데이터 사례및공공데이터활용을중심으로
개요 2 시사기획창
개요 3 경제적자산 창출된데이터가경제적자신이되고 가치창출의원천이되는사회 Data 기반 예측, 의사결정 S/W 기반 자동화, 편리 H/W 기반 용량, 속도
개요 4 기술 Trend [Gatner] Top 10 Strategic Technology Trend
개요 5 Mobile Data 의증가속도 13 년이후매년 61% 의증가율
개요 6 IoT( 사물인터넷 ) 의영향 IoT 시대 IoT means explosive increase of connected entities and their interaction Big Data emerage from capturing the interaction data
개요 7 Data 의증가속도
개요 > IT 기술의발달 8 저장용량의가격하락 5년마다 1/10 수준으로가격이하락됨 1TB가 10만원 150만원이면미도서관전체자료를저장
개요 > IT 기술의발달 9 CPU 의처리속도 1988 슈퍼컴퓨터 지금 NoteBook 150 만원이면미도서관전체자료를저장 Data Access Operation Visualization
개요 10 기존 data 와의차이는? 가치 빅데이터 규모 표본추출 전수분석 대량데이터에대한새로운분석기법 기존데이터 다양성 속도 다양한변수간의관계 비정형데이터의활용 사건발생시점과감지시점간지연이거의없음 규모, 다양성, 속도
개요 11 데이터 데이터는사실을관리가능한형태로저장된것 정보는데이터간의관계성으로의미를가지는것 지식은구조화된정보를분류하여판단의근거가되는것
개요 빅? = 3V + 1V Volume Exponential Variety Unstructed Structed Velocity Real-time analysis Value Predict Optimize 비정형데이터의증가 SNS 의대중화 데이터분석기술의발전 12
개요 13 빅데이터의정의 기존방식으로저장, 관리, 분석하기어려운큰규모의데이터 (Mckinsey, 2011) 다양한종류의대규모데이터로, 낮은비용으로가치를추출하고, 초고속으로수집, 바굴, 분석하도록고안된최신아키텍쳐 (IDC, 2011) 몇 TB 에서수십 PB 까지의데이터 데이터크기외에다양성, 생성속도가중요 (Gartner, 2012)
개요 14 활용가치 create transparency 데이터를통한 BI, 부정적발 expose variability and enable experimentation 변동을가시화하고, 실험을가능하게함 segment population to customize actions 대상을세분화하여개별대응을가능하게함 replace/ support human decision making 의사결정을보조또는대체 innovation to biz models, products, and services 비즈니스모델, 상품, 서비스의혁신
개요 15 국내시장규모 KIST 가발표한시장전망 ( 14.4) 파급효과 2017 년까지약 52 만개의일자리를발생
개요 16 기술아키텍쳐
사례 17 사례 1: 서울시심야버스
사례 1 18 노선검증알고리즘
사례 1 19 통행량산출알고리즘
사례 1 20 노선개발상세화면
사례 2 21 SeatGeek
사례 3 22 zara 의 fast fashion ZARA 고객이원하는음식을신속하고저렴하게제공하는패스트푸드처럼유행품만만들어공급하는전략 판매데이터실시간분석을통해정확한재고관리 다품종소량생산으로타업체대비 3~4 배품목생산
사례 4 23 ZARA fast fation 의상품공금프로세스
사례 4 24 ZARA
사례 4 25 ZARA 재고분배최적화알고리즘 : - MIT 제리미갤리언교수와공동개발 매장능력에따른수요물량산정 CP tl = CD tl α + S rp tl CP tl : t 기간 l 매장의매장능력 (1 α) CD tl : t 기간 l 매장의진열능력 S rp : t기간 l매장의매출능력 tl r제품의판매수량과 r제품의 p단가 공급능력에근거한공급물량산정
사례 4 26 predictive policing VS.
사례 4 27 predictive policing 과거범죄기록분석 범죄예상지역탐지 지진파를통한여진탐색알고리즘활용 범죄기록이많을수록더정확한결과도출 과거범죄기록이많은범죄유형에적용 재범가능성을타겟으로할것인지에대해서는검토중 폭행절도강도도난차회수체포율 9% 감소 11% 감소 27% 감소 22% 증가 56% 증가
공공데이터 28 해외동향 미국 : Open Data Action Plan 발표 ( 14.5) 50 개주정부대상오픈데이터수준평가 오픈데이터를활용한기업의가치창출 : 연 3 조달러 Open Data 500 프로젝트 공공데이터활용사례를조사하고개선하기위함 영국 : Open Data Strategy 2014-2016( 14.7) Open Data 를통한 86 억파운드의가치창출 Open Data 를이용한가치창출유형 수집한데이터로새로운가치를창출하는 Aggregator, 자사의제품및서비스개선을위해활용하는 Enricher 데이터플랫폼, 기술을제공하는 Enable 세계은행 : 경제성장을위한 Open Data 보고서 ( 14.8)
공공데이터 29 공공데이터의개방 09년한고등학생이서울버스앱을개발. 무료배포 경기도의의의로서비스중단ㅇ위치정보보호법, 저작권법
공공데이터 30 현황
공공데이터 31 개방전략 선진국수준의데이터표준체계정립 민주주도이용활성화를위한지원마련 고가치 / 고수요데이터우선개방 공공데이터포털 (data.go.kr) 추진목표
공공데이터 32 대상데이터 국가중점데이터후보군선정 분야별대표시스템이보유한대용량데이터직접개방 국가정보화추진과제, 공통이용시스템, 국가마스터 DB, 국책연구기관 DB 등 15 대전략분야중연관성높은데이터를연계 융합시켜대용량데이터형태로생성 개방
공공데이터 33 데이터활용생태계조성
공공데이터 34 국내사례 미국 : Open Data Action Plan 발표 ( 14.5) 50 개주정부대상오픈데이터수준평가 오픈데이터를활용한기업의가치창출 : 연 3 조달러 Open Data 500 프로젝트 공공데이터활용사례를조사하고개선하기위함 영국 : Open Data Strategy 2014-2016( 14.7) Open Data 를통한 86 억파운드의가치창출 Open Data 를이용한가치창출유형 수집한데이터로새로운가치를창출하는 Aggregator, 자사의제품및서비스개선을위해활용하는 Enricher 데이터플랫폼, 기술을제공하는 Enable 세계은행 : 경제성장을위한 Open Data 보고서 ( 14.8)
공공데이터 35 공공데이터유망기업선정제도 운영내용 대상 : 공공데이터를활용하는 1 인창조기업, 중소기업, 예비창업자 평가기준 : 성장성, 파급효과, 창의성 인센티브 공공데이터유망기업인증서부여 컨설팅 / 홍보사업등에대한우선권부여 산자부, 중기청등기업지원과제와연계추진
Data Scientist 36 개념 Data Science? Data Scientist? [ Wikipedia] 데이터사이언스 (Data Science) 는데이터엔지니어링, 과학적방법론, 수학, 통계학 (Advanced Analytics), 고급컴퓨팅 (Advanced Computing), 비주얼라이제이션 (Visualization), 해커 (Hackers) 적사고방식등영역별전문지식을종합한학문이며, 이러한수행이가능한자를데이터사이언티스트로정의
Data Scientist 37 소요기술
Data Scientist 38 Process
Data Scientist 39 데이터분석 빅데이터분석 데이터사이언스
Data Scientist 40 Data 직군 DB 분야직무프레임워크
Data Scientist 41 Data 직군 Data Scientist
Data Scientist> 교육 42 국내교육과정
Data Scientist> 교육 43 빅데이터아카데미
44 QnA 감사합니다.