슬라이드 1

Similar documents
선진사례집(0529)

PowerPoint 프레젠테이션

CONTENTS Volume 테마 즐겨찾기 빅데이터의 현주소 진일보하는 공개 기술, 빅데이터 새 시대를 열다 12 테마 활동 빅데이터 플랫폼 기술의 현황 빅데이터, 하둡 품고 병렬처리 가속화 16 테마 더하기 국내 빅데이터 산 학 연 관

Output file

<C0E5B7C1BBF328BEEEB8B0C0CCB5E9C0C729202D20C3D6C1BE2E687770>

빅데이터_DAY key

정도전 출생의 진실과 허구.hwp

wtu05_ÃÖÁ¾

정보화 산업의 발전단계 : 정보혁명의 진화 정보화 산업의 발전단계 1세기에 두 번 정도의 큰 기술혁명이 이루어져 경제성장의 원동력으로 작용 uit 시대는 정보혁명 중 인터넷 이후의 새로운 기술혁명인 컨버전스 기술이 핵심이 되는 시대 uit 시대는 정보화의 극대화와 타


Journal of Educational Innovation Research 2018, Vol. 28, No. 4, pp DOI: * A S

위해 사용된 기법에 대해 소개하고자 한다. 시각화와 자료구조를 동시에 활용하는 프로그램이 가지는 한계와 이를 극복하기 위한 시도들을 살펴봄으로서 소셜네트워크의 분석을 위한 접근 방안을 고찰해 보고자 한다. 2장에서는 실험에 사용된 인터넷 커뮤니티인 MLBPark 게시판


( ) 2012년 모바일 산업 10대 이슈_최종.hwp

( )전국네트워크

( )업계소식


( )업계소식

( )업계소식(14.01월)


클라우드컴퓨팅확산에따른국내경제시사점 클라우드컴퓨팅확산에따른국내경제시사점 * 1) IT,,,, Salesforce.com SaaS (, ), PaaS ( ), IaaS (, IT ), IT, SW ICT, ICT IT ICT,, ICT, *, (TEL)

Ä¡¿ì³»ÁöÃÖÁ¾

김기남_ATDC2016_160620_[키노트].key

이제는 쓸모없는 질문들 1. 스마트폰 열기가 과연 계속될까? 2. 언제 스마트폰이 일반 휴대폰을 앞지를까? (2010년 10%, 2012년 33% 예상) 3. 삼성의 스마트폰 OS 바다는 과연 성공할 수 있을까? 지금부터 기업들이 관심 가져야 할 질문들 1. 스마트폰은

제 31회 전국 고교생 문예백일장 산문 부문 심사평.hwp

<BAB9C0E2B0E820B3D7C6AEBFF6C5A9BFCD20B5A5C0CCC5CD20B0FAC7D0C0C720B1B8C1B6BFCD20C6AFC2A15FC1A4C7CFBFF528BCF6C1A4292E687770>

슬라이드 1


SW

1 SW


130726_트렌드씨_6월_rgb_s

08SW

2

Ⅰ Ⅱ Ⅲ Ⅳ

<4D F736F F D205B4354BDC9C3FEB8AEC6F7C6AE5D39C8A35F B3E C0AFB8C1B1E2BCFA20B5BFC7E2>

<4D F736F F D20302EC0CEC6AEB7CE2BC1BEB8F1B8AEBDBAC6AE2BBCBAB0FA BCBAB0FABEF7B5A5C0CCC6AEBFCFB7E1292E646F6378>

THE E-LAND Group C S R A n n u a l R e p o r t www elandcsr or kr CSR CSR A 2 TEL FAX

PowerPoint Presentation

목차 보조지원사업지원설비안전조치기준 양산품목의안전조치 공사품목의안전조치 1. 적재대 ( 일반 / 중량물 / 금형 / 파렛 ) 2. 원사빔적재대 3. 공구함 4. 이동식대차 5. 스태커 6. 전동지게차 ( 보행식 / 입식 / 좌식 ) 7. 에어발란스 8. 컨베이어 9.

2010 년 10 월넷째주 ( ) 1. IT와타산업융합위한민관노력강화 2. 한국, IT산업분야국제표준제안건수세계 1위달성 3. 한국, 3년연속세계브로드밴드경쟁력 1위기록 4. 삼성SDS, 2011년 IT메가트렌드선정 'Smart' 와 'Social' 이핵심

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

[한반도]한국의 ICT 현주소(송부)

그림 2. 5G 연구 단체 현황 앞으로 다가올 미래에는 고품질 멀 티미디어 서비스의 본격화, IoT 서 비스 확산 등의 변화로 인해 기하 급수적인 무선 데이터 트래픽 발생 및 스마트 기기가 폭발적으로 증대 할 것으로 예상된다 앞으로 다가올 미래에는 고품질 멀티미디어 서

Cover Story Oracle Big Data Vision 01_Big Data의 배경 02_Big Data의 정의 03_Big Data의 활용 방안 04_Big Data의 가치

<30332DB1E2C8B9C6AFC1FD28B7F9C0E7C8AB D E687770>

10월1일자.hwp

Layout 1

2007-최종-10월 16일자.hwp



Ⅰ. 지금 왜 연결 을 주목해야 하나 1. 웹을 통한 연결의 일상화 연결이 우리 시대를 규정하고 미래를 변화시키는 키워드가 될 것이다. 업무 중 혹은 정보 검색 중, 어느덧 지인의 미니홈피 사진첩을 클릭하는 자신을 발 견한 경험이 한번쯤은 있을 것이다. 거기서 그치지

- 2 -

슬라이드 1

IT.,...,, IoT( ),,.,. 99%,,, IoT 90%. 95%..., (PIPA). 디지털트랜스포메이션은데이터보안에대한새로운접근방식필요 멀티클라우드사용으로인해추가적인리스크발생 높은수준의도입률로복잡성가중 95% 는민감데이터에디지털트랜스포메이션기술을사용하고있음

Microsoft Word _1

Data Industry White Paper

대회 조직 대 회 장 서정연(한국정보과학회 회장) 조직위원회 위 원 장 최종원(숙명여대), 홍충선(경희대), 황승구(ETRI) 위 원 강선무(NIA), 김 종(POSTECH), 김철호(ADD), 민경오(LG전자), 박진국(LG CNS), 서형수(알서포트), 엄영익(성균


ㅇ ㅇ

IR컬럼 며, IR활동이 중요하게 된다. 효과적인 IR은 정보비대 칭성을 완화하여 증권가격이 공정하게 형성되도록 하 는 방안이다. IR은 투자자에게 정보를 전달할 때 재무적 요소인 정 량적 정보 이외에 비재무적 요소인 정성적 정보, 즉 경 영비전, 경영전략, R&D 능

레이아웃 1

¿ÀǼҽº°¡À̵å1 -new

2016년 신호등 3월호 내지A.indd


DOOSAN vol


애널리스트 미팅 키워드는 '하드웨어 디바이스' 2014년 IT 수요 전망? PC 전년대비 -2%, 태블릿 & 스마트폰 +24% 향후 가장 중요한 과제? 1 모바일 매출비중 확대, 2 지역별 매출 다변화 10월 26일 실적발표부터 사업부문 재분류, 가장 중요한 사업부문은

Microsoft Word - th1_Big Data 시대의 기술_ _조성우


Microsoft Word 인터넷몬슬리.docx

초보자를 위한 분산 캐시 활용 전략


PowerPoint 프레젠테이션

마켓온_제품소개서_ key

2 Journal of Disaster Prevention

PowerPoint Presentation

전력기술인 7월 내지일

04 특집

Microsoft PowerPoint - G3-2-박재우.pptx

Bigdata가 제공하는 구체적인 혜택과 변화 양상 기업의 데이터 기반의 의사결정 시스템 구축 의지 확대 양상 빅데이터를 활용한 경영 및 마케팅 지속적인 증가세 뚜렷 빅데이터를 도입한 기업은 사전 기대를 뛰어넘는 효과를 경험 본 조사 내용은 美 BARC- Researc

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

산업안전보건법시행규칙 [ 별지제 17 호의 9 서식 ] < 개정 > 석면해체ㆍ제거작업신고번호 현장명 ( 공사명ㆍ작업명 ) 전화번호 합덕여자고등학교교실천정텍스철거공사로 신고현장 인한석면해체공사소재지충청남도당진시합덕읍면천로 1583 신

프로그램 시간 내용 발표자 현대인은 무엇을 원하는가 14:00-15:00 등록 세션Ⅰ. 마음읽기 _ 현대인은 무엇을 원하는가 14:00-15:00 강연 _ 현대인은 무엇을 원하는가 하지현 건국대학교 의과대학 정신과 교수 15:00-15:30 사례연구 _ 도심 피크닉,


歯

(120629)_세포배양_불활화_인플루엔자_백신_평가_가이드라인.hwp

빅데이터처리의핵심인 Hadoop 을오라클은어떻게지원하나요? Oracle Big Data Appliance Solution 01 빅데이터처리를위한전문솔루션이 Oracle Big Data Appliance 군요. Oracle Big Data Appliance 와함께라면더이

비식별화 기술 활용 안내서-최종수정.indd

사회통계포럼

2016년 신호등 1월호 내지(1219).indd

기업들의 SNS마케팅 전략 사례연구

2

< C4BFB8AEBEEEC6D0BDBA20BBE7B7CAC1FD5FB0C7C3E02E687770>

W7_Business_ 제품설계

슬라이드 1

hwp

출원국 권 리 구 분 상 태 권리번호 KR 특허 등록

º¸µµ¿Â

±èÇö¿í Ãâ·Â

Transcription:

빅데이터로보는사회 ( 빅데이터의이해와활용 ) 강의 김용대교수 서울대학교통계학과 1

1. What is Big data? 2

빅데이터란? 데이터베이스의규모에초점을맞춘정의 (McKinsey, 2011) 일반적인데이터베이스 SW 가저장, 관리, 분석할수있는범위를초과하는 규모의데이터 데이터베이스가아닌업무수행에초점을맞춘정의 (International Data corporation(idc), 2011) 다양한종류의대규모데이터로부터저렴한비용으로가치를추출하고초고속수집, 발굴, 분석을지원하도록고안된차세대기술및아키텍처 3

빅데이터란? 소셜미디어나위치정보데이터등은자료의양이크다 Volume 데이터의형태가비구조화되어있다 ( 이미지, 음성 ) Variety 데이터가빠르게생산된다 Velocity http://www-01.ibm.com/software/data/bigdata/ 4

Large data vs Big data Large Data era Big Data era 데이터의원천 Internal External 데이터의형태 데이터의취합 분석방법 Nearly Structured vs. Well organized Modeling and Optimization in back-office Unstructured Nearly unorganized Visualization and Exploratory analysis in war room 분석환경 DW+Server Distributed process+cloud 5

Core IT Technologies of Big Data era Big Data era Social + External Unstructured 데이터의원천 데이터의형태 IT Tech. of Big Data era 분산처리기반의데이터가공및컴퓨팅기술 Nearly unorganized Visualization and Exploratory analysis in war room Distributed process+cloud 데이터의취합 분석방법 분석환경 Datacification techniques 통계엔진을활용한분석자동화 Data Visualization 6

2. Why Big data? Why now? 7

빅데이터의출현배경

빅데이터의출현배경 9

빅데이터의출현배경 스마트폰, 태블릿등으로대변되는모바일장치의확산 < 출처 : http://seagulls.kr/smart/3397> 10

빅데이터의출현배경 트위터, 페이스북등의소셜미디어의성장 < 출처 : cafe.naver.com/logoseasng/2202640> 11

빅데이터의출현배경 Radio Frequency Identification(RFID) 와같은정보를감지하는센서장비의이용확대 < 출처 : http://www.karus.or.kr> 12

빅데이터의출현배경 Global Positioning System(GPS) 장치보급확산 < 출처 : http://www.tegmento.org/gpsylon/screenshots.html> 13

빅데이터의출현배경 Internet 이용증가 (Naver, Google 등 ) < 출처 : http://www.weidmanconsulting.com/wcj/webmetrics.asp> 14

빅데이터의출현배경 Bioinformatics 의발전 < 출처 : http://mippi.ornl.gov/areas/bioinfo.shtml > 15

빅데이터의출현배경 메모리비용하락 < 출처 : http://www.saama.com/blog/bid/78289/whylarge-enterprises-and-edw-owners-suddenlycare-about-bigdata> 16

빅데이터의출현배경 정보를저장, 관리하는클라우드컴퓨팅기술의확산 < 출처 :http://yoonka.tistory.com/16> 17

빅데이터의출현배경 하둡파일시스템 (HDFS) 쉽고싸게사용할수있는분산파일시스템 18

빅데이터분석의중요성 데이터로부터얼마나많은부가가치를얻을수있나? 과학기술경쟁이치열 첨단의과학기술이사용자의요구를충족시켰을때부가가치창출 ( 아마존마케팅, 애플등 ) 미래사용자의필요예측이매우중요 빅데이터분석으로미래사용자의필요예측가능 19

빅데이터분석의중요성 자료분석으로부터새롭게얻을수있는지식의양 δ 매우작은새로운지식의양 20

빅데이터분석의중요성 P(Choose Shampoo A)=? P(Choose Shampoo B)=? 21

빅데이터분석의중요성 P(A A)=0.51 시장점유율 P(A)=0.505 P(B)=0.495 P(B B)=0.5 22

빅데이터분석의중요성 P(A A)=0.99 시장점유율 P(A)=0.667 P(B)=0.333 P(B B)=0.98 23

빅데이터분석의중요성 P(A A)=0.999 시장점유율 P(A)=0.909 P(B)=0.091 P(B B)=0.990 24

성공사례 : 빅데이터분석의중요성 실패사례 : 25

빅데이터의시대적흐름 Data warehousing era (1990 년대중반 ~2000 년대중반 ) 고객 Demo 정보 유통사외상품 / 서비스구매정보 고객접촉정보 (Ex. 콜센터, 리서치정보등 ) 유통사상품구매정보 교통정보 26

빅데이터의시대적흐름 Data convergence era (2000 년대중반 ~2010 년대중반 ) Data 의통합관리를통한소비자의입체적이해 27

빅데이터의시대적흐름 Big data era (2010 년대중반이후 ) 28

빅데이터의시대적흐름 Big data era (2010 년대중반이후 ) 이종데이터간의결합 Cloud Computing 데이터마켓의출현 Data is power! 29

3. How does Big data work? 30

빅데이터활용분야 < 자료출처 : McKinsey, 2011> 31

기업의빅데이터활용 자동차산업을선도하는 Data! 32

기업의빅데이터활용 유통업을선도하는 Data! 33

기업의빅데이터활용 Data 를통한의류시장의혁신! 34

공공분야에서의빅데이터활용 미국국세청, 탈세방지시스템통한국가재정강화 < 출처 : Big Data 글로벌 10 대선진사례 (NIA, 2012)> 탈세및사기로인한국가의재정위기가능성증가 35

공공분야에서의빅데이터활용 일본, 센서데이터를활용한지능형교통안내시스템 < 출처 : Big Data 글로벌 10 대선진사례 (NIA, 2012)> GPS 로부터자동차의주행스피드를계산하여교통정보수집 일본노무라연구소는스마트폰형내비게이션서비스를활용하여 2011 년일본대지진시도로교통체증피해최소화 교통체증감소효과및구조차량을위한피해지의실제도로교통상황안내 일본전역지정도시의택시약 11,000 여대와데이터제공에동의한사용자로부터실시간으로교통정보수집 수집된교통정보를바탕으로실시간으로최적의교통안내서비스제공 36

공공분야에서의빅데이터활용 구글, 검색어분석을통한독감예보서비스제공 구글홈페이지에서독감, 인플루엔자등독감과관련된검색어쿼리의빈도를조사, 구글독감동향 (Google Flu Trends) 이라는독감확산조기경보체계마련 미국질병통제예방센터의데이터와비교결과, 검색빈도및실제독감증세를보인환자숫자사이에매우밀접한상관관계가있는것을확인 37

공공부분에서의빅데이터활용 Billion Prices Project @ MIT 인터넷쇼핑회사의상품가격을분석하여실시간물가지수산출 38

4. Examples of Big data projects 39

SNS 를이용한연예인지수개발 40

클릭 탐색적분석화면검색조건설정부가분석옵션 Radian 6 41

토픽의설정 토픽내검색키워드의설정 " 드라마결혼의여신 " 42

소셜네트워크내 1 달간검색량 Brand: 결혼의여신 Competitors: 개그콘서트 + 스캔들 Competitors: 67. 8% Brand : 32.2% 43

소셜네트워크내 1 달간검색량의추이 competitors brand 44

Brand 내점유율비교 남상미 이태란 김지훈 45

이태란 + 패션 ( 원피스 ) vs 남상미 + 패션 ( 원피스 ) 이태란 남상미 46

News Blog Twitter Etc Source 분석 Sources News Blog Twitter Facebook Forum etc Forum Facebook 47

빅데이터기반재난 / 안전지수개발 산업재해와관련한기업환경의변화 언론에노출되는산업재해의빈도증가. 산업재해로인한유형적손실뿐만아니라, 기업이미지를포함한무형자산에도장기적영향을미침. 현재기술의취약성 정기점검, 공정신설, 공정변경시혹은정성적방법에의해필요하다고생각되는시점에서위험성평가가이루어짐. 특정시점, 특정사업장의산업재해위험수준을정량적방법을통해지속적으로모니터링할수있는모형이없음. 48

빅데이터기반재난 / 안전지수개발 아차사고데이터베이스 하인리히재해발생법칙에의하면불안전한상태와행동이사고를발생시키므로그러한유해 / 위험요인을관리할때사고발생빈도를줄일수있음. 현재사고와관련한유해 / 위험요인의측정지표인 ' 아차사고데이터베이스 ' 가구축이되어위험평가모형개발의기반이마련되고있음. 아차사고를통해얻어진유해 / 위험요인과산업재해의발생빈도및강도를모형화하고자함. 49

빅데이터기반재난 / 안전지수개발 아차사고정보 플랜트명등록번호업무구분 무주양수발전처 무주양수발전처 B00000006 6 B00000006 7 발전운영 발전운영 발생일자작업유형사고유형날씨개요원인예방대책 2009-10- 28 2009-10- 02 전기감전맑음 토목 / 건축 추락 맑음 아차사고정보 1. 상황체험자한국에머슨하청업체화랑FA 강인규외 2명은 2009년 10월 28일오후2시경제1,2호기원인주제어설비교체공사의일 1. 관리감독소홀환으로중앙 2. 작업에따른안전수칙제어실판넬철거작업관련미준수으로기존제어전원케이블 3. 반복작업에의한안전철거작업불감증중 380V 전원차단미확인으로인하여감전될뻔한아차사고사례임 1. 상황체험자한국에머슨하청업체미소공간임한수는 2009 년 10월 02 일오후4시경제1,2호기주 2. 원인제어설비교체공사의일환으로중앙제어실인테리어공사작업중천정에어덕트설치작업중안전모미착용상태에서사다리전도로인하여추락추락사고를당할번한아차사고사례임 가. 관리감독소홀나. 고소작업에따른안전수칙미준수다. 반복작업에의한안전모미착용등안전불감증 1. 안전교육및관리감독철저 2. 작업전위험예지훈련실시의생활화를통한안전사고예방 3. 작업전관련차단기전원차단확인철저 2. 원인가. 관리감독철저나. 고소작업에따른안전수칙철저준수다. 반복작업에의한안전모착용등안전보호 구착용철저 50

빅데이터기반재난 / 안전지수개발 아차사고정보분석 아차사고정보 형태소분석 취배수관로안전난간대일부구간미설치로인해낙하사고발생 Text Mining 취배수관, 안전난간, 구간, 미설치, 낙하, 사고, 발생 송전접속부절연부점검 송전, 접속, 절연부, 점검 #3 호기 Steam Blowing 시현장소음에의한순간청력상실 Steam, Blowing, 현장소음, 청력상실 51

빅데이터기반재난 / 안전지수개발 위험성평가표 sample Input 위험요인정보 관리번호 RA-삼운발1-006-운전-I 부서명발전운영1팀평가자평가대상위험성평가표팀장공완식 ATO업무공정 활동명평가전개선후 [4M-Risk Assesment] 평균위험도최근평가일 '13. 05. 15 3.2 3.2 작업내용 발전기보조계통 점검 (K) 평가구분 기 계 적 환 경 적 인 적 위험요인 ( 재해형태 ) 안전조치 현재상태 위험도 빈도강도위험도 개선대책 요구사항 코드번호 빈도 개선후상태 수소누설 ( 질식 ) 수소누설감지기설치 1 2 2 1 2 2 모터의절연 ( 감전 ) 양호 1 2 2 1 2 2 폭발성가스 ( 폭발 ) 고압가스관리요령교육 1 3 3 1 3 3 작업장바닥상태 ( 전도, 충돌 ) 작업장소음상태 ( 청력상실 ) 정리정돈 1 2 2 1 2 2 귀마개착용의무화 2 3 6 2 3 6 건물내분진마스크착용의무화 2 3 6 2 3 6 육체적건강상태 ( 충돌 ) 정신적건강상태악화 ( 오작동, 상태변화 인지부족, 시간차에따른 스트레스 ) 근무시작전발전차장 점검 근무시작전발전차장 점검 output 강도 2 1 2 2 1 2 3 2 6 3 2 6 위험 도 관 리 적 안전표시판마스크및귀마개착용부착여부표시판부착 1 1 1 1 1 1 안전수칙숙지 숙지 1 2 2 1 2 2 작업절차숙지 작업절차숙지전까지숙련자와동행 1 3 3 1 3 3 52

빅데이터기반재난 / 안전지수개발 위험요인분석 위험성평가 - 위험요인 형태소분석 순환수계통점검 Intake 일부구간안전난간미설치 - 소포제주입 Tank 옆 ( 추락 ) Text Mining 순환수, 계통, 점검, Intake, 구간, 안전난간, 미설치, 소포제, Tank, 추락 전기보조계통점검모터의절연 ( 감전 ) 전기보조계통, 점검, 모터, 절연, 감전 압축공기계통점검작업장소음상태 ( 청력상실 ) 압축공기, 계통, 점검, 작업장, 소음, 청력상실 53

빅데이터기반재난 / 안전지수개발 아차사고정보와위험요인정보의연관성측정 아차사고정보형태소분석 위험요인정보형태소분석 취배수관, 안전난간, 구간, 미설치, 낙하, 사고, 발생 순환수, 계통, 점검, Intake, 구간, 안전난간, 미설치, 소포제, Tank, 추락 송전, 접속, 절연부, 점검 전기보조계통, 점검, 모터, 절연, 감전 Steam, Blowing, 현장소음, 청력상실 압축공기, 계통, 점검, 작업장, 소음, 청력상실 54

빅데이터기반재난 / 안전지수개발 아차사고정보와위험요인정보의연관성측정 Jaccard Coefficient 취배수관, 안전난간, 구간, 낙하, 사고, 발생, 순환수, 계통, 점검, Intake, 구간, 미설치, 소포제, Tank 0.214 송전, 접속, 전기보조계통, 점검, 모터, 절연, 감전 0.285 Steam, Blowing, 압축공기, 계통, 점검, 작업장, 소음, 청력상실 0.250 55

빅데이터기반재난 / 안전지수개발 Jaccard coefficient time series plot sample 56

감사합니다. Q&A 57