통계학, 빅데이터를잡다 2018 년 2 학기 : Ch. 1 통계학, 빅데이터시대를이끌다 Chapter 1 통계학, 빅데이터시대를이끌다 Statistics is the art of learning from data 차산업혁명, 일자리가사라져서혁명적일까? 4

Similar documents
<BAB9C0E2B0E820B3D7C6AEBFF6C5A9BFCD20B5A5C0CCC5CD20B0FAC7D0C0C720B1B8C1B6BFCD20C6AFC2A15FC1A4C7CFBFF528BCF6C1A4292E687770>

핵 심 교 양 1 학년 2 학년 3 학년합계 문학과예술 역사와철학 사회와이념 선택 교양학점계 학년 2 학년 3 학년합계비고 14 (15) 13 (

핵 1 학년 2 학년 3 학년합계 문학과예술 역사와철학 사회와이념 선택 학점계 학년 2 학년 3 학년합계비고 14 (15) 13 (14) 27 (29) 2

Data Industry White Paper

00목차

(291)본문7

¾Ë·¹¸£±âÁöħ¼�1-ÃÖÁ¾

01....b

2007백서-001-특집

4 차산업혁명과지식서비스 l 저자 l 한형상 / 한국산업기술평가관리원지식서비스 PD 김 현 / 한국전자통신연구원 IoT 연구본부장 SUMMARY 4차산업혁명의성격은초연결 초융합 초지능의세키워드로요약된다. 초연결은사람, 사물등객체간의상호연결성이확장됨을말하며이는곧실시간데이


학점배분구조표(표 1-20)

aws

PowerPoint 프레젠테이션


제 31회 전국 고교생 문예백일장 산문 부문 심사평.hwp

<C7A5C1D8BFF8B0ED20BCF6BDC328C3D6C1BEBABB292E687770>

Ch 1 머신러닝 개요.pptx

CONTENTS Volume 테마 즐겨찾기 빅데이터의 현주소 진일보하는 공개 기술, 빅데이터 새 시대를 열다 12 테마 활동 빅데이터 플랫폼 기술의 현황 빅데이터, 하둡 품고 병렬처리 가속화 16 테마 더하기 국내 빅데이터 산 학 연 관

gcp

SECTION TITLE A PURE PRIMER (AI), // 1

SW 기초교양교육이수가이드라인 경희대학교 SW 중심대학사업단 4 차산업혁명에대비하기위해대한민국정부는초 / 중 / 고교에 SW 교육을의무화하고, 보다더빠른준비를위해대학 생전체에 SW 기초교양교육을권장하고있습니다. 특히, 과학기술정보통신부는 'SW 중심대학 ' 사업을통해

<C3E6B3B2B1B3C0B C8A32DC5BEC0E7BFEB28C0DBB0D4292D332E706466>

Drucker Innovation_CEO과정

08SW

wtu05_ÃÖÁ¾

ë–¼ì‹€ìž’ë£„ì§‚ì‹Ÿì€Ł210x297(77p).pdf

<B3EDB4DC28B1E8BCAEC7F6292E687770>

Art & Technology #5: 3D 프린팅 - Art World | 현대자동차

PowerPoint 프레젠테이션

1장.indd

PowerPoint 프레젠테이션

제1강 인공지능 개념과 역사


IT.,...,, IoT( ),,.,. 99%,,, IoT 90%. 95%..., (PIPA). 디지털트랜스포메이션은데이터보안에대한새로운접근방식필요 멀티클라우드사용으로인해추가적인리스크발생 높은수준의도입률로복잡성가중 95% 는민감데이터에디지털트랜스포메이션기술을사용하고있음

PowerPoint 프레젠테이션

한국정책학회학회보

레이아웃 1

PowerPoint 프레젠테이션

클라우드컴퓨팅확산에따른국내경제시사점 클라우드컴퓨팅확산에따른국내경제시사점 * 1) IT,,,, Salesforce.com SaaS (, ), PaaS ( ), IaaS (, IT ), IT, SW ICT, ICT IT ICT,, ICT, *, (TEL)

Output file

e-spider_제품표준제안서_160516

2013_1_14_GM작물실용화사업단_소식지_내지_인쇄_앙코르130.indd

Introduction to Deep learning

빅데이터_DAY key

고3-02_비문학_2_사회-해설.hwp

KAKAO AI REPORT Vol.01

강의계획서 (Sylabus) 2013 학년도 2 학기 * 강의과목 교과목명 (CourseName) 한국문화를찾아서 INSEARCHOFKOREANCULTURE 언어 (Language) 영어 과목번호 - 분반 (CourseNo.-Class) 수강대상

170918_hjk_datayanolja_v1.0.1.

425.pdf

Open Cloud Engine Open Source Big Data Platform Flamingo Project Open Cloud Engine Flamingo Project Leader 김병곤

2. 강의방법 (CourseResources) 세미나 Seminar 발표 Presentation 질의응답 Q&A 초청강의 Special Lecture 현장답사 Field Trip 유인물활용 Handouts Audio/Video/TV Team Teaching 토의 / 토

<B3EDB9AEC0DBBCBAB9FD2E687770>

CONTENTS 숭실사이버대학교 소개 총장 인사말 교육이념 및 비전 콘텐츠의 특징 숭실사이버대학교 역사 숭실사이버대학교를 선택해야 하는 이유 숭실사이버대학교 학과 소개 1 1 학과 소개 30 연계전공 & 신 편입생 모집안내 숭실사이버대학교 C

보건복지 Korea Institute for Health and Social Affairs 제 333 호 ( ) 발행일 ISSN 발행인김상호발행처한국보건사회연구원 (30147) 세종시시청

MOBIS_<1102><1162><110C><1175>_1<110B><116F><11AF><1112><1169>_<110E><116C><110C><1169><11BC>.pdf

006_026_특집_정일권.indd

R을 이용한 텍스트 감정분석

(최종) 주안도서관 소식지_7호.indd

¹ÙÀÌ¿À´Ï¾È½º03

융합인재교육 ( S T E A M ) 프로그램 2

2-2

[한반도]한국의 ICT 현주소(송부)

[NO_11] 의과대학 소식지_OK(P)

숙련기술인의경제적 사회적지위 분석을위한측정지표개발

소준섭


4? [The Fourth Industrial Revolution] IT :,,,. : (AI), ,, 2, 4 3, : 4 3.

( ) 0 Ⅰ 02 Ⅰ 03 Ⅰ 04 Ⅰ LBR00 05 Ⅰ 06 Ⅰ.0 4 G G G G G G Ⅰ.0 0 G Ⅰ.0 9 J30 LBR ,9 D45 * 과목은 학

PowerPoint 프레젠테이션

Contents SEOUL NATIONAL UNIVERSITY FUTURE INTEGRATED-TECHNOLOGY PROGRAM FIP 13 FIP

SEOUL NATIONAL UNIVERSITY FUTURE INTEGRATED-TECHNOLOGY PROGRAM 13 : (IoT), 4.0,,,,,, CEO. 13 : ( ) ~ 11 1 ( ) : 310

2017 1

untitled

00-CourseSyllabus

ArtecScanners-Booklet-EURO-A4-KOREAN-Mail

2016남서울_수시모집요강_단면.pdf

<4D F736F F D20302EC0CEC6AEB7CE2BC1BEB8F1B8AEBDBAC6AE2BBCBAB0FA BCBAB0FABEF7B5A5C0CCC6AEBFCFB7E1292E646F6378>

<C3D6C0E7C3B528BAB8B5B5C0DAB7E1292D322E687770>

<BFA1B3CAC1F62C20C8AFB0E62CB0C7BCB320BAD0BEDFC0C720B9CCB7A1C0AFB8C1B1E2BCFABCB1C1A42E687770>

<B9CCB8AE20B3EBB5BFB9FDB0B3C1A420C0EFC1A1BBE7C7D720B1B9C1A6BAF1B1B B9DAB9CCB8AE292E687770>

동향 제 28 권 12 호통권 626 호 제 4 차산업혁명과 Industrial IoT Industrial Internet 의이해 14) 김민식 * 최주한 ** 1. 제 4 차산업혁명과 Industrial IoT Industrial Internet 의개념 2016년 1

Week2.key

빅데이터, 데이터사이언스, 예측분석, 머신러닝, 인공지능?

상담학연구. 10,,., (CQR).,,,,,,.,,.,,,,. (Corresponding Author): / / 567 Tel: /

09오충원(613~623)

I. 기업의 고민과 학계의 연구 이제 전망보다 경험이 중요해진 빅데이터 지난 4월 모 기업에서 개최한 빅데이터 사례 발표에 많은 사람들이 몰렸다. 예상하지 못 한 듯 운영진은 모자란 자리를 만드느라 분주했다. 그래도 자리를 잡지 못한 사람들은 벽에 기대어 2시간 가까이

슬라이드 1

2018 데이터산업백서 2018 Data Industry White Paper

WORLD IT SHOW 2015 TREND Connect Everything WIS 2015 KEY ISSUE

Cover Story Oracle Big Data Vision 01_Big Data의 배경 02_Big Data의 정의 03_Big Data의 활용 방안 04_Big Data의 가치

[2016년조사대상 (19곳)] 대림산업, 대한항공, 동부화재해상, ( 주 ) 두산, 롯데쇼핑, 부영주택, 삼성전자, CJ제일제당, 아시아나항공, LS니꼬동제련, LG이노텍, OCI, 이마트, GS칼텍스, KT, 포스코, 한화생명보험, 현대자동차, SK이노베이션 [ 표

A G E N D A 2015년형 전시공간 넷 no mountain high enough 2 Suitable Forms Bachelor Party LESS

he Crazy, the Creative! 발표인사 소개 사회자 임승희 수원대 경영학과 교수 고려대학교 경영학 박사 텍사스 주립대학교(University of Texas at Austin) 방문연구원 현 한국문화경제학회, 한국마케팅학회 편집위원 저서 우리나라의 공익연계


ÅëÁõ¼Ò½ÄÁö50È£

Track2

10지식정보보안

위해 사용된 기법에 대해 소개하고자 한다. 시각화와 자료구조를 동시에 활용하는 프로그램이 가지는 한계와 이를 극복하기 위한 시도들을 살펴봄으로서 소셜네트워크의 분석을 위한 접근 방안을 고찰해 보고자 한다. 2장에서는 실험에 사용된 인터넷 커뮤니티인 MLBPark 게시판

<30332DB1E2C8B9C6AFC1FD28B7F9C0E7C8AB D E687770>

Transcription:

Chapter 1 통계학, 빅데이터시대를이끌다 Statistics is the art of learning from data. 1.1 4 차산업혁명, 일자리가사라져서혁명적일까? 4 차산업혁명 (Fourth Industrial Revolution, 4IR ) 은융합혁명 1.1.1 2016년세계경제포럼의미래일자리보고서 1차산업혁명 (18세기후반 ) 증기기관 2차산업혁명 (19세기후반 ) 전기에너지 3차산업혁명 (20세기후반 ) 정보기술 4차산업혁명 (21세기초반 ) 빅데이터, 인공지능 세계경제포럼 (World Economic Forum, https://www.weforum.org/), 2016 년 1 월, 스위스다보스 1

(1) 직업의미래 ( 보고서 ) - 향후새로생길일자리수 << 사라지는일자리수 - 유망분야 : 빅데이터, 인공지능, 생명공학, 나노기술, 사물인터넷 - 데이터분석, 컴퓨터, 수학분야에서새로운일자리수요증가 (2) 앞으로필요한직무역량 - 복합적인문제를해결할수있는능력 (complex problem solving skill) - 비판적사고 (critical thinking) - 창의성 (creativity) 융합과통섭 (convergence and consensus) 의강조 1.1.2 4차산업혁명시대의통계학과데이터사이언스 (1) 빅데이터, 기계학습 (machine learning), 인공지능의기본은통계학 (2) 데이터사이언스 : 통계학 + 컴퓨터과학 (3) 모든분야에서통계학과데이터사이언스가사용 1.1.3 빅데이터 (1) 빅데이터의특징 - 양 (volume): 엄청난데이터규모 - 다양성 (variety): 정형 / 비정형구조, 음성, 영상, 자연어데이터 - 속도 (velocity): 실시간데이터, 빠른분석요구 (2) 빅데이터는 1990년대후반 ~2000년대초반에사용되기시작 (3) 데이터 - 라틴어어원 : 주어진것, datum (4) 정보, 지식, 지혜 - 정보 (information): 데이터를가공 - 지식 (knowledge): 정보를추상화 - 지혜 (wisdom): 지식을추상화 2

(5) Google Books Library - 구글이 2004년부터진행 - 전세계도서관에있는모든자료를스캔해서디지털자료로만듬 (6) 위키피디아 - 지식이만들어지고소비되는데시간과장소는더이상장애요인이아님 - 특정전문가에게지식이집중되지않음 1.2 빅데이터의곳간을열다 데이터랩과엔그램 1.2.1 빅데이터는어디에모여있을까? (1) 데이터센터 - 서버, 스토리지, 네트워크등의장비 (2) Naver Data Lab - 네이버, 검색부터지식까지 빅데이터곳간 을열다 - 네이버데이터센터 : 강원도춘천, http://datacenter.navercorp.com 3

(3) Google Data Center, https://www.google.com/about/datacenters/inside/locations/index.html 1.2.2 구글의엔그램 : 단어로찾는역사 Google Ngram Viewer (1) n-gram - 서로이웃해서나타나는단어들의빈도와확률모델을이용하는방법 (2) 컴퓨터언어학 - 컴퓨터가인간의말이나글을듣거나읽고이해하고인간고의사소통을할수있는방법을연구 - 컴퓨터과학 + 언어학 + 수학 + 통계학 (3) https://books.google.com/ngrams - 단어입력 과거의데이터에서나온결과출력 - big, data: big과 data 각각 4

- big data: big 과 data 동시에 1.2.3 클라우드컴퓨팅과빅데이터 (1) 빅데이터의분석은인터넷을통해여러곳에흩어진데이터를대상으로함 (2) AWS (Amazon Web Services) - 아마존이 2006년시작한서비스 - 초기에는데이터저장장소를빌려주는스토리지서비스, 이후데이터분석서비스로확장 - 2012년미국대선당시오바마후보의선거운동캠프에서 AWS의빅데이터분석을활용하여승리 5

(3) 정보권력집중문제 - Book 클라우드와빅데이터의정치경제학 : 엄청난컴퓨터능력이집중된클라우드시스템을소수의조직이폐쇄적으로통제 - 구글, 페이스북의각종사업도일반인은잘모르게진행 1.3 낱말들의뭉게구름을그려볼까? 데이터분석과데이터시각화텍스트마이닝 (text mining) : 언어학, 통계학, 머신러닝등을기반으로한자연어처리기술을활용하여텍스트데이터로부터의미있는정보를찾아내는분석법 1.3.1 데이터시각화 (1) Word Cloud - 단어들로이루어진구름 (2) 인간의인식은 75% 가시각으로이루어짐 (3) Statistical graphics - 통계적기법을이용한시각화 (4) R data language - 시각화를위한공개소프트웨어 1.3.2 멋진그림이좋은분석일까? : 데이터시각화와데이터분석 (1) 데이터시각화는외형적인아름다움을추구하기보다는데이터로부터중요한정보를얻어내는과정 6

1.4 통계에도역사가있을까? 데이터의역사와종류 1.4.1 괴테시절 (18세기) 독일의통계는종합지리학? (1) 18세기독일 - 어떤국가나지방의다양한모습을기록 - 지리, 경제, 행정, 산업등다방면의주제에대한많은데이터와정보를담은일종의종합지리학 (2) 19세기영국 - 산업혁명에의한급격한사회변화를파악하기위한객관적이고과학적인방법 - 데이터전성시대 : 통계조사를통해드러나는사실만이객관적이며거기에견해나이론이덧붙여지면객관성이훼손된다고생각 - 통계전문가는데이터를모을뿐, 그데이터를분석하고정보를얻어내는것은다른전문가가할일 (3) 오늘날과같이데이터를수집하고분석까지하는것은 19세기후반에시작 1.4.2 대상과상황에따라선택한다 : 실험데이터와관찰데이터 (1) 실험데이더 - 실험 (experiment) 을통하여얻은데이터 - 알고싶은결과에영향을미칠수있는요인들을통제할수있어상대적으로믿을만한데이터 (2) 관찰데이터 - 관찰조사 (observation) 를통하여얻은데이터 - 이미존재하는현상으로부터데이터를얻음 - 센서스 (census): 전국적인인구조사, 유럽 1800년전후시작, 우리나라는일제강점기에시작 - 사회조사분석사 : 국가공인자격증, 공무원시험등에서가점, 조사관련기업체취업 7

1.4.3 양적데이터와질적데이터 : 어느한쪽만최선일까? (1) 양적데이터 (quantitative data) - 수량화 : 집회참가자수, 특정페이스북방문자수, - 행복도측정 : ( 매우불만-불만-보통-만족-매우만족 ) (1-2-3-4-5), 수량화 (2) 질적데이터 (quantitative data) 1.4.4 스몰데이터와빅데이터, 그관계란? (1) Small data - 실험이나관찰을통하여만들어진데이터 (2) Big data - 3V - 데이터의원천이다양 : SNS, Web pages, 디지털도서관, - 앤더슨 이론의종말 기고 ( 과학잡지 Wired에 2008년발표 ): 빅데이터의커다란영향 (3) 빅데이터의비중이계속적으로더커지고있지만스몰데이터의필요성도여전히존재 : 임상데이터, 1.4.5 빅데이터분석의해결과제는? : 질적분석 (1) 페이스북에서 우정 이라는것을어떻게수량화? (2) 카카오톡메시지는대부분숫자가아닌데이터임 질적분석 (3) 빅데이터에서질적데이터분석에대한연구가많이진행되어야함 8

1.5 통계학, 데이터를정보와지식으로만들다 빅데이터시대의통계학 1.5.1 통계학은측정의과학 (1) ~metrics 로끝나는학문분야 = 해당학문분야 + 통계학 - Econometrics: 계량경제학 - Psychometrics: 심리측정학 ( 정신측정학 ) - Biometrics: 생물측정통계학 - Technometrics - Scientometrics (2) 생체인식 - 지문인식시스템 - 홍체인식시스템 - 얼굴인식 (face recognition): 2차원또는 3차원이미지, 열상정보, 1.5.2 기억천재의통계학점수는? 기억 ( 암기 ) 을잘한다고해석똑똑한것은아님 9

1.6 빅데이터시대, 통계학도변화한다 통계학의융합성 1.6.1 컴퓨터활용으로통계학날개를달다 Small Data vs. Big Data (1) 과거 ~ 현재 : Small data 위주 - 표본을분석하여모집단의특성을이해 - 통계적추론 (statistical inference) (2) 현재 ~ 미래 : Big data 위주 - 컴퓨터활용 : 데이터분석에필요한계산능력향상, 빅데이터의등장으로모집단에근접한데이터확보 - 빅데이터분석을위한새로운기법이필요 ( 비정형데이터의분석등 ) 1.6.2 나에게꼭맞는치료법을찾아라 : 생물정보학 (1) 생물정보학 (bioinformatics) - 통계학, 컴퓨터과학, 생물학이결합하여대규모의학데이터를분석 - 맞춤형치료, 신약개발, 1.6.3 빅데이터시대에가장섹시한직업은? (1) 배리언 (Hal Varian), 구글의수석경제학자 2008 년 - 앞으로 10 년간가장섹시한직업 (the sexy job) 은통계전문가일것 10

https://money.usnews.com/careers/best-jobs/statistician 11