차세대 4 차산업기술의이해 07_1 빅데이터의개요 (1) 폰트 : KoPub 서체 / 잉크립퀴드 4 차산업혁명과빅데이터시대도래배경을설명할수있다. 학습목표 빅데이터의기본개념에대해설명할수있다. -1- 본저작물은저작권법제25조수업목적저작물이용보상금제도에의거, 한국복제전송저작권협회와약정을체결하고적법하게이용하고있습니다. 약정범위를초과하는사용은저작권법에저촉될수있으므로저작물의재복제및수업목적외의사용을금지합니다. - 경희사이버대학교 한국복제전송저작권협회 - -2-
학습내용 (1) 빅데이터기본개념 (2) 4 차산업혁명과빅데이터시대도래배경 #1-3- 본저작물은저작권법제25조수업목적저작물이용보상금제도에의거, 한국복제전송저작권협회와약정을체결하고적법하게이용하고있습니다. 약정범위를초과하는사용은저작권법에저촉될수있으므로저작물의재복제및수업목적외의사용을금지합니다. - 경희사이버대학교 한국복제전송저작권협회 - -4-
우리사는오늘날의모습 카톡등 SNS 의일반화 NAVER 나 GOOGLE 을이용한검색의일상화 출처 : 4 차산업혁명기반기술의이해, 김미혜외 5 인공저, 연두에디션, pp199 01 사전적의미 1 국어사전 빅데이터란? 기존데이터에비해너무방대해이전방법이나도구로수집, 저장, 검색, 분석, 시각화등이어려운정형또는비정형데이터세트 2 NAVER 디지털경제의확산으로우리주변에는규모를가늠할수없을정도로많은정보와데이터가생산되는 ' 빅데이터 (Big Data)' 환경이도래하고있다. 빅데이터란과거아날로그환경에서생성되던데이터에비하면그규모가방대하고, 생성주기도짧고, 형태도수치데이터뿐아니라문자와영상데이터를포함하는대규모데이터 -5- 본저작물은저작권법제25조수업목적저작물이용보상금제도에의거, 한국복제전송저작권협회와약정을체결하고적법하게이용하고있습니다. 약정범위를초과하는사용은저작권법에저촉될수있으므로저작물의재복제및수업목적외의사용을금지합니다. - 경희사이버대학교 한국복제전송저작권협회 - -6-
01 사전적의미 3 위키백과 (WIKIPEDIA) 기존데이터베이스관리도구로데이터를수집, 저장, 관리, 분석할수있는역량을넘어서는대량의정형또는비정형데이터집합및이러한데이터로부터가치를추출하고결과를분석하는기술을의미 빅데이터란? 출처 : https://www.wikipedia.org/ 02 사전적의미종합 규모의방대함, 다양한종류, 생성주기의신속 새로운가치창출의엔진 (ENGINE) 새로운문제해결의방법 빅데이터란? -7- 본저작물은저작권법제25조수업목적저작물이용보상금제도에의거, 한국복제전송저작권협회와약정을체결하고적법하게이용하고있습니다. 약정범위를초과하는사용은저작권법에저촉될수있으므로저작물의재복제및수업목적외의사용을금지합니다. - 경희사이버대학교 한국복제전송저작권협회 - -8-
02 빅데이터의사전적의미종합 빅데이터란? Open Innovation 문제해결 Big Data Open Platform 빅데이터분석활용 가치창출 Creative Collaboration 새로운성장동력 01 개요 빅데이터의다양한정의 스마트사회로변화 데이터저장, 처리비용의하락, SNS 확대등으로 Social, IoT(internet of things), 라이프로그 (Life log) 데이터등이결합되고디지털데이터의양이기하급수적으로폭증 오늘날빅데이터에는다양한정의가존재 -9- 본저작물은저작권법제25조수업목적저작물이용보상금제도에의거, 한국복제전송저작권협회와약정을체결하고적법하게이용하고있습니다. 약정범위를초과하는사용은저작권법에저촉될수있으므로저작물의재복제및수업목적외의사용을금지합니다. - 경희사이버대학교 한국복제전송저작권협회 - -10-
02 Mckinsey 빅데이터의다양한정의 데이터의규모에초점을맞춘정의 기존데이터베이스관리도구의데이터수집, 저장, 관리, 분석역량을넘어서는데이터 ( 맥킨지 2011 년 5 월 ) 출처 : https://www.mckinsey.com/kr/overview, 21.07.23 03 IDC(Internet Data Centre) 빅데이터의다양한정의 업무수행방식에초점을맞춘정의 다양한종류의대규모데이터로부터저렴한비용으로가치를추출하고, 데이터의빠른수집, 발굴, 분석을지원하도록고안된차세대기술및아키텍처 -11- 출처 : 4차산업혁명기반기술의이해, 김미혜외 5인공저, 연두에디션, pp. 201 본저작물은저작권법제25조수업목적저작물이용보상금제도에의거, 한국복제전송저작권협회와약정을체결하고적법하게이용하고있습니다. 약정범위를초과하는사용은저작권법에저촉될수있으므로저작물의재복제및수업목적외의사용을금지합니다. - 경희사이버대학교 한국복제전송저작권협회 - -12-
04 Gartner 빅데이터의다양한정의 데이터크기 (volume), 다양성 variety), 속도 (velocity) 3 가지관점에서빅데이터기술을정의 출처 : 4 차산업혁명기반기술의이해, 김미혜외 5 인공저, 연두에디션, pp. 202 05 정의요약 ( 특징 ) : 3V, 4V 빅데이터의다양한정의 다양성 (Variety) 크기 (Volume) 구조화된 DB 정형 / 비정형모든데이터스트림 Big Data 3V 테라바이트수준데이터 수십페타 / 엑사 / 제타수준 규모가큰분석품질을좌우 가치 (Value) 속도 (Velocity) 배치분석 적시성 Always running 파이프라인 -13- 본저작물은저작권법제25조수업목적저작물이용보상금제도에의거, 한국복제전송저작권협회와약정을체결하고적법하게이용하고있습니다. 약정범위를초과하는사용은저작권법에저촉될수있으므로저작물의재복제및수업목적외의사용을금지합니다. - 경희사이버대학교 한국복제전송저작권협회 - -14-
01 크기 (Volume) 1 KB = 1024 Byte( 2 10 ) 1 MB = 1024 KB 1 GB = 1024 MB 1 TB = 1024 GB 1 PB = 1024 TB 1 EB = 1024 PB 1 ZB = 1024 EB 1 YB = 1024 ZB 빅데이터특징 출처 : 4 차산업혁명기반기술의이해, 김미혜외 5 인공저, 연두에디션, pp. 203 01 크기 (Volume) 1YB( 요타바이트 ) : 1,208,925, 819,614,629,174,706,176 Byte 1PB : 6GB DVD 영화 17 만 4 천편수록가능한용량 1TB : 1073741824 KB 만억조경해자양구간정재극 (48) 빅데이터특징 출처 : 4 차산업혁명기반기술의이해, 김미혜외 5 인공저, 연두에디션, pp. 203-15- 본저작물은저작권법제25조수업목적저작물이용보상금제도에의거, 한국복제전송저작권협회와약정을체결하고적법하게이용하고있습니다. 약정범위를초과하는사용은저작권법에저촉될수있으므로저작물의재복제및수업목적외의사용을금지합니다. - 경희사이버대학교 한국복제전송저작권협회 - -16-
02 다양성 (Variety) 1 정형화된데이터 (Structured data) : 형태와구조가일정 빅데이터특징 예 Numeric data, Text data 2 비정형데이터 (Unstructured data) : 구조화되어있지않은데이터 예 책, 잡지, 문서의료기록, 음성정보, 영상정보, 사진, 메신저, 스마트폰기반위치정보, 통화내용, 그외예상할수없는형태의데이터 03 속도 (Velocity) 사용자가원하는시간내데이터분석결과를제공하는속도, 데이터의 update 되는속도매우빨라짐 빅데이터특징 예 British Telecom : 1 초 60 기가의데이터전송 -17- 출처 : 4차산업혁명기반기술의이해, 김미혜외 5인공저, 연두에디션, pp 205 본저작물은저작권법제25조수업목적저작물이용보상금제도에의거, 한국복제전송저작권협회와약정을체결하고적법하게이용하고있습니다. 약정범위를초과하는사용은저작권법에저촉될수있으므로저작물의재복제및수업목적외의사용을금지합니다. - 경희사이버대학교 한국복제전송저작권협회 - -18-
03 속도 (Velocity) 오늘날디지털데이터는매우빠른속도로생성되기때문에데이터의수집, 저장, 분석등이실시간 (Real time) 으로처리돼야함 모든데이터가실시간처리만을요구하는것은아님 수집된대량의데이터를다양한분석기법과표현기술로분석하는과정에서장기적이고전략적인차원에서접근할필요가있음 빅데이터특징 04 가치 (Value) 빅데이터특징 아날로그에서디지털로의전환에따른가치의변화, 4 차산업혁명시대로의변화, 사회적변화등에따른가치의변화 오늘날데이터의홍수속에서가치창출의중요성강조됨 -19- 본저작물은저작권법제25조수업목적저작물이용보상금제도에의거, 한국복제전송저작권협회와약정을체결하고적법하게이용하고있습니다. 약정범위를초과하는사용은저작권법에저촉될수있으므로저작물의재복제및수업목적외의사용을금지합니다. - 경희사이버대학교 한국복제전송저작권협회 - -20-
05 빅데이터정의종합 ( 광의 ) 빅데이터특징 크기 (Volume) 다양성 (Variety) 속도 (Velocity) 가치 (Value) 데이터축적기술데이터분석기술데이터분석전문가 05 빅데이터정의종합 ( 광의 ) 데이터 + 분석처리기술 + 분석전문가 광의의빅데이터 빅데이터특징 인재 조직 ( 데이터사이언티스트등 ) 빅데이터로부터의미있는정보를도출하기위한인재나조직데이터처리 축적 분석기술 (Haddop, NoSQL, R 등 ) 대량의데이터를효율적으로처리, 분석하기위한기술 비정형데이터 ( 텍스트, 동영상, 음성, 센서, GPS 등 ) 데이터 * 협의의빅데이터는 3V 특성을갖는다 구조화데이터 ( 고객데이터, 거래데이터등 ) -21- 본저작물은저작권법제25조수업목적저작물이용보상금제도에의거, 한국복제전송저작권협회와약정을체결하고적법하게이용하고있습니다. 약정범위를초과하는사용은저작권법에저촉될수있으므로저작물의재복제및수업목적외의사용을금지합니다. - 경희사이버대학교 한국복제전송저작권협회 - -22-
#2 제 4 차산업혁명의등장 2011년 독일의인터스트리 4.0(Industrie 4.0) 대두 4차산업혁명 : 제조업 + 정보통신이융합되는단계 2016년 스위스다보스세계경제포럼화두로등장하며확산 포럼의주제 : 제4차산업혁명의이해 현재 우리는제4차산업혁명의시작점에서있는것 -23- 출처 : 4차산업혁명기반기술의이해, 김미혜외 5인공저, 연두에디션, pp 206 본저작물은저작권법제25조수업목적저작물이용보상금제도에의거, 한국복제전송저작권협회와약정을체결하고적법하게이용하고있습니다. 약정범위를초과하는사용은저작권법에저촉될수있으므로저작물의재복제및수업목적외의사용을금지합니다. - 경희사이버대학교 한국복제전송저작권협회 - -24-
01 빅데이터시대정보량 빅데이터시대도래배경 02 디지털화 빅데이터시대도래배경 디지털혁명, 소셜미디어의등장 데이터가급증 2012년기준세계에서생성된데이터규모 1.8조기가바이트 - DVD에저장하면지구에서달까지두번쌓을수있을만큼방대한양 급증한대량데이터에서가치를뽑아내고결과를분석하는기술이요구됨 ( 빅데이터기술 ) 빅데이터개념의변화 애초수십에서수천 TB 에달하는거대한데이터집합자체만을지칭하던양적개념에서데이터가급증으로인한대용량데이터를활용, 분석을통한가치있는정보를추출, 생성된지식을바탕으로능동적으로대응하거나변화를예측하기위한정보기술용어로확장 -25- 본저작물은저작권법제25조수업목적저작물이용보상금제도에의거, 한국복제전송저작권협회와약정을체결하고적법하게이용하고있습니다. 약정범위를초과하는사용은저작권법에저촉될수있으므로저작물의재복제및수업목적외의사용을금지합니다. - 경희사이버대학교 한국복제전송저작권협회 - -26-
03 인공지능, 자율주행, 사물인터넷등의확산 빅데이터시대도래배경 2016 년알파고, IBM 왓슨 인공지능이제 4 차산업혁명시대의대세를결정지음 자율주행시스템 ZB 시대를뛰어넘게하여요타바이트시대진입을촉진 사물인터넷의폭발적활용및사용증가 04 데이터유형과특성의변화 빅데이터시대도래배경 정형에서비정형데이터유형 RFID, 센스, 사물통신에따른사물정보나인지정보로변화 데이터특성의다양성 현실성, 실시간성으로변화 -27- 본저작물은저작권법제25조수업목적저작물이용보상금제도에의거, 한국복제전송저작권협회와약정을체결하고적법하게이용하고있습니다. 약정범위를초과하는사용은저작권법에저촉될수있으므로저작물의재복제및수업목적외의사용을금지합니다. - 경희사이버대학교 한국복제전송저작권협회 - -28-
01 빅뱅 (Big Bang) 빅데이터생성 전세계적으로매일 2.5 quintillion(10 18 ) 바이트의데이터가생성되고, 존재하는데이터의 90% 이상은최근 2 년안에생성됨 디바이스빅뱅 2010 년 100 억개모바일기기 2017 년 7 조개무선단말로연결 데이터빅뱅 2010년 800 EB 2020년 35 ZB로확대 2010~2015년 : 모바일트래픽은 6300%, SNS는연간 47% 이상확대 02 빅데이터로의변화요소 : 1 빅데이터생성 Device Explosion Information Explosion Application Explosion -29- 본저작물은저작권법제25조수업목적저작물이용보상금제도에의거, 한국복제전송저작권협회와약정을체결하고적법하게이용하고있습니다. 약정범위를초과하는사용은저작권법에저촉될수있으므로저작물의재복제및수업목적외의사용을금지합니다. - 경희사이버대학교 한국복제전송저작권협회 - -30-
02 빅데이터로의변화요소 : 2 빅데이터생성 이메일의증가데이터베이스의증가비정형데이터증가 01 스마트시대의빅데이터 데이터의발전과패러다임전환 데이터의발전스마트시대 IT 패러다임변화 IT의일상화가이루어지는스마트시대 소셜 (social), 사물 (object), 라이프로그 (life log) 데이터등이결합, 빅데이터의영향력이증대 실시간연결과소통의 스마트혁명 은데이터폭증을발생 기존의데이터저장, 관리, 분석기법은한계와도전에직면 데이터는정보사회를움직이는핵심연료인만큼, 빅데이터로의환경변화 정보사회의패러다임을견인할정도의큰힘을발휘 -31- 본저작물은저작권법제25조수업목적저작물이용보상금제도에의거, 한국복제전송저작권협회와약정을체결하고적법하게이용하고있습니다. 약정범위를초과하는사용은저작권법에저촉될수있으므로저작물의재복제및수업목적외의사용을금지합니다. - 경희사이버대학교 한국복제전송저작권협회 - -32-
02 시대의변화와패러다임의변화 데이터의발전과패러다임전환 시대변화 PC 시대인터넷시대모바일시대스마트시대 패러다임변화 디지털화 전산화 온라인화 정보화 소셜화 모바일화 지능화 사물정보화 -33-03 주요이슈와핵심서비스의변화 데이터의발전과패러다임전환 시대변화 PC 시대인터넷시대모바일시대스마트시대 리더기업 Microsoft IBM Google NAVER facebook twitter? 본저작물은저작권법제25조수업목적저작물이용보상금제도에의거, 한국복제전송저작권협회와약정을체결하고적법하게이용하고있습니다. 약정범위를초과하는사용은저작권법에저촉될수있으므로저작물의재복제및수업목적외의사용을금지합니다. - 경희사이버대학교 한국복제전송저작권협회 - -34-
빅데이터시장급팽창, 신성장동력 빅데이터시장급팽창, 신성장동력 데이터를활용할수있게하는빅데이터기술 서비스 장비시장의규모점증 2012 년 47 억달러에서 2015 년 169 억달러로성장, 2015 년까지빅데이터와관련한정보기술업계에일자리 440 만개가생겨났고, 계속성장중 우리나라청년실업해결의실마리 이전까지쓸모없이쌓아두기만했던데이터가새로운시장을창출하는신성장동력으로떠오름 빅데이터시장급팽창, 신성장동력 빅데이터시장급팽창, 신성장동력 매일전세계에서기하급수적으로불어나는데이터더미가이제 금광, 즉돈이됨 빅데이터활용에가장적극적인곳은기업 ( 이윤추구의극대화 ) 모든기업이빅데이터를분석하고해석하는기법을배우는데열중 -35- 본저작물은저작권법제25조수업목적저작물이용보상금제도에의거, 한국복제전송저작권협회와약정을체결하고적법하게이용하고있습니다. 약정범위를초과하는사용은저작권법에저촉될수있으므로저작물의재복제및수업목적외의사용을금지합니다. - 경희사이버대학교 한국복제전송저작권협회 - -36-
빅데이터시장급팽창, 신성장동력 [ 미래성장동력의분야및구조 ] 창조적성장, 융합형성장, 동반성장 주력산업고도화 미래시장선점 복지 - 산업동반성장 9 대전략산업 5G 이동통신 해양플랜트 스마트카 인텔리전트로봇 웨어러블스마트디바이스 실감형컨텐츠 맞춤형웰니스케어 재난안전관리스마트시스템 신재생에너지 Hybrid 시스템 4 대기반산업 지능형반도체 지속성장기반조성지능형미래융복합소재사물인터넷 빅데이터 -37- 데이터는경제적자산 : 이제는빅데이터시대 데이터 - 경제적자산, 빅데이터의활용중요성증대, 잠재적가능성 지능화, 개인화등스마트시대, 주요패러다임선도를위해서는빅데이터의활용이핵심이며, 그수준이경쟁력과성패를좌우 빅데이터의가공과분석에따라상황인식, 문제해결, 미래전망이가능해지고, 데이터가경제적자산과경쟁력의척도로부각 본저작물은저작권법제25조수업목적저작물이용보상금제도에의거, 한국복제전송저작권협회와약정을체결하고적법하게이용하고있습니다. 약정범위를초과하는사용은저작권법에저촉될수있으므로저작물의재복제및수업목적외의사용을금지합니다. - 경희사이버대학교 한국복제전송저작권협회 - -38-
데이터는경제적자산 : 이제는빅데이터시대 데이터 - 경제적자산, 빅데이터의활용중요성증대, 잠재적가능성 데이터의폭발적증가로인한혼돈과잠재적인가능성이공존하는 빅데이터 (Big Data) 시대 가도래 스마트단말확산, SNS 활성화, 사물네트워크 (M2M) 확산으로데이터폭발이더욱가속화되며점차빅데이터기반이확대될것 데이터는경제적자산 : 이제는빅데이터시대 ZETTA 를넘어 YOTTA 로, 잠재적가능성 제타바이트시대를넘어요타바이트시대로진입 07 년부터전세계적으로생성된디지털정보량이사용가능한저장공간 (Available storage) 을초과하기시작 (Economist, 2010) -39- 본저작물은저작권법제25조수업목적저작물이용보상금제도에의거, 한국복제전송저작권협회와약정을체결하고적법하게이용하고있습니다. 약정범위를초과하는사용은저작권법에저촉될수있으므로저작물의재복제및수업목적외의사용을금지합니다. - 경희사이버대학교 한국복제전송저작권협회 - -40-
데이터는경제적자산 : 이제는빅데이터시대 ZETTA 를넘어 YOTTA 로, 잠재적가능성 11 년, 전세계데이터에생성될디지털정보량이 1.8ZB 에도달 제타바이트시대 로진입 20 년, 관리할정보량이 50 배급증한 10 배많은서버가필요할것으로전망 1ZB 는 1 조 GB 에해당하는양으로美의회도서관저장정보 (235 테라바이트, 11.4 월현재 ) 의 4 백만배에해당 Q1 빅데이터시대도래배경에는디지털화, 소셜미디어의발전, 개인용컴퓨터 (PC) 의발달을들수있다. 54321-41- 본저작물은저작권법제25조수업목적저작물이용보상금제도에의거, 한국복제전송저작권협회와약정을체결하고적법하게이용하고있습니다. 약정범위를초과하는사용은저작권법에저촉될수있으므로저작물의재복제및수업목적외의사용을금지합니다. - 경희사이버대학교 한국복제전송저작권협회 - -42-
Q2 빅데이터의특징으로크기, 다양성, 속도 (3V) 등과 ( ) 를추가 (4V) 하여요약할수있다. 54321 [ ] 빅데이터기본개념 빅데이터정의, 특징 4차산업혁명과빅데이터시대도래배경 디지털화, 인공지능, 자율주행, 사물인터넷등의확산 데이터유형의패러다임변화 정리하기 데이터특성의패러다임변화 -43- 본저작물은저작권법제25조수업목적저작물이용보상금제도에의거, 한국복제전송저작권협회와약정을체결하고적법하게이용하고있습니다. 약정범위를초과하는사용은저작권법에저촉될수있으므로저작물의재복제및수업목적외의사용을금지합니다. - 경희사이버대학교 한국복제전송저작권협회 - -44-