<4D F736F F D204954B1E2C8B9BDC3B8AEC1EE2DB1E8C1A4C1D8>

Similar documents
선진사례집(0529)

Cover Story Oracle Big Data Vision 01_Big Data의 배경 02_Big Data의 정의 03_Big Data의 활용 방안 04_Big Data의 가치

Microsoft Word - th1_Big Data 시대의 기술_ _조성우

ㅇ ㅇ

CONTENTS Volume 테마 즐겨찾기 빅데이터의 현주소 진일보하는 공개 기술, 빅데이터 새 시대를 열다 12 테마 활동 빅데이터 플랫폼 기술의 현황 빅데이터, 하둡 품고 병렬처리 가속화 16 테마 더하기 국내 빅데이터 산 학 연 관

DB진흥원 BIG DATA 전문가로 가는 길 발표자료.pptx

Ubiqutious Pubilc Access Reference Model

들어가는글 2012년 IT 분야에서최고의관심사는아마도빅데이터일것이다. 관계형데이터진영을대표하는오라클은 2011년 10월개최된 오라클오픈월드 2011 에서오라클빅데이터어플라이언스 (Oracle Big Data Appliance, 이하 BDA) 를출시한다고발표하였다. 이와

문서의 제목 나눔고딕B, 54pt

슬라이드 1

3월2일자.hwp

Cloud Friendly System Architecture

제 1 호 지방자치단체녹색정보화추진동향 제 2 호 전자정부성과관리를위한평가동향 제 3 호 외국모바일전자정부추진동향 제 4 호 업무용 PC 가상화 제 5 호 증강현실구현기술현황 제 6 호 Web 기술의진화와공공서비스 제 7 호 ICT 를통한일자리창출방안 제 8 호 스마트

Slide 1

2009방송통신산업동향.hwp

빅데이터처리의핵심인 Hadoop 을오라클은어떻게지원하나요? Oracle Big Data Appliance Solution 01 빅데이터처리를위한전문솔루션이 Oracle Big Data Appliance 군요. Oracle Big Data Appliance 와함께라면더이

ecorp-프로젝트제안서작성실무(양식3)

빅데이터_DAY key

Cover Story 빅데이터플랫폼 Big Data 시대의엔터프라이즈인프라스트럭처 ORACLE KOREA MAGAZINE Spring 개요빅데이터를처리하는기술의가장중심기술은아파치하둡기술일것이다. 하둡기술은데이터를취득하고이를구조화시키고분석을하는일련의과정에

빅데이터분산컴퓨팅-5-수정

[ 2014 Capstone Design2 ] 지도교수 Twitter 분석시스템 < 졸업작품계획서 > 컴퓨터공학부 지도교수 민덕기교수님 T 박미관 김의명 제출일자

Microsoft Word - 조병호

Microsoft Word - 김민수

2007-최종-10월 16일자.hwp

PowerPoint 프레젠테이션

슬라이드 제목 없음

슬라이드 1

출원국 권 리 구 분 상 태 권리번호 KR 특허 등록

< B1E8C7F6C1D65FC7CFB5D3B1E2B9DDBAF2B5A5C0CCC5CDB1E2B9FDB8A6C0CCBFEBC7D128BCF6C1A4292E687770>

<43494FB8AEC6F7C6AE5FB0F8B0A3C1A4BAB85FBCF6C1A42E687770>

Microsoft Word - IT Report

김기남_ATDC2016_160620_[키노트].key

PowerPoint Template

[Brochure] KOR_TunA

? Search Search Search Search Long-Tail Long-Tail Long-Tail Long-Tail Media Media Media Media Web2.0 Web2.0 Web2.0 Web2.0 Communication Advertisement

wtu05_ÃÖÁ¾

PowerPoint Template

Agenda 오픈소스 트렌드 전망 Red Hat Enterprise Virtualization Red Hat Enterprise Linux OpenStack Platform Open Hybrid Cloud

3 장. 데이터와경영정보시스템

2 Journal of Disaster Prevention

Open Cloud Engine Open Source Big Data Platform Flamingo Project Open Cloud Engine Flamingo Project Leader 김병곤

슬라이드 1

09오충원(613~623)

Æí¶÷4-¼Ö·ç¼Çc03ÖÁ¾š

위세아이텍_iOLAP_

초보자를 위한 분산 캐시 활용 전략

<4D F736F F D20BBE7BABB202D20C3D6BDC54954B5BFC7E2>

4 차산업혁명과지식서비스 l 저자 l 한형상 / 한국산업기술평가관리원지식서비스 PD 김 현 / 한국전자통신연구원 IoT 연구본부장 SUMMARY 4차산업혁명의성격은초연결 초융합 초지능의세키워드로요약된다. 초연결은사람, 사물등객체간의상호연결성이확장됨을말하며이는곧실시간데이

Data Industry White Paper

Web Application Hosting in the AWS Cloud Contents 개요 가용성과 확장성이 높은 웹 호스팅은 복잡하고 비용이 많이 드는 사업이 될 수 있습니다. 전통적인 웹 확장 아키텍처는 높은 수준의 안정성을 보장하기 위해 복잡한 솔루션으로 구현

공공데이터개방기술동향

이도경, 최덕재 Dokyeong Lee, Deokjai Choi 1. 서론


Microsoft PowerPoint - 3장-MS SQL Server.ppt [호환 모드]

< B3E BCADBAF1BDBAB0FCB7C320C1A4BACE20C1F6BFF8BBE7BEF726C1A6B5B520C3D6C1BE E3128BCF6C1A420B9CEBAB4BCF6292DC6EDC1FD2E687770>

항목

Global Bigdata 사용 현황 및 향후 활용 전망 빅데이터 미도입 이유 필요성 못느낌, 분석 가치 판단 불가 향후 투자를 집중할 분야는 보안 모니터링 분야 와 자동화 시스템 분야 빅데이터의 핵심 가치 - 트랜드 예측 과 제품 개선 도움 빅데이터 운영 애로 사항


RUCK2015_Gruter_public

consulting

슬라이드 1

Bigdata가 제공하는 구체적인 혜택과 변화 양상 기업의 데이터 기반의 의사결정 시스템 구축 의지 확대 양상 빅데이터를 활용한 경영 및 마케팅 지속적인 증가세 뚜렷 빅데이터를 도입한 기업은 사전 기대를 뛰어넘는 효과를 경험 본 조사 내용은 美 BARC- Researc

untitled

untitled

월간 SW 산업동향 ( ~ ) Ⅰ. Summary 1 Ⅱ SW 5 2. SW 7 Ⅲ Ⅳ. SW SW Ⅴ : Big Data, 38

2013 Land Transport and Maritime R&D Report R&D/2013- 도시건축기획 -A

DW 개요.PDF

클라우드컴퓨팅확산에따른국내경제시사점 클라우드컴퓨팅확산에따른국내경제시사점 * 1) IT,,,, Salesforce.com SaaS (, ), PaaS ( ), IaaS (, IT ), IT, SW ICT, ICT IT ICT,, ICT, *, (TEL)

Microsoft Word - 김완석.doc


ICT À¶ÇÕÃÖÁ¾

<30302DB8F1C2F7BFDC2E687770>

<C0CCBCF8BFE42DB1B3C1A4BFCFB7E12DB1E8B9CCBCB12DC0DBBCBAC0DAB0CBC1F5BFCFB7E12DB8D3B8AEB8BBB3BBBACEC0DAB0CBC1F52E687770>

슬라이드 1

정보기술응용학회 발표

비식별화 기술 활용 안내서-최종수정.indd

2017 1

About

따끈따끈한 한국 Azure 데이터센터 서비스를 활용한 탁월한 데이터 분석 방안 (To be named)

슬라이드 1

歯CRM개괄_허순영.PDF

01 01NEAR

쉽게 풀어쓴 C 프로그래밊

SchoolNet튜토리얼.PDF

Semantic Search and Data Interoperability for GeoWeb

PowerPoint Presentation

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Nov.; 26(11),

Chapter 5 비즈니스인텔리젼스의기초 : 데이터베이스와정보관리

NIPA-주간 IT산업 주요 이슈-2013년21호(130531)-게재용.hwp

진정한토종벤처를꿈꾸는기업 저희시큐레이어는최근사회적화두로부각되고있는빅데이터를기반으로한통합로그수집 / 분석및통합보안관제분야에순수국산기술적자립으로외산과당당히겨루는소프트웨어를만들자는이념의전문소프트웨어기업입니다. 이러한이념을달성하기위한치열한열정과노력으로주요시장에서긍정적으로 평가

i4uNETWORKS_CompanyBrief_ key

무제-1

Process (Sales&Finish)

<B1DDC0B6C1A4BAB8C8ADC1D6BFE4B5BFC7E228C1A63836C8A3292E687770>

Microsoft PowerPoint - 3주차.pptx

Microsoft Word - 문필주.doc


Microsoft PowerPoint - CNVZNGWAIYSE.pptx

Basic Template

3. 클라우드 컴퓨팅 상호 운용성 기반의 서비스 평가 방법론 개발.hwp

Transcription:

주간기술동향 2013. 5. 1. 공간빅데이터기술동향 김정준건국대학교컴퓨터공학부조교수 jjkim9@db.konkuk.ac.kr 신인수, 한기준건국대학교컴퓨터공학부 1. 서론 2. 공간빅데이터분석기술 3. 공간빅데이터인프라기술 4. 공간빅데이터응용및활용사례 5. 결론 1. 서론오늘날인터넷사용의급격한증가, 스마트폰보급, SNS(Social Networking Service) 활성화등과함께디지털경제의확산으로인해감당할수없는규모의다양한데이터가생산되는 빅데이터 (Big Data) 환경이도래하였다. 이러한빅데이터는공공 / 기업정보, 웹, SNS, 지도, 이미지 / 동영상등정형 / 비정형데이터를모두포함하고있으며, 단순히대용량의데이터를넘어서그데이터를효과적으로처리하고분석할수있는기술에대한새로운패러다임을불러일으켰다. 그리하여개인, 기업, 공공분야등사회전반에걸쳐빅데이터를이용한차세대지능형서비스응용기술들에대한연구가활성화되고있다. 빅데이터의처리를위한연구는대부분빅데이터의효율적인분산처리를목표로하고, 대표적인빅데이터관련기술분야로빅데이터를수집하고분석하기위한기술, 빅데이터를효율적으로저장하고처리하기위한인프라기술등이있다 (( 그림 1) 참조 )[1],[2]. 이처럼빅데이터관련기술이중요한이슈로부각되면서, 공간정보분야에도많은영향을미치게되었다. 공간정보분야에서는일반적으로공간데이터의다양한공간적속성들을효율적으로처리하기위해공간데이터타입, 공간연산자, 공간인덱스등을지원할수있어야한다. 그러나빅데이터시대로변화하면서공간데이터의급격한증가는기존에사용하던공간데이터관리도구를사용한데이터수집, 저장, 관리, 분석하는역량을넘어서 * 본내용과관련된사항은건국대학교컴퓨터공학부김정준조교수 ( 02-444-3696) 에게문의하시기바랍니다. ** 본내용은필자의주관적인의견이며 NIPA 의공식적인입장이아님을밝힙니다. 14 www.nipa.kr

( 그림 1) 빅데이터관련기술의변화게되었다. 따라서, 이러한공간데이터의효율적인처리를위해기존빅데이터중에서공간데이터가포함된빅데이터를 공간빅데이터 (Spatial Big Data) 로분류하였으며, 공간빅데이터를처리하기위해기존빅데이터관련기술들에공간데이터처리기술을적용하는연구가진행되고있다 [3]. 최근공간빅데이터처리와관련된기술들은글로벌 IT 기술추세에맞추어매우중요한연구로부각되고있으며, 특히공간데이터마이닝, 공간의사결정등과같은공간빅데이터분석기술분야와공간하둡, 공간 NoSQL 등의공간빅데이터인프라기술분야들이주로연구되고있다 [4]. 그러나국내외공간빅데이터관련기술은시작된지얼마안된초기단계로아직까지관련연구가많이활성화되지않은실정이다. 따라서본고에서는기존의빅데이터관련기술들을정리하고, 최근공간빅데이터분석기술및인프라기술을조사하고자한다. 그리고주요국가의기업, 연구소등의공간빅데이터기술의활용사례를살펴보고, 이를바탕으로공간빅데이터주요이슈와향후발전가능성을조명해보고자한다. 2. 공간빅데이터분석기술 빅데이터는동시다발적인데이터의입력과정형 / 비정형데이터의처리특성때문에기 존의데이터처리에요구되는즉각적인처리속도와는달리, 대용량데이터에기반한분석 정보통신산업진흥원 15

주간기술동향 2013. 5. 1. 위주로장기적이고전략적인접근이요구 공간빅데이터분석기술 된다. 이러한흐름에맞추어빅데이터를 분석하는기술에대한연구가많이진행 되고있으며, 빅데이터분석기술은일반 적으로산재한수많은데이터를수집및 분석하여새로운정보를찾아내고가치를 창출하기위한용도로많이사용된다. 공간빅데이터분석기술은기존빅데 이터분석기술에공간데이터를처리하는기술을적용하는흐름으로진행되고있으며, 대 표적으로공간데이터마이닝, 공간의사결정지원시스템, 공간 R 등의기술이있다 (( 그림 2) 참조 )[4]. 공간데이터마이닝 공간의사결정지원시스템 공간 R ( 그림 2) 공간빅데이터분석기술 가. 공간데이터마이닝 (Spatial Data Mining) 데이터마이닝이란데이터베이스에저장된데이터속에서숨겨진패턴과관계를찾아내어정보를발견하는기술이다. 이를위해자동화혹은반자동화된도구를활용해다양한통계분석기법과모델링기법을적용하여데이터를분석한다. 데이터의형태와범위가다양해지고규모가방대한빅데이터의등장으로데이터마이닝의중요성은더욱부각되고있으며, 공간빅데이터를처리할수있는공간데이터마이닝의중요성도부각되고있다. 공간데이터마이닝은데이터마이닝에공간데이터를처리하기위한확장으로해석할수있으며, 공간데이터가가지는공간적특수성을고려한데이터마이닝이라할수있다. 즉, 공간데이터마이닝은기존공간데이터베이스에저장되어있는공간데이터들에대해공간적상관관계, 다양한공간적패턴을찾아내어공간에대한새로운정보를찾아내는과정이다. 공간데이터마이닝을위해사용되는대표적인기법은공간데이터클러스터링, 공간분류, 공간특성화등이있다 [5]. 이러한공간데이터마이닝은이동객체의위치데이터, 궤적데이터, 비정형데이터를포함한공간빅데이터를수집하고공간데이터마이닝을적용함으로써이동궤적분류혹은궤적예측을수행하는데활용되고있다. 나. 공간의사결정지원시스템 (Spatial Decision Support System) 의사결정지원시스템은분석가나의사결정자가문제해결을위해다양한분석모델을선 16 www.nipa.kr

택적으로조합하여시나리오를성립하는과정을순환적으로반복하여대안시나리오를작성함으로써보다바람직한결론을도출하도록지원하는시스템이다 [6]. 공간정보분야에서도공간적문제의해결을지원하는수단으로공간의사결정지원시스템이도입되었다. 공간의사결정지원시스템은공간빅데이터로부터발생하는공간의사결정과관련한중요한정보들을찾아내고분석하기위해, 기존의의사결정시스템에공간빅데이터의특성을적용하고융합함으로써공간정보에대한적합한분석모델을제시하고효율적인공간의사결정에활용하고있다. 공간의사결정지원시스템의대상데이터는기존의정형 / 비정형데이터를비롯하여빅데이터에속하는시맨틱웹의링크드데이터까지대상으로하고있다. 이러한공간의사결정지원시스템은 3 차원공간분석, 국토측량, 전염병예방, 군사훈련등다양한분야에서공간의사결정및문제해결을위한시스템으로활용되고있다. 다. 공간 R R 은오픈소스프로그래밍언어이자통계적컴퓨팅과가상화를지원하는소프트웨어이다. 1993 년뉴질랜드오클랜드대학의로스이하카와로버트젠틀맨이개발한 R 은이후대량의데이터셋을통계적으로분석하기위한툴로큰인기를누리게되었다. 최근에는기존의 R 에빅데이터처리기술을적용한 RHIPE 와같이 R 을이용한다양한시도를하고있다. R 은대용량데이터셋의분석기능뿐만아니라공간빅데이터를분석할수있는많은기능을포함하고있으며, 이러한공간빅데이터분석을지원하는패키지를공간 R 이라고부른다. 공간 R 을사용한공간데이터의분석은주로이동객체분석이나공간데이터셋분석에사용된다. 또한, 정밀한공간예측을하는기능이뛰어나기때문에환경적합성모델링에유용하다 [7]. 그리고공간빅데이터에대한단일패키지를제공하므로패키지간의데이터교환을수월하게해준다는장점이있어서대량의공간데이터셋을분석하는데중점적으로활용되고있다. 3. 공간빅데이터인프라기술동시다발적으로발생하는빅데이터를처리하기위해서분산데이터처리기술들이개발및적용되고있으며, 최근에는공간빅데이터를처리하기위해서기존분산데이터처리기술에공간데이터처리기술들을적용한다양한솔루션들이개발되고있다. 정보통신산업진흥원 17

주간기술동향 2013. 5. 1. 공간빅데이터를처리하기위한인프라기술로는데이터분산처리를위한솔루션프레임워크인공간하둡, 기존의데이터베이스에속도와비정형데이터활용이강조된공간 NoSQL, 기존의공간시스템과하둡, NoSQL 등을활용하 공간하둡 공간빅데이터인프라기술 공간 NoSQL 공간스토리지 ( 그림 3) 공간빅데이터인프라기술 기위한공간스토리지솔루션등을들수있다 (( 그림 3) 참조 ). 가. 공간하둡 (Spatial Hadoop) 아파치에서진행하고있는하둡프로젝트는안정적이고확장이용이하며분산컴퓨팅환경을지원하기위한오픈소스소프트웨어를개발하는프로젝트이다 [8]. 하둡의주요기술로는맵리듀스 (MapReduce) 와 HDFS 가있다. 맵리듀스는이름에서짐작할수있듯이맵 (Map) 과리듀스 (Reduce) 의두과정으로구성되어있다. 먼저맵단계에서는대규모데이터를여러대의컴퓨터에분산해병렬적으로처리하여새로운데이터 ( 중간결과물 ) 를만들어낸다. 리듀스단계에서는이렇게생성된중간결과물을결합하여최종적으로원하는결과를생산한다. 리듀스과정역시여러대의컴퓨터를동시에활용하는분산처리방식을적용한다. HDFS 는마스터 (Master)/ 슬레이브 (Slave) 구조로마스터인네임노드가파일의메타 (Meta) 정보를관리하고, 실제데이터는여러대의슬레이브인데이터노드에분산해서저장하는하둡분산파일시스템이다. 최근이러한하둡을기반으로 HDFS 와맵리듀스의단계에서효율적인공간빅데이터처리를위해공간인덱스인 Quad-Tree, R-Tree, KD-Tree 등을이용하여공간데이터를검색하고저장관리하는기술에대한연구가활발하다. Research and Implementation on Spatial Data Storage and Operation based on Hadoop Platform[9] 는공간데이터셋을 HDFS 에저장하고, 저장된데이터에대해맵리듀스로공간인덱스와데이터파일을생성한뒤, 생성한공간인덱스를참조하여 OGC 의공간연산자를적용한공간질의처리를수행한다. Toward Parallel Spatial Query Processing for Big Spatial Data[10] 는 Key-Value 형태로저장되는분산데이터베이스에서는공간인덱스를가지고있지않기때문에효율적인공간연산을할수없다는것을전제로 HDFS 의네임노드에공간인덱스인 Quad- 18 www.nipa.kr

Tree 를적용하여공간데이터저장소인 VegaGiStore 를개발하였다. VegaGiStore 는 Global Index 인 Quad-Tree 와 Local Index 인 SOFile(Spatial Object File) 로구성된 2- tier 의인덱스구조를가지고있다. 공간데이터검색시 Quad-Tree 를이용하여질의영역에해당하는 SOFile 만선택하고, 해당 SOFile 내부의공간데이터를대상으로공간연산자를적용한맵리듀스를사용하여분산처리한다. 나. 공간 NoSQL 빅데이터의동시다발적인데이터입력과다양한정형 / 비정형속성들은기존의관계형데이터베이스에서처리하기에기술적혹은비용적인면에서한계점이있기때문에다양한 NoSQL 솔루션들이개발되고있다. NoSQL 은관계형이아니기때문에조인 (Join) 연산이없고고정된스키마를갖지않는다. 따라서, 대량의데이터가입력되는경우, 컬럼을확정하기어려운경우, 단순히빠른결과를반환하여야할경우에효율적이다. NoSQL 은저장방식에따라 Key-Value, Document Oriented, Column Oriented 등으로분류되며, 대표적인 NoSQL 로는 MongoDB[11], Neo4j[12], CouchDB[13], HBase[14] 등 100 여개가있으며급속도로발전하고있다. 최근여러 NoSQL 솔루션에서는공간빅데이터처리를위한다양한연구가활발하다. 10gen.com 에서개발및운영되는 MongoDB 의경우기본적으로 Near, Box, Center 의간단한공간연산자를제공하고있으며, Z-Curve 공간알고리즘과 SDR-Tree 라는분산형공간인덱스에대한연구를진행하고있다 [11]. Neo Technology 에서개발한 Neo4j 는 Contain, Cover, Covered By, Cross, Disjoint, Intersect, Intersect Window, Overlap, Touch, Within, Within Distance 등의공간연산자를제공한다 [12]. CouchDB 는아파치프로젝트로진행중이고, 플러그인방식으로 Point, LineString, Polygon 등의공간데이터타입을지원하며, 다차원공간인덱스인 R-tree 를지원한다 [13]. 또한, NoSQL 중최근가장많이연구되고있는하둡의 HBase 를공간 HBase 로확장한연구도제시되었다 [15]. 공간 HBase 는 OGC 의다양한공간데이터타입과공간연산자를지원하며, HBase 에위치기반으로공간데이터를클러스터링하여저장하고, 공간데이터질의처리시에는공간인덱스를이용하여분산처리한다. 정보통신산업진흥원 19

주간기술동향 2013. 5. 1. 다. 공간스토리지 (Spatial Storage) 페이스북, 블로그, 트위터등 SNS 서비스가다양해지고그영역이확대됨에따라빅데이터라는용어가생겨났고, 이러한빅데이터를처리하기위해여러기업및연구소에서는이에대한솔루션으로하둡, NoSQL 등의다양한솔루션을내놓았다. 이에맞추어기존스토리지기업들역시새로운솔루션들을제시하게되었다. 오라클은기존의솔루션기반으로빅데이터처리를지원할수있는오라클빅데이터어플라이언스를발표하였다. 오라클빅데이터어플라이언스는이미검증된오라클솔루션의신뢰성, 유연성및성능에기반한통합솔루션으로써하둡의 HDFS 나 NoSQL 로부터데이터를수집하고맵리듀스를통해이를재구성하여빅데이터처리를지원하는솔루션이다 [16]. 그리고오라클은빅데이터처리및분석을위해오라클 R 을지원한다. 이러한기존오라클솔루션들은공간데이터처리및관리를지원하고있기때문에오라클빅데이터어플라이언스를활용하면공간빅데이터처리또한가능하다. 공간데이터처리를지원하는 MySQL 역시클러스터기능을통해빅데이터를분산처리할수있도록다양한기술을지원하고있으며, 최근에는 NoSQL APIs 제공과하둡과의통합을위한 White Paper 를제시하고, 이에대한연구를진행하고있다 [17]. 테라데이터는기존의 Strategy & Operational Intelligence 전략과빅데이터 Insight 전략을통합하여 Aster Data 를출시하였다. 테라데이터는 Aster Data 를활용하여기존의 CRM, SCM, ERP 등을통합하고, SQL 기반기술과맵리듀스를이용하여비정형실시간시공간데이터에대한분석및예측기능을제공한다 [16]. 이외에도오픈소스인 Postgre, NHN 의큐브리드, 마이크로소프트의 MS-SQL, IBM 의 DB2 등의데이터베이스업체들역시공간서비스를지원하기위해빅데이터분산처리지원을위한관련기술적용및연구를진행하고있는추세이다. 4. 공간빅데이터응용및활용사례공간데이터는 u-gis, Web 3.0 등의관련기술들을기반으로다양한응용분야에서사용되어왔으며, 최근빅데이터가사회적이슈로자리잡으면서공간데이터가포함된공간빅데이터에대한처리및관리를위한공간빅데이터분석기술, 공간빅데이터인프라기술들이빠르게발전하고있는추세이다. 이러한기술들은공간지형구축, 재난방재, 의료 20 www.nipa.kr

방역, 고용창출, 사회안전, 공공데이터처리관련, 국방, 민간분야등사회전반에걸쳐 많이활용되고있다. 가. 국내국내빅데이터시장은국가연구소및대학연구소를중심으로진행되고있으며, 아직까지는국외의연구에크게뒤쳐져있는실정이다. 그러나 NoSQL 과하둡환경을통한서비스의두각으로국내빅데이터시장이서서히성장하고있다. Daum, NHN, 솔트룩스 (Saltlux), SK 텔레콤, KT 클라우드웨어등과같은업체들에서는빅데이터솔루션을도입하거나자체관련기술들을개발하여공간빅데이터서비스를제공하고있다. 하지만공간빅데이터시장에서전문인력및연구역량을체계적으로확보하고있지않아관련연구는아직초기단계에머물러있다. 또한웹과모바일을통해서공간빅데이터가점차늘어나고있지만이러한공간빅데이터를제대로활용하지못하고있다. ETRI 는빅데이터처리에기반이되는분산스토리지인 GLORY-FS 를자체개발하였다 [18]. GLORY-FS 는 KTH, LG U+, 신테카바이오등의기업에서활용하여공간정보와빅데이터를융합한 장소ㆍ사회적관계인지형소셜미디어서비스기술 을통해현재 SNS 가가진단점인시공간및참여의제한성을해소하고, 사용자가필요로하는문제해결에효과적으로지원할수있는협업형소셜미디어서비스를제공한다. 서울시는재난ㆍ위기관리, 범죄ㆍ질병예방, 낙후지역재생, 시민과의소통강화등에공간빅데이터분석을통해재난대책본부의신속한처리가가능하도록하였다. 또한, 서울시는아고라와트위터를통해제보된수해지역사진과위치정보를결합하여폭우지도서비스를제공한다. 이러한서비스에참여하는사람들은실시간으로수해현장등을촬영한후웹과모바일을통해사진과위치정보를포함한공간빅데이터를생성한다. 그리고생성된공간빅데이터를분석하여수해지역의원인을파악하고도시재생에활용한다. Daum 은빅데이터처리를위해하둡, MongoDB, Casandra 등의 NoSQL 을도입하고, 이를통해전국모든지역을항공사진으로제공하는 다음지도스카이뷰 와실제거리모습을 360 도파노라마사진으로보여주는 다음지도로드뷰, 맛집, 병원, 펜션등의실내를실사촬영, 360 도파노라마로보여주는 다음스토어뷰 를기반으로교통정보, 부동산정보, 지역정보, 날씨예보등을결합한공간빅데이터응용서비스를이용자들에게 정보통신산업진흥원 21

주간기술동향 2013. 5. 1. 제공한다 [19]. 또한전국주요지역의교통속보를알려주는 다음지도실시간교통 서비스, 주유소별유가비교검색이가능한 다음지도주유가격 서비스, 보행자도보정보를제공하는 다음지도길찾기 서비스등을이용자들에게제공한다. NHN 은빅데이터처리를위해 nstore, nlocation, nglobe, NBP 등의플랫폼을자체개발하였다. 이러한플랫폼들을활용하여뉴스, 블로그, 이미지등여러카테고리의콘텐츠결과를상단에보여주고가장적합한문서를우선노출해주는서비스와자동완성, 연관검색어, 실시간급상승검색어등의검색어추천및사용자그룹별검색어서비스를제공한다 [20]. 특히지도서비스와위치정보서비스는그동안축적한공간빅데이터를기반으로전국단위의시내버스노선정보를제공하고도보, 자전거, 대중교통, 자동차등다양한이동수단에대한길찾기기능까지제공한다. 나. 국외국내뿐만아니라전세계적으로도빅데이터는가장큰이슈거리이다. 각국의연구기관및정부기관에서는빅데이터를핵심사업으로인지하고있다. 주요내용으로는미국을중심으로한세계각국의공공데이터개방이있고, 다양한플랫폼과시스템을구축하여국민들에게서비스중이다. 기업에서도이러한트렌드를유지하기위해다양한플랫폼을구축하여서비스중이며, 대표적기업으로는구글, 야후, 그리고트위터등이있다. 공간분야에서도연구기관및정부기관, 기업은빅데이터를이용한다양한플랫폼을구축하고서비스를제공하고있다. 미국정부는공공정보의개방과이용의활성화라는목적아래에빅데이터의대표적인자원인공공정보를제공하는플랫폼인 Data.gov 를구축하였다 [21]. Data.gov 는 Open API 형태로서비스하고있으며, 현재일반인, 개발자, 기업체에게해당데이터를제공중이다. Data.gov 를이용한대표적인서비스로는 DataMasher, EnergyMashup, ThisisWeKnow, FlyOnTime.us 등이있으며, 최근에는공간정보를유통하던 GOS(Geospatial One-Stop) 와 Data.gov 를통합한 Geo.data.gov 플랫폼또한구축하였다 [22]. 싱가포르에서는빅데이터와관련하여 data.gov.sg 플랫폼구축및빅데이터를이용한재난예방시스템인 RASH(Risk Assessment and Horizon Scanning) 시스템과같은다양한사업을진행중이며, 공간정보분야에서도빅데이터와관련된많은서비스들을제공하고있다. 싱가포르교통국 (LTA) 은 IBM 과함께 i-transport system 을구축하여서실시 22 www.nipa.kr

간교통량예측시스템 (TPT) 서비스를제공하고있다 [23]. TPT 는실시간교통흐름분석과예측서비스로구성되어있으며, 센서를통해실시간으로들어온교통데이터가교통시나리오로모델링되어서교통흐름분석및특정시간뒤의통행량을예측할수있도록하였다. 일본노무라연구소 (NRI) 에서는빅데이터인센서데이터를이용하여독자적인 UTIS (Ubiqlink Traffic Information System) 을구축하였다. 이시스템을활용하여 NRI 는 전력안내네비 인교통정보서비스를제공한다 [24]. 전력안내네비 교통정보서비스는사용자의 GPS 정보를활용하여자동차의주행스피드를계산하거나교통체증에대한교통정보를생성하여사용자에게목적지까지보다빠른최적의경로를안내한다. 구글은빅데이터처리를위한비용문제를줄이기위해저사양의머신들을대량배치하여분산처리할수있는구글파일시스템과빅테이블등다양한기술들을개발하였다 [25]. 이러한인프라기술들을구글어스, 구글맵, 구글파노라미오등다양한공간서비스와매시업하여양질의서비스를제공하고있다. 파노라미오는구글의공간서비스중하나이며, KML 과 OGC GeoRSS 형태로개발된사진공유커뮤니티사이트이다. 현재, 200 만개가넘는사진데이터들이쌓여있으며, 업로드된사진들중일부분은구글어스및구글맵의레이어의하나로사용된다. 야후는하둡을도입해게놈 (Genom), C.O.R.E 등을개발하였다. 또한, 빅데이터분산트랜잭션시스템개발을위해스트리밍맵리듀스프로젝트를진행하고있다 [26]. 이러한관련도구및시스템을기반으로야후는다양한빅데이터서비스를제공하고있다. 그리고야후는구글의구글맵기반으로스케치어서치 (Sketch-a-Search) 라는공간서비스를스마트폰에서제공하고있다. 스케치어서치는원하는범위를그려넣어검색하며, 사용자의원하는지역범위안에있는비즈니스업체들을구글맵의공간빅데이터를이용하여검색한다. 5. 결론본고에서는현재까지의공간빅데이터분석기술과인프라기술들을조사하고, 국내는물론국외에서공간빅데이터를어떻게활용하고있는지살펴봄으로써미래의공간빅데이터관련기술의전망을알아보고자하였다. 정보통신산업진흥원 23

주간기술동향 2013. 5. 1. 빅데이터의등장은기존의단순히 아주많은 데이터를어떻게처리하는가하는관점을벗어나, 다양한형태로매일쏟아져나오는방대한데이터들중에서어떻게, 얼마나, 가치있는데이터를효율적으로찾아내고잘활용할수있느냐에대한고민으로바뀌어져갔다. 이를위해전세계적으로빅데이터를활용한데이터분석기술들과이를위한인프라기술들을활용한서비스와플랫폼들이상품화되고있으며, 공간정보분야에서도 GIS, LBS 등과융합된다양한공간빅데이터서비스및콘텐츠들을제공하기위한기술들에대한연구가활발히진행되고있다. 해외에서는빅데이터가향후국가경제와기업의성패를가늠할미래의새로운경제적가치의원천이될것으로기대하고, 빅데이터분석에의한미래예측과응용서비스개발에많은노력을기울이고있다. 우리나라에서는정부차원에서미래국가경쟁력의핵심자원으로공간정보분야에빅데이터분석기술을적용하는연구계획을추진중이지만, 국제적인기술경쟁력을확보하기위해서는아직많은연구와노력이필요하다. 공간빅데이터처리기술은기존의단순한공간정보제공에서벗어나, 다양한비공간정보들과함께융합, 가공, 분석됨으로써새로운형태의공간정보를제공하는방향으로나아가고있다. 기존공간정보산업은공간데이터베이스를구축하고, GIS 기술을이용한공간정보활용시스템을구축하는데주력하였으나, 공간빅데이터를활용한공간정보산업은차세대성장동력, 미래예측, 신가치창출등을모토로방대한공간빅데이터를수집ㆍ분석및활용하는다양한서비스와접목되면서점차고도화된지능형공간정보서비스산업으로발달해갈것이다. 따라서, 공간빅데이터가가져올미래의변화를예측하고, 이에대한범국가적인전략과적절한대응방안의준비가필요할것으로전망된다. < 참고문헌 > [1] 강만모, 김상락, 박상무, 빅데이터의분산과활용, 한국정보과학회정보과학회지, 제 30 권제 6 호, 2012, pp.25-32. [2] 양미라, 빅데이터와 DBMS 의시장전망, 하연, 2012. [3] Shekhar, S., Gunturi, V., Evans, M.R. and Yang, K.S., Spatial Big-data Challenges Intersecting Mobility and Cloud Computing, Proc. of the Eleventh ACM, MobiDE, 2012, pp.1-6. [4] 최성우, 김호영, 김영국, 빅데이터기술및분석기법의연구동향, 한국정보과학회학술발표논문집, 제 39 권제 2 호, 2012, pp.164-196. [5] 이충호, 안경환, 이문수, 김주완, u-gis 공간정보기술동향, ETRI, 전자통신동향분석, 제22 권제3 24 www.nipa.kr

호, 2007, pp.110-123. [6] Malczewski, J., GIS and Multicriteria Decision Analysis, Department of Geography University of Western Ontario, 1999, pp.703.-726. [7] Spatial Analysis, http://www.spatialanalysis.co.uk [8] Apachhe Hadoop, http://hadoop.apache.org [9] Wang, Y. and Wang, S., Research and Implementation on Spatial Data Storage and Operation Based on Hadoop Platform, Proc. of Geoscience and Remote Sensing, Vol.2, 2011. 8, pp.275-278. [10] Zhong, Y., Han, J., Zhang, T., Li, Z., Fang, J. and Chen, G., Towards Parallel Spatial Query Processing for Big Spatial Data, 26th IEEE International Parallel and Distributed Processing Symposium (IPDPS Workshop), 2012. 5, pp.2085-2094. [11] 10gen, http://www.mongodb.org [12] Neo Technology, http://www/neo4j.org [13] Apache CouchDB, http://couchdb.apache.org [14] Apache HBase, http://hbase.apache.org [15] 한성근, 공간빅데이터를위한 Spatial HBase 의설계및구현, 건국대학교대학원공학석사학위논문, 2013. [16] 정지선, 빅데이터기업의솔루션및서비스추전현황, 한국정보화진흥원빅데이터전략연구센터, 2012. [17] MySQL, http://mysql.com [18] ETRI, http://www.etri.re.kr/etri/res/res_06020302.etri [19] Daum, http://www.daum.net [20] NHN Developer's Blog, http://helloworld.naver.com [21] 2012 국가정보화백서, 행정안전부, 2012. [22] 2011 년도국가공간정보정책에관한연차보고서, 국토해양부, 2012. [23] 이성훈, 빅데이터활용현황, 한국정보기술학회지, 제 10 권제 3 호, 2012, pp.51-54. [24] 한영미, IT Issues Weekly, 한국정보화진흥원, 2012. 3, pp.6-8. [25] Google, http://en.wikipedia.org/wiki/google [26] 빅데이터, http://www.bicdata.com 정보통신산업진흥원 25