sdf

Similar documents
sdf

슬라이드 1

김기남_ATDC2016_160620_[키노트].key

<C0CCBCBCBFB52DC1A4B4EBBFF82DBCAEBBE7B3EDB9AE2D D382E687770>

CONTENTS Volume 테마 즐겨찾기 빅데이터의 현주소 진일보하는 공개 기술, 빅데이터 새 시대를 열다 12 테마 활동 빅데이터 플랫폼 기술의 현황 빅데이터, 하둡 품고 병렬처리 가속화 16 테마 더하기 국내 빅데이터 산 학 연 관

°í¼®ÁÖ Ãâ·Â

1217 WebTrafMon II

슬라이드 1

08SW

Open Cloud Engine Open Source Big Data Platform Flamingo Project Open Cloud Engine Flamingo Project Leader 김병곤

歯I-3_무선통신기반차세대망-조동호.PDF


AGENDA 모바일 산업의 환경변화 모바일 클라우드 서비스의 등장 모바일 클라우드 서비스 융합사례

Web Application Hosting in the AWS Cloud Contents 개요 가용성과 확장성이 높은 웹 호스팅은 복잡하고 비용이 많이 드는 사업이 될 수 있습니다. 전통적인 웹 확장 아키텍처는 높은 수준의 안정성을 보장하기 위해 복잡한 솔루션으로 구현

제20회_해킹방지워크샵_(이재석)

2017 1

UDP Flooding Attack 공격과 방어

미래인터넷과 창조경제에 관한 제언 65 초록 과학기술과의 융합을 통해 창조경제를 이루는 근간인 인터넷은 현재 새로운 혁신적 인터넷, 곧 미래인터넷으로 진화하는 길목에 있다. 창조와 창업 정신으로 무장하여 미래인터넷 실현에 범국가적으로 매진하는 것이 창조경제 구현의 지름

歯이시홍).PDF

SLA QoS

PCServerMgmt7

À¯Çõ Ãâ·Â

컴퓨터과학과 교육목표 컴퓨터과학과의 컴퓨터과학 프로그램은 해당분야 에서 학문적 기술을 창의적으로 연구하고 산업적 기술을 주도적으로 개발하는 우수한 인력을 양성 함과 동시에 직업적 도덕적 책임의식을 갖는 IT인 육성을 교육목표로 한다. 1. 전공 기본 지식을 체계적으로

PowerPoint 프레젠테이션

The Self-Managing Database : Automatic Health Monitoring and Alerting

미래 서비스를 위한 스마트 클라우드 모델 수동적으로 웹에 접속을 해야만 요구에 맞는 서비스를 받을 수 있었다. 수동적인 아닌 사용자의 상황에 필요한 정보를 지능적으로 파악 하여 그에 맞는 적합한 서비스 를 제공할 수 새로운 연구 개발이 요구 되고 있다. 이를 위하여,

DB진흥원 BIG DATA 전문가로 가는 길 발표자료.pptx

Windows Embedded Compact 2013 [그림 1]은 Windows CE 로 알려진 Microsoft의 Windows Embedded Compact OS의 history를 보여주고 있다. [표 1] 은 각 Windows CE 버전들의 주요 특징들을 담고

J2EE & Web Services iSeminar

vm-웨어-01장


ecorp-프로젝트제안서작성실무(양식3)

, N-. N- DLNA(Digital Living Network Alliance).,. DLNA DLNA. DLNA,, UPnP, IPv4, HTTP DLNA. DLNA, DLNA [1]. DLNA DLNA DLNA., [2]. DLNA UPnP. DLNA DLNA.

Intro to Servlet, EJB, JSP, WS

Special Theme _ 모바일웹과 스마트폰 본 고에서는 모바일웹에서의 단말 API인 W3C DAP (Device API and Policy) 의 표준 개발 현황에 대해서 살펴보고 관 련하여 개발 중인 사례를 통하여 이해를 돕고자 한다. 2. 웹 애플리케이션과 네이

Cisco SDN 3.0 DDoS DDoS Cisco DDoS Real Demo 2008 Cisco Systems, Inc. All rights reserved. 2

Microsoft PowerPoint - 2.Catalyst Switch Intrastructure Protection_이충용_V1 0.ppt [호환 모드]

NoSQL

Portal_9iAS.ppt [읽기 전용]

그림 2. 5G 연구 단체 현황 앞으로 다가올 미래에는 고품질 멀 티미디어 서비스의 본격화, IoT 서 비스 확산 등의 변화로 인해 기하 급수적인 무선 데이터 트래픽 발생 및 스마트 기기가 폭발적으로 증대 할 것으로 예상된다 앞으로 다가올 미래에는 고품질 멀티미디어 서


歯Phone

소프트웨어개발방법론

スライド タイトルなし

15_3oracle

Voice Portal using Oracle 9i AS Wireless

DBPIA-NURIMEDIA

03.Agile.key

¨ìÃÊÁ¡2

목 차 Ⅰ. 정보기술의 환경 변화 Ⅱ. 차량-IT Convergence Ⅲ. 차량 센서 연계 서비스 Ⅳ. 차량-IT 융합 발전방향

PowerPoint 프레젠테이션

SW¹é¼Ł-³¯°³Æ÷ÇÔÇ¥Áö2013

RUCK2015_Gruter_public


네트워크 안정성을 지켜줄 최고의 기술과 성능 TrusGuard는 국내 최초의 통합보안솔루션으로서 지난 5년간 약 4천여 고객 사이트에 구축 운영되면서 기술의 안정성과 성능면에서 철저한 시장 검증을 거쳤습니다. 또한 TrusGuard는 단독 기능 또는 복합 기능 구동 시

±èÇö¿í Ãâ·Â

Global Bigdata 사용 현황 및 향후 활용 전망 빅데이터 미도입 이유 필요성 못느낌, 분석 가치 판단 불가 향후 투자를 집중할 분야는 보안 모니터링 분야 와 자동화 시스템 분야 빅데이터의 핵심 가치 - 트랜드 예측 과 제품 개선 도움 빅데이터 운영 애로 사항

Basic Template

<4D F736F F D205B4354BDC9C3FEB8AEC6F7C6AE5D3131C8A35FC5ACB6F3BFECB5E520C4C4C7BBC6C320B1E2BCFA20B5BFC7E2>

Microsoft Word - 조병호

Oracle Database 10g: Self-Managing Database DB TSC

인문사회과학기술융합학회

출원국 권 리 구 분 상 태 권리번호 KR 특허 등록

solution map_....

분산처리 프레임워크를 활용한대용량 영상 고속분석 시스템

Microsoft Word _Smallcap


슬라이드 1

<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DC0E5C8F1BCF8>

HTML5* Web Development to the next level HTML5 ~= HTML + CSS + JS API

RFID USN_K_100107

PowerPoint Presentation


빅데이터_DAY key

<A4B5A4C4A4B5A4BFA4B7A4B7A4D1A4A9A4B7A4C5A4A4A4D1A4A4A4BEA4D3A4B1A4B7A4C7A4BDA4D1A4A4A4A7A4C4A4B7A4D3A4BCA4C E706466>

Microsoft PowerPoint - 발표_090513_IBM세미나_IPTV_디디오넷_완료.ppt

05( ) CPLV12-04.hwp

istay

서현수

KDTÁ¾ÇÕ-2-07/03

PRO1_04E [읽기 전용]

Microsoft PowerPoint - thesis_rone.ppt

Intra_DW_Ch4.PDF

I What is Syrup Store? 1. Syrup Store 2. Syrup Store Component 3.

OpenStack In Telco: Toward 5G Mobile network

Week13

<353020B9DAC3E1BDC42DC5ACB6F3BFECB5E520C4C4C7BBC6C3BFA1BCADC0C720BAB8BEC820B0EDB7C1BBE7C7D7BFA120B0FCC7D120BFACB1B82E687770>

<BCBCBBF3C0BB20B9D9B2D9B4C220C5ACB6F3BFECB5E520C4C4C7BBC6C3C0C720B9CCB7A128BCF6C1A4295F687770>

<목 차 > 제 1장 일반사항 4 I.사업의 개요 4 1.사업명 4 2.사업의 목적 4 3.입찰 방식 4 4.입찰 참가 자격 4 5.사업 및 계약 기간 5 6.추진 일정 6 7.사업 범위 및 내용 6 II.사업시행 주요 요건 8 1.사업시행 조건 8 2.계약보증 9 3

Æí¶÷4-¼Ö·ç¼Çc03ÖÁ¾š

대회 조직 대 회 장 서정연(한국정보과학회 회장) 조직위원회 위 원 장 최종원(숙명여대), 홍충선(경희대), 황승구(ETRI) 위 원 강선무(NIA), 김 종(POSTECH), 김철호(ADD), 민경오(LG전자), 박진국(LG CNS), 서형수(알서포트), 엄영익(성균

06_ÀÌÀçÈÆ¿Ü0926

DBPIA-NURIMEDIA

Something that can be seen, touched or otherwise sensed

비식별화 기술 활용 안내서-최종수정.indd

Microsoft PowerPoint 자동설치시스템검증-V05-Baul.pptx

SchoolNet튜토리얼.PDF

Copyright 2012, Oracle and/or its affiliates. All rights reserved.,.,,,,,,,,,,,,.,...,. U.S. GOVERNMENT END USERS. Oracle programs, including any oper

Microsoft Word - zfs-storage-family_ko.doc

PowerPoint Presentation

Transcription:

하둡기반트래픽분석경험으로 보는 IoT 데이터수집및분석방법 2014. 5. 29 이영석 lee@cnu.ac.kr 충남대학교컴퓨터공학과데이터네트워크연구실 (http://networks.cnu.ac.kr ) 1

발표내용 하둡기반인터넷트래픽측정 IoT 데이터수집과분석 결론 2

인터넷트래픽측정분석연구 Challenges Scalability Storage for bulky data 4.6 TB/hr in 1GE packet monitoring High-performance computing Scale-up or scale-out? Fault-tolerant system Against HDD/system failures Extensibility Agile analysis for diverse traffic format CAIDA data Ark topology: 1.8 TB Telescope: 102 TB Packet headers: 18.8 TB Josh Polterock, CAIDA: A Data Sharing Case Study, 2012 3

수행한연구문제 Given various traffic sources: packet, NetFlow and BGP data Design a traffic collection and analysis platform Such that Scalable Computing/storage performance in a scale-out manner Fault-tolerant storage and computing Extensible Easy to handle user-defined queries for diverse traffic analysis Cost-effective Commodity hardware and open-source software 4

ACM SIGCOMM2012 5

분산컴퓨팅과분산저장소 Google MapReduce, 2004 1 PB sorting by Google 2008: 6 hours and 2 minutes on 4,000 computers 2011: 33 minutes on 8000 computers Apache Hadoop project MapReduce computing framework (Java) Distributed filesystem 6

Apache Hadoop Software Ingestion Pig Analysis Structured storage Computation Sqoop Storage Zookeeper Infrastructure 7

분산트래픽분석관련연구 Traffic analysis of DNS root server (RIPE, 2011.11) PacketPig (2012.03) - Big Data Security Analytics platform Sherpasurfing Open Source Cyber Security Solution, Hadoop World 2011 Firewall/IDS logs, netflow/packet Performing Network and Security Analytics with Hadoop, (Travis Dawson, Narus), Hadoop Summit 2012 Distributed Bro (IDS) 8

Hadoop 장단점 Pros Performance Good for batch processing Development Easy for developers: Java Map & Reduce Management Fault-tolerant system Cost Scale-out feature Apache open source Cons Performance Not good for real-time processing Data uploading Development Difficult for developers problem/solution in a parallel way/suitable for MapReduce? Management Version control Debugging/troubleshoo ting in a distributed environment 9

Hadoop 기반인터넷트래픽분석 Hadoop-based Traffic Measurement and Analysis Platform Administrator NetFlow v5 Packet Web Visualizer / Hive Slave Master Traffic Collector Pcap I/O Traffic Analyzer Traffic Analysis Mapper & Reducer Bin I/O NetFlow I/O HDFS Hadoop 1. Yeonhee Lee and Youngseok Lee, "Towards Scalable Internet Traffic Measurement and Analysis with Hadoop," ACM SIGCOMM Computer Communication Review (CCR), Jan. 2013 2. Yeonhee Lee and Youngseok Lee, Scalable NetFlow Analysis with Hadoop, FloCon2013, Jan. 2013 10

Traffic Analyzer Scan IP query Hive QL Query for Traffic Analysis Spoofed IP query Heavy User query User-defined query User Interface Packet NetFlow Traffic Collector & Loader IP analysis MR Pcap InputFormat MapReduce for Traffic Analysis TCP analysis MR HTTP analysis MR IO formats Binary Input/OutputFormat DDoS analysis MR NetFlow analysis MR Text Input/OutputFormat Web UI CLI monitor query HDFS Hadoop Data Source (Jpcap, HDFS) Data Processing (HDFS, MapReduce, Hive) User Interface (Hive, Web) Distributer 11

어려웠던문제들 1. Data handling issue in Hadoop Reading variable-sized pcaplib records in HDFS heuristic to identify packet boundary in HDFS 2. Distributed traffic analysis MapReduce algorithms IP/TCP/HTTP data analysis metrics 3. Performance tuning in a large-scale Hadoop testbed 12

실험 Testbed Type Nodes CPU Memory HardDisk Rack Small 10 2.93 GHz 8 core 16 GB 1TB 1 Rack Medium 20 2.93 GHz 8 core 16 GB 1TB 1 Rack Large 200 2.66 GHz 2 core 2 GB 500 GB 4 Racks Data and MapReduce jobs Type Dataset MapReduce Job Testbed Packet 1 ~ 5 TB from CNU campus N/W IP, TCP, Web (webpop, User Behavior, DDoS) Small, Medium, Large 13

Scalability Linear performance increase 120 min with 3, 32 min with 10 nodes for IP analysis Low TCP performance 7.3 Gbps for DDoS, 1.6 Gbps with 10 nodes 1.6 14

Scalability (200 nodes) 1 ~ 5 TB input data 8 Gbps ~ 15 Gbps for 5 TB at 200 nodes (400 cores) 46 ~ 79 min 15

Hadoop 기반네트워크분석프로 젝트현황 Frontend Ingestion Storage Computation&Analys is Backend packet /flow Packet analysis CoralReef Flow analysis Packets Flows p3 HDFS put hadoop-pcap Packet Analysis DNS Analysis Visualizatio n flow-tools HDFS put IDS/IPS Bro System monitor logs system firewall server IDS/IPS PacketPig HDFS put SHERPASURFING HDFS put Security Analysis Pig Security Analysis Backend analysis BGP RIB/UPDATE BGP data analysis Quagga bgptools BGP messages BGP routing tables BGPdoop HDFS put Routing Analysis 16

Hadoop기반인터넷분석은누가어디에쓰는가? ISP 통신업체의음성 / 비디오관리와분석, 보안 포탈 컨텐츠 / 서비스관리및분석 : mobile IMS 솔루션 보안 17

미래창조과학부, 2014 18

Internet of Things (IoT) 정의 Advanced connectivity of devices, systems and services that goes beyond the traditional machine-tomachine (M2M) and covers a variety of protocols, domains and applications 개인 스마트폰, 웨어러블디바이스 교통카드, 블랙박스 홈어플라이언스 가전제품 : TV, 냉장고, 에어컨, 오븐 홈모니터링 : 에너지 (Nest), 조명 (Phillips Hue), 보안 (CCTV) 사회기반시설 건물, 도로, 철도, 항만, 물류, 발전소, 공장 센서, 로그, 화상 / 동영상 http://en.wikipedia.org/wiki/file:internet_o f_things.jpg 19

20

21

개인운동기록데이터 Jawbone UP 22

m_steps 20000 15000 10000 m_steps 5000 0 0 20 40 60 80 100 120 23

개발자 API Jawbone UP https://jawbone.com/up /developer/ http://ericblue.com/projects/upapi/ JSON, OAuth Fitbit https://wiki.fitbit.com/di splay/api/fitbit+resourc e+access+api JSON, OAuth 24

25

26

Data Partnership 예 ) Jawbone UP + Withings 27

개인신체데이터 무선랜체중계 Fitbit Aria Withings Body Analyzer 28

소니라이프로그 29

Softbank Healthcare http://www.softbank.jp/mobile/service/healthcare/ 30

전력량측정데이터 WattsUp https://www.wattsupmeter s.com/secure/support.php Google PowerMeter http://www.google.com/po wermeter/about/ 한국웹, 미중일보다전력소모커 왜? http://www.zdnet.co.kr/ne ws/news_view.asp?artice_id =20120518180333 31

18:04:04 18:04:10 18:04:16 18:04:22 18:04:28 18:04:34 18:04:40 18:04:46 18:04:52 18:04:58 18:05:04 18:05:10 18:05:16 18:05:22 18:05:28 18:05:34 18:05:40 18:05:46 18:05:52 18:05:58 18:06:04 Watts 28.0 26.0 24.0 22.0 20.0 18.0 32

데이터 텍스트 바이너리 이미지 타입장비예제형태 웨어러블디바이스센서 컴퓨팅 / 스마트디바이스 카메라, 블랙박스, CCTV 건강정보 로그 사진 정형 정형 / 비정형 비정형 오디오스마트폰통화, 음악비정형 동영상 카메라, 블랙박스 사진동영상, 영화 비정형 33

IoT, Hadoop, Big Data http://hortonworks.com/hadoop-tutorial/how-to-analyze-machine-and-sensor-data/ Hortonworks example 34

데이터마이닝 35

결론 IoT? 디바이스의중요성 Smart phone, wearable devices 새로운서비스발굴을위한데이터수집및분석프레임워크가중요 데이터의중요성 ( 빅 ) 데이터마이닝을통한부가가치창출 DB, NoSQL, Hadoop, streaming 분석기술가능 36