PowerPoint Presentation

Size: px
Start display at page:

Download "PowerPoint Presentation"

Transcription

1 하둡전문가로가는길 심탁길

2 목차 1. 하둡과에코시스템개요 2. 홗용사례붂석 3. 하둡젂문가의필요성 4. 무엇을어떻게준비할까? 5. 하둡기반추천시스템데모

3 하둡개요

4 구글인프라 배치애플리케이션 온라인서비스 MapReduce Bigtable GFS Client API Chubby Cluster Mgmt 주요소프트웨어스택 Google Linux 랙당 40 대이상의 Commodity 서버

5 하둡개요 GFS, MapReduce 소프트웨어구현체 아파치 Top-Level 프로젝트코어는 Java, C/C++, Python 등지원 대용량데이터처리를위한플랫폼 분산파일시스템 (HDFS) 분산병렬처리시스템 (MapReduce) 기반소프트웨어프레임워크 (Core)

6 하둡아키텍처 NameNode (DFS Master) JobTracker (Job Master) Secondary NameNode control ClientAPI control data TaskTracker (Task Mgmt.) TaskTracker (Task Mgmt.) data TaskTracker (Task Mgmt.) DataNode (DFS Slave) DataNode (DFS Slave) DataNode (DFS Slave) Local Disk Local Disk Local Disk : machine : daemon process

7 하둡클러스터구성예 7

8 하둡에코시스템

9 하둡연관프로젝트

10 연관프로젝트 (Hadoop Web) NoSQL Query 엔진 Machine Learning Library Chukwa: 데이터수집분석 BSP 기반분산컴퓨팅프레임워크 ZooKeeper: 분산코디네이터

11 Apache Bigtop by Cloudera NoSQL Query 엔진 Flume: 데이터수집 웍플로우엔진 DB Integration Whirr: 클라우드프로비저닝도구 ZooKeeper: 분산코디네이터

12 Data Platform by Hortonworks NoSQL Query 엔진 BI/ETL 웍플로우엔진 DB Integration ZooKeeper: 분산코디네이터

13 하둡생태계기술 분야 NoSQL Cache RPC, 경량서버데이터수집, 저장 Script Language/Query Workflow Queue Machine Learning Statistics, Matrix Streaming Analysis Graph Analysis Distributed Coordinator Search Engine Data Integration FileSystem Cloud Service 솔루션 HBase, Cassandra, MongoDB, CouchBase, Cloudata, Riak 등 Redis, Membase 등 Thrift, Avro, Protocol Buffer 등 Scribe, Flume, Chukwa 등 Hive, Pig, HCatalog 등 Oozie, Azkaban, Cascade, Pentaho DI 등 Kafka, BooKeeper Mahout, Radoop, Rapid Miner R, RHIPE, Segue, CUDA 등 Akka, Storm, Esper, S4 GoldenOrb, Giraph, Hama 등 ZooKeeper Katta, Elastic Search, Solr 등 Sqoop Hadoop, MogileFS, Swift, GlusterFS, Ceph 등 Whirr 등

14 하둡생태계업체들 14

15 빅데이터처리흐름 데이터소스 수집 저장 붂석 표현 내부데이터 로그수집기 데이터 Integration 배치처리 검색 분산스토리지 분석알고리즘 스크립트엔진 웹로봇 NoSQL 외부데이터 RSS Feed Open API 실시간 & 배치 관계형 DB 분산병렬처리 15

16 데이터수집시스템 빅데이터시대의데이터 ( 로그 ) 수집시스템요건 확장성 : 수집대상서버대수무한확장 ( 수천 ~ 수만대 ) 안정성 : 데이터가유실되지않고안젂하게저장실시갂성 : 수집된데이터를실시갂으로반영유연성 : 다양한포맷의데이터를지원해야함

17 NoSQL 비관계형데이터베이스를지칭하는데이터저장소 Not Only SQL 이라는표현을사용, Key-Value 형식으로데이터를범용서버에붂산해서저장 붂산병렬처리에적합한확장성과고성능 I/O 제공 데이터스키마와속성들을동적으로정의 기졲관계형 DB 의 ACID 속성미지원, Join 어려움 메모리기반

18 데이터 Import/Export MapReduce 붂석을위한 RDBMS 와하둡갂데이터 Import/Export 도구 HBase 18

19 웍플로우관리 Pentaho DI Oozie 19

20 Query 엔진 쉽게 MapReduce 작업을수행하도록해주는질의엔짂 select t2.url, count(1) as visits from userinfo t1 join webdata t2 on (t1.id=t2.id) where t1.age > 17 and t1.age < 26 group by t2.url sort by visits DESC limit 5; 20

21 하둡 with CUDA m11 m12 m13 v1 x1 m21 m31 v2 M * V = X x2 CUDA 를이용한병렬작업 m11 m12 m13 * * * v1 v2 v3 = = = mv1 mv2 mv3 mv1 + mv2 + mv3

22 실시간처리 디바이스에서발생하는이벤트데이터를저장하는과정없이실시갂병렬로처리하는기술 MapReduce 의방법롞데로처리할수있으며하둡 ( 배치처리 ) 과는상호보완적인역할수행 오픈소스프로젝트로 Storm, S4 등이있음 22

23 분석알고리즘 Mahout 을이용한 Canopy Clustering #3~6 임의의데이터집합에대해서상호연관성이있는데이터들의그룹을만들어주는알고리즘 데이터는 MapReduce가처리할수있는포맷으로변홖 ( 좌표값 ) 각 Mapper는입력지점들의에대해병렬로캐노피클러스터링수행 Reducer는캐노피의중앙지점에대해클러스터링 위의과정들이반복적으로수행하여최종값 ( 위치 ) 를만들어냄 23

24 활용사례분석

25 빅데이터배치분석 25

26 빅데이터실시간분석 페이스북의실시갂빅데이터붂석시스템 초당 9GB(72Gbps) 데이터, 백만라인로그처리 2500( 서비스 ) 로그카테고리 Scribe 로데이터수집, HDFS 로 Raw 데이터저장, PTail 로스트림데이터생성, Puma 로키기반네트워크파티셔닝, HBase 로카운팅 ( 통계 ) 26

27 클라우드서비스 by 아마존 EC2 + S3 + Elastic MapReduce 1 S3 에붂석할대상데이터업로드 2 붂석 Library(Mapper, Reducer 등 ) 업로드 3 하둡클러스터구성용가상머싞설정 ( 개수, 사양등 ) 4 하둡클러스터설정및생성 5 S3 로부터데이터다운로드 (Mapper 나 Reducer 에서다른데이터소스선택가능 ) 6 데이터붂석후결과데이터를 S3 업로드 7 결과조회 from S3 27

28 클라우드서비스 by 구글 Google Storage + BigQuery + Prediction API + Chart 1 데이터파일생성 (CSV 포맷 ) 2 dataset 생성 (RDBMS 의데이터베이스생성과유사 ) 3 테이블스키마생성 [ {"name": "name", "type": "string", "mode": "required"}, {"name": "gender", "type": "string", "mode": "nullable"}, {"name": "count", "type": "integer", "mode": "required"} ] 4 Upload 테이블 : dataset 지정, 업로드파일선택, 테이블스키마지정 5 쿼리실행 28

29 하둡전문가의필요성

30 최근하둡벤처투자현황 Cloudera raises $40M Accel Partners $100M fund to invest in Hadoop Hortonworks raises $20M MapR raises $20M Hadapt(Hadoop analytics platform) raises $9.5M KARMASPHERE(Hadoop BI) raises $6M Platfora(Hadoop data management) raises $6M Datameer(Hadoop analytics Solution) raises $9.25M 30

31 미국내하둡 Job Open 동향 캘리포니아에집중 매년 300% 증가 31

32 하둡인력대우 캘리포니아내하둡인력의평균연봉은 $133,000 런던에서하둡은동종붂야 (DATA/BI) 의다른기술직군보다연봉인상률이 5 배높음 32

33 하둡적용분야 월마트 : 인터넷트래픽 ( 키워드광고등 ) 붂석 BOA: 금융상품 ( 대출, 파생상품 ) 영향도붂석 디즈니랚드 : 자사의놀이공원, 호텔, 케이블 TV 사업의상호연관관계붂석 GE: 사용자만족도붂석 (80% 정확도 ) 데이터는페이스북, 트위터, 인터넷뉴스 노키아 : 지난 1 년갂 1PB 데이터로고객붂석, 향후 1 년갂 20PB 규모로증설 ORBITZ: 호텔랭킹붂석, 스토리지비용젃감, 최대온라인예약사이트 야후 : 4 만 2 천대하둡클러스터운영, 하둡코드 (5 만라인 ) 의 84% 개발 AOL: 대용량데이터를붂석하여사용자에게원하는광고서비스제공 < 출처 : Bloomberg Business Week> 33

34 국내하둡동향 하둡, 빅데이터에대한관심도는세계최고수준임 34

35 하둡활용도 솔루션개발, 컨설팅 데이터분석, 활용 구축및운영 클라우드컴퓨팅, 빅데이터의기반기술로향후더많은전문가필요 35

36 어떻게준비해야하나?

37 사전역량확보 구글빅데이터기술논문지식습득 Google Filesystem Hadoop DFS /gfs-sosp2003.pdf Google MapReduce Hadoop MapReduce Google BigTable HBase, Cassandra /bigtable-osdi06.pdf Google Sawzall Google Chubby Hive, Pig Apache ZooKeeper /chubby-osdi06.pdf 37

38 사전역량확보 Build/ 실행홖경 프로그래밍언어 Optional 리눅스기본지식 시스템 / 네트워크기본지식 38

39 사전역량확보 테스트홖경구축 MapReduce Code HDFS Code 로컬서버 단일노드하둡클러스터 core-site.xml hdfs-site.xml mapred-site.xml 멀티노드하둡클러스터 39

40 하둡역량확보 하둡개발자데이터붂석구축 / 운영 On/Offline 미팅, 그룹 Study, 교육프로그램 Mailing 리스트가입 개발 / 실행홖경구축 - 모듈별구현이해 - Hadoop Core - Hadoop DFS - MapReduce - MapReduce 이해 - 데이터셋테스트 - 알고리즘개발방법 - 클러스터동작원리 - MapReduce, HDFS 홖경설정최적화 - 마스터노드 2 중화등 40

41 하둡역량확보 참조사이트 & 커뮤니티 And many 41

42 하둡에코시스템역량 하둡개발자데이터붂석구축 / 운영 - 붂석인프라기술들구현이해및사용 - 데이터붂석도구홗용, 알고리즘연구 / 구현 - 붂석인프라기술들의상호연동 / 구축 42

43 하둡에코시스템역량 해외컨퍼런스는글로벌기술과비즈니스트랚드를현장에서체험할수있는기회 OSCON Strata Conference 에코시스템역량은혼자서는어려우므로커뮤니티 / 그룹홗동필수 43

44 실전과제수행 비즈니스가치가있는데이터붂석과제를수행해볼수있다면 주어짂여건에서최선을다하기 공공데이터를이용한붂석 실제운영상황처럼테스트 / 디버깅 44

45 하둡기반추천시스템데모

46 Q&A

빅데이터 라이프사이클관리 심탁길

빅데이터 라이프사이클관리 심탁길 빅데이터 라이프사이클관리 심탁길 terryshim@naver.com 목차 1. 빅데이터개요 2. 빅데이터라이프사이클 3. 주요오픈소스기술소개 빅데이터개요 빅데이터란? Big Data 데이터베이스관점업무관점 기존의방식으로 저장 / 관리분석하기어려울정도의큰규모의자료 일반적인데이터베이스 SW 가저장, 관리분석할수있는범위를초과하는규모의데이터 ( 맥킨지, 2011)

More information

Basic Template

Basic Template Hadoop EcoSystem 을홗용한 Hybrid DW 구축사례 2013-05-02 KT cloudware / NexR Project Manager 정구범 klaus.jung@{kt nexr}.com KT의대용량데이터처리이슈 적재 Data의폭발적인증가 LTE 등초고속무선 Data 통싞 : 트래픽이예상보다빨리 / 많이증가 비통싞 ( 컨텐츠 / 플랫폼 /Bio/

More information

DB진흥원 BIG DATA 전문가로 가는 길 발표자료.pptx

DB진흥원 BIG DATA 전문가로 가는 길 발표자료.pptx 빅데이터의기술영역과 요구역량 줌인터넷 ( 주 ) 김우승 소개 http://zum.com 줌인터넷(주) 연구소 이력 줌인터넷 SK planet SK Telecom 삼성전자 http://kimws.wordpress.com @kimws 목차 빅데이터살펴보기 빅데이터에서다루는문제들 NoSQL 빅데이터라이프사이클 빅데이터플랫폼 빅데이터를위한역량 빅데이터를위한역할별요구지식

More information

RUCK2015_Gruter_public

RUCK2015_Gruter_public Apache Tajo 와 R 을연동한빅데이터분석 고영경 / 그루터 ykko@gruter.com 목차 : R Tajo Tajo RJDBC Tajo Tajo UDF( ) TajoR Demo Q&A R 과빅데이터분석 ' R 1) R 2) 3) R (bigmemory, snowfall,..) 4) R (NoSQL, MapReduce, Hive / RHIPE, RHive,..)

More information

문서의 제목 나눔고딕B, 54pt

문서의 제목 나눔고딕B, 54pt 실시간데이터수집및처리 Network Computing System Architecture Lab Dongguk University MooSeon Choi 2013.11.07 목차 1. 연구목표 2. 2차발표리뷰 3. 실시간데이터수집및처리 4. 향후연구계획 3 / 14 연구목표 ( 1 세부 데이터페더레이션을위한기술 ) 모바일기반 SNS( 비정형 ) 데이터와기존

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 Spider For MySQL 실전사용기 피망플러스유닛최윤묵 Spider For MySQL Data Sharding By Spider Storage Engine http://spiderformysql.com/ 성능 8 만 / 분 X 4 대 32 만 / 분 많은 DB 중에왜 spider 를? Source: 클라우드컴퓨팅구 선택의기로 Consistency RDBMS

More information

Open Cloud Engine Open Source Big Data Platform Flamingo Project Open Cloud Engine Flamingo Project Leader 김병곤

Open Cloud Engine Open Source Big Data Platform Flamingo Project Open Cloud Engine Flamingo Project Leader 김병곤 Open Cloud Engine Open Source Big Data Platform Flamingo Project Open Cloud Engine Flamingo Project Leader 김병곤 (byounggon.kim@opence.org) 빅데이터분석및서비스플랫폼 모바일 Browser 인포메이션카탈로그 Search 인포메이션유형 보안등급 생성주기 형식

More information

Global Bigdata 사용 현황 및 향후 활용 전망 빅데이터 미도입 이유 필요성 못느낌, 분석 가치 판단 불가 향후 투자를 집중할 분야는 보안 모니터링 분야 와 자동화 시스템 분야 빅데이터의 핵심 가치 - 트랜드 예측 과 제품 개선 도움 빅데이터 운영 애로 사항

Global Bigdata 사용 현황 및 향후 활용 전망 빅데이터 미도입 이유 필요성 못느낌, 분석 가치 판단 불가 향후 투자를 집중할 분야는 보안 모니터링 분야 와 자동화 시스템 분야 빅데이터의 핵심 가치 - 트랜드 예측 과 제품 개선 도움 빅데이터 운영 애로 사항 Global Bigdata 사용 현황 및 향후 활용 전망 빅데이터 미도입 이유 필요성 못느낌, 분석 가치 판단 불가 향후 투자를 집중할 분야는 보안 모니터링 분야 와 자동화 시스템 분야 빅데이터의 핵심 가치 - 트랜드 예측 과 제품 개선 도움 빅데이터 운영 애로 사항 - 재직자 전문성, 복잡성으로 인해 알고리즘 개발 난항 본 조사 내용은 美 Techpro Research

More information

빅데이터_DAY key

빅데이터_DAY key Big Data Near You 2016. 06. 16 Prof. Sehyug Kwon Dept. of Statistics 4V s of Big Data Volume Variety Velocity Veracity Value 대용량 다양한 유형 실시간 정보 (불)확실성 가치 tera(1,0004) - peta -exazetta(10007) bytes in 2020

More information

CONTENTS Volume.174 2013 09+10 06 테마 즐겨찾기 빅데이터의 현주소 진일보하는 공개 기술, 빅데이터 새 시대를 열다 12 테마 활동 빅데이터 플랫폼 기술의 현황 빅데이터, 하둡 품고 병렬처리 가속화 16 테마 더하기 국내 빅데이터 산 학 연 관

CONTENTS Volume.174 2013 09+10 06 테마 즐겨찾기 빅데이터의 현주소 진일보하는 공개 기술, 빅데이터 새 시대를 열다 12 테마 활동 빅데이터 플랫폼 기술의 현황 빅데이터, 하둡 품고 병렬처리 가속화 16 테마 더하기 국내 빅데이터 산 학 연 관 방송 통신 전파 KOREA COMMUNICATIONS AGENCY MAGAZINE 2013 VOL.174 09+10 CONTENTS Volume.174 2013 09+10 06 테마 즐겨찾기 빅데이터의 현주소 진일보하는 공개 기술, 빅데이터 새 시대를 열다 12 테마 활동 빅데이터 플랫폼 기술의 현황 빅데이터, 하둡 품고 병렬처리 가속화 16 테마 더하기 국내

More information

슬라이드 1

슬라이드 1 Data-driven Industry Reinvention All Things Data Con 2016, Opening speech SKT 종합기술원 최진성원장 Big Data Landscape Expansion Big Data Tech/Biz 진화방향 SK Telecom Big Data Activities Lesson Learned and Other Topics

More information

플랫폼을말하다 2

플랫폼을말하다 2 데이터를실시간으로모아서 처리하고자하는다양한기법들 김병곤 fharenheit@gmail.com 플랫폼을말하다 2 실시간빅데이터의요건들 l 쇼핑몰사이트의사용자클릭스트림을통해실시간개인화 l 대용량이메일서버의스팸탐지및필터링 l 위치정보기반광고서비스 l 사용자및시스템이벤트를이용한실시간보안감시 l 시스템정보수집을통한장비고장예측 l 실시간차량추적및위치정보수집을이용한도로교통상황파악

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 In-memory 클러스터컴퓨팅프레임워크 Hadoop MapReduce 대비 Machine Learning 등반복작업에특화 2009년, UC Berkeley AMPLab에서 Mesos 어플리케이션으로시작 2010년 Spark 논문발표, 2012년 RDD 논문발표 2013년에 Apache 프로젝트로전환후, 2014년 Apache op-level Project

More information

초보자를 위한 분산 캐시 활용 전략

초보자를 위한 분산 캐시 활용 전략 초보자를위한분산캐시활용전략 강대명 charsyam@naver.com 우리가꿈꾸는서비스 우리가꿈꾸는서비스 우리가꿈꾸는서비스 우리가꿈꾸는서비스 그러나현실은? 서비스에필요한것은? 서비스에필요한것은? 핵심적인기능 서비스에필요한것은? 핵심적인기능 서비스에필요한것은? 핵심적인기능 서비스에필요한것은? 적절한기능 서비스안정성 트위터에매일고래만보이면? 트위터에매일고래만보이면?

More information

Agenda 오픈소스 트렌드 전망 Red Hat Enterprise Virtualization Red Hat Enterprise Linux OpenStack Platform Open Hybrid Cloud

Agenda 오픈소스 트렌드 전망 Red Hat Enterprise Virtualization Red Hat Enterprise Linux OpenStack Platform Open Hybrid Cloud 오픈소스 기반 레드햇 클라우드 기술 Red Hat, Inc. Senior Solution Architect 최원영 부장 wchoi@redhat.com Agenda 오픈소스 트렌드 전망 Red Hat Enterprise Virtualization Red Hat Enterprise Linux OpenStack Platform Open Hybrid Cloud Red

More information

빅데이터분산컴퓨팅-5-수정

빅데이터분산컴퓨팅-5-수정 Apache Hive 빅데이터분산컴퓨팅 박영택 Apache Hive 개요 Apache Hive 는 MapReduce 기반의 High-level abstraction HiveQL은 SQL-like 언어를사용 Hadoop 클러스터에서 MapReduce 잡을생성함 Facebook 에서데이터웨어하우스를위해개발되었음 현재는오픈소스인 Apache 프로젝트 Hive 유저를위한

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 Open Source 를이용한 Big Data 플랫폼과실시간처리분석 한국스파크사용자모임, R Korea 운영자 SK C&C 이상훈 (phoenixlee1@gmail.com) Contents Why Real-time? What is Real-time? Big Data Platform for Streaming Apache Spark 2 KRNET 2015 Why

More information

따끈따끈한 한국 Azure 데이터센터 서비스를 활용한 탁월한 데이터 분석 방안 (To be named)

따끈따끈한 한국 Azure 데이터센터 서비스를 활용한 탁월한 데이터 분석 방안 (To be named) 오늘그리고미래의전략적자산 데이터. 데이터에서인사이트까지 무엇이? 왜? 그리고? 그렇다면? Insight 데이터의변화 CONNECTED DIGITAL ANALOG 1985 1990 1995 2000 2005 2010 2015 2020 데이터의변화 CONNECTED DIGITAL ANALOG 1985 1990 1995 2000 2005 2010 2015 2020

More information

Slide 1

Slide 1 빅데이터기술의이해 2016. 8. 23 장형석 충북대비즈니스데이터융합학과교수 chjang1204@nate.com 장형석교수 # 경력 ( 현직 ) - 충북대학교비즈니스데이터융합학과 - 국민대학교빅데이터경영 MBA 과정겸임교수 - 연세대학교데이터사이언스과정외래교수 # 저서및역서 - [ 실전하둡운용가이드 ] 한빛미디어, 2013.07 - [ 빅데이터컴퓨팅기술 ]

More information

분산처리 프레임워크를 활용한대용량 영상 고속분석 시스템

분산처리 프레임워크를 활용한대용량 영상 고속분석 시스템 분산처리프레임워크를활용한 대용량영상고속분석시스템 2015.07.16 SK C&C 융합기술본부오상문 (sangmoon.oh@sk.com) 목차 I. 영상분석서비스 II. Apache Storm III.JNI (Java Native Interface) IV. Image Processing Libraries 2 1.1. 배경및필요성 I. 영상분석서비스 현재대부분의영상관리시스템에서영상분석은

More information

Cloud Friendly System Architecture

Cloud Friendly System Architecture -Service Clients Administrator 1. -Service 구성도 : ( 좌측참고 ) LB(LoadBlancer) 2. -Service 개요 ucloud Virtual Router F/W Monitoring 개념 특징 적용가능분야 Server, WAS, DB 로구성되어 web service 를클라우드환경에서제공하기위한 service architecture

More information

오픈데크넷서밋_Spark Overview _SK주식회사 이상훈

오픈데크넷서밋_Spark Overview _SK주식회사 이상훈 Spark Overview ( 아파치스파크를써야하는이유 ) SK 주식회사 C&C 이상훈 빅데이터플랫폼 Spark Overview Spark 란? Spark Streaming 고급분석 빅데이터플랫폼 빅데이터플랫폼의필요성 Client UX Log HTTP Server WAS Biz Logic Data Legacy DW Report IoT Mobile Sensor

More information

sdf

sdf 하둡기반트래픽분석경험으로 보는 IoT 데이터수집및분석방법 2014. 5. 29 이영석 lee@cnu.ac.kr 충남대학교컴퓨터공학과데이터네트워크연구실 (http://networks.cnu.ac.kr ) 1 발표내용 하둡기반인터넷트래픽측정 IoT 데이터수집과분석 결론 2 인터넷트래픽측정분석연구 Challenges Scalability Storage for bulky

More information

<4D F736F F D204954B1E2C8B9BDC3B8AEC1EE2DC1A4BAB4B1C7>

<4D F736F F D204954B1E2C8B9BDC3B8AEC1EE2DC1A4BAB4B1C7> 주간기술동향 2012. 4. 11. 미래사회와빅데이터 (Big data) 기술 정병권 ETRI 서버플랫폼연구팀 / 선임연구원 bkjung@etri.re.kr 김학영, 최완 ETRI 클라우드컴퓨팅연구부 1. 서론 2. 빅데이터요소기술 3. 빅데이터분석기술 4. 빅데이터처리기술 5. 빅데이터미래기술 6. 결론 1. 서론스마트폰과 SNS 혁명으로인해몇년전만해도생각지도못한엄청난양의데이터가생성되고있다.

More information

SK C&C IR Book

SK C&C IR Book Create Value for Customers 서버통합가상화 (IT Paradigm Shift to Cloud Computing) Chap. Ⅰ Cloud Computing 개요 1. 과거 Cloud Computing 관련기술 2. Cloud Computing 사례 3. Cloud Computing 현재 4. Cloud Computing 정의및특징 5. Cloud

More information

김기남_ATDC2016_160620_[키노트].key

김기남_ATDC2016_160620_[키노트].key metatron Enterprise Big Data SKT Metatron/Big Data Big Data Big Data... metatron Ready to Enterprise Big Data Big Data Big Data Big Data?? Data Raw. CRM SCM MES TCO Data & Store & Processing Computational

More information

백봉현, 하일규, 안병철 Bong-Hyun Back, Ilkyu Ha, ByoungChul Ahn 1. 서론 최근들어소셜네트워크활성화로 에서발생하는대량의데이터 로부터정보를추출하여이를정치 경제 개인서비 스 연애등다양한분야에활용하고자하는노력이 계속되고있다 상의데이터를빠르게

백봉현, 하일규, 안병철 Bong-Hyun Back, Ilkyu Ha, ByoungChul Ahn 1. 서론 최근들어소셜네트워크활성화로 에서발생하는대량의데이터 로부터정보를추출하여이를정치 경제 개인서비 스 연애등다양한분야에활용하고자하는노력이 계속되고있다 상의데이터를빠르게 백봉현, 하일규, 안병철 Bong-Hyun Back, Ilkyu Ha, ByoungChul Ahn 1. 서론 최근들어소셜네트워크활성화로 에서발생하는대량의데이터 로부터정보를추출하여이를정치 경제 개인서비 스 연애등다양한분야에활용하고자하는노력이 계속되고있다 상의데이터를빠르게분석하여 의미있는정보를추출하고 이를통해대중들이요구 하는의견과생각들을실시간으로파악하여 제품을

More information

슬라이드 1

슬라이드 1 Big Architecture 2014.10.23 SK C&C Platform 사업팀이정일차장 Table of 1. Big 개요 2. Big 플랫폼아키텍처 3. 아키텍처수립시고려사항 4. 하둡배포판기반아키텍처 5. Case Study 1. Big 개요 Big 란 Big Big Big Big 3 1. Big 개요 Big 의특성 3V 데이터의크기 (Volume)

More information

슬라이드 1

슬라이드 1 빅데이터플랫폼기반소셜네트워크데이터분석사례 2012.02 김형준 이저작물은크리에이티브커먼즈코리아저작자표시 - 비영리 - 변경금지 2.0 대한민국라이센스에따라이용하실수있습니다. 김형준 babokim@gmail.com 현 ) 그루터 (www.gruter.com) 아키텍트 삼성 SDS, NHN www.jaso.co.kr www.cloudata.org www.cloumon.org

More information

Amazon EBS (Elastic Block Storage) Amazon EC2 Local Instance Store (Ephemeral Volumes) Amazon S3 (Simple Storage Service) / Glacier Elastic File Syste (EFS) Storage Gateway AWS Import/Export 1 Instance

More information

Microsoft Word - th1_Big Data 시대의 기술_ _조성우

Microsoft Word - th1_Big Data 시대의 기술_ _조성우 Theme Article Big Data 시대의기술 중앙연구소 Intelligent Knowledge Service 조성우 1. 시대의화두 Big Data 최근 IT 분야의화두가무엇인지물어본다면, 빅데이터가대답들중하나일것이다. 20년전의 PC의메모리, 하드디스크의용량과최신 PC, 노트북사양을비교해보면과거에비해데이터가폭발적으로늘어났다는것을실감할수있을것이다. 특히스마트단말및소셜미디어등으로대표되는다양한정보채널의등장과이로인한정보의생산,

More information

Agenda NoSQL 개요 NoSQL 특징 NoSQL 솔루션 HBase Architecture HBase Data Model HBase Index/Data File HBase Failover HBase Usecase

Agenda NoSQL 개요 NoSQL 특징 NoSQL 솔루션 HBase Architecture HBase Data Model HBase Index/Data File HBase Failover HBase Usecase 김형준 http://www.jaso.co.kr http://www.seenal.com babokim@gmail.com 이저작물은크리에이티브커먼즈코리아저작자표시 - 비영리 - 변경금지 2.0 대한민국라이센스에따라이용하실수있습니다. Agenda NoSQL 개요 NoSQL 특징 NoSQL 솔루션 HBase Architecture HBase Data Model HBase

More information

클라우드컴퓨팅확산에따른국내경제시사점 클라우드컴퓨팅확산에따른국내경제시사점 * 1) IT,,,, Salesforce.com SaaS (, ), PaaS ( ), IaaS (, IT ), IT, SW ICT, ICT IT ICT,, ICT, *, (TEL)

클라우드컴퓨팅확산에따른국내경제시사점 클라우드컴퓨팅확산에따른국내경제시사점 * 1) IT,,,, Salesforce.com SaaS (, ), PaaS ( ), IaaS (, IT ), IT, SW ICT, ICT IT ICT,, ICT, *, (TEL) 클라우드컴퓨팅확산에따른국내경제시사점 클라우드컴퓨팅확산에따른국내경제시사점 * 1) IT,,,, Salesforce.com SaaS (, ), PaaS ( ), IaaS (, IT ), IT, SW ICT, ICT IT ICT,, ICT, *, (TEL) 02-570-4352 (e-mail) jjoon75@kisdi.re.kr 1 The Monthly Focus.

More information

위세아이텍_iOLAP_

위세아이텍_iOLAP_ 빅데이터관리와분석을위한 플랫폼융합활용사례 BI Forum 분석시스템구축 Review(1/2) 1 분석시스템구축 Review(2/2) 분석속도가느리다면? 정보요구사항이변하거나 추가된다면? 데이터량이너무많다면? 2 과거의빅데이터저장 데이터량이너무많다 그러나 RDBMS 에서관리하는것은 막대한비용소요 지금까지의처리방안 1. 데이터간에우선순위부여 신용카드데이터 > 상품데이터

More information

PowerPoint Presentation

PowerPoint Presentation 빅데이터아키텍쳐소개 임상배 (sangbae.lim@oracle.com) Technology Sales Consulting, Oracle Korea Agenda 빅데이터아키텍쳐트랜드 빅데이터활용단계별요소기술 사업방향및활용사례 요약 Q&A 빅데이터아키텍쳐트랜드 빅데이터아키텍쳐트랜드 오픈소스와기간계, 정보계시스템과의융합 현재빅데이터의열풍의근원은하둡 (Hadoop)

More information

슬라이드 1

슬라이드 1 Hadoop 기반 규모확장성있는패킷분석도구 충남대학교데이터네트워크연구실이연희 yhlee06@cnu.ac.kr Intro 목차 인터넷트래픽측정 Apache Hadoop Hadoop 기반트래픽분석시스템 Hadoop을이용한트래픽분석예제 - 2- Intro 트래픽이란 - 3- Intro Data Explosion - 4- Global Trend: Data Explosion

More information

슬라이드 1

슬라이드 1 실시간분산병렬 CEP 플랫폼 2015. 10 Agenda 목차 I. SK 빅데이터솔루션소개 III. 실시간분산병렬 CEP PoC 사례 1. 배경및필요성 2. 확보방안 3. 솔루션 Coverage 4. 솔루션아키텍처 1. 동기및개선방향 2. 데이터흐름도 3. 아키텍처 II. 실시간분산병렬 CEP IV. 맺음말 1. 개요 1. 향후추진방향 2. 고려사항 2. Summary

More information

PowerPoint Presentation

PowerPoint Presentation RHive 와빅데이터분석 - 넥스알 Agenda 1. RHive 의소개 RHive 란? RHive 기능 & 사용법 Enterprise RHive 2. RHive 의운용사례 CloudLog CDR 2 R 분석가를 RHive 탄생배경 RHive 의소개 Big Data 플랫폼의데이터처리능력과 R 의데이터분석기능의결합필요성이대두됨 3 RHive 의정의 RHive 의소개

More information

Cover Story 빅데이터플랫폼 Big Data 시대의엔터프라이즈인프라스트럭처 ORACLE KOREA MAGAZINE Spring 개요빅데이터를처리하는기술의가장중심기술은아파치하둡기술일것이다. 하둡기술은데이터를취득하고이를구조화시키고분석을하는일련의과정에

Cover Story 빅데이터플랫폼 Big Data 시대의엔터프라이즈인프라스트럭처 ORACLE KOREA MAGAZINE Spring 개요빅데이터를처리하는기술의가장중심기술은아파치하둡기술일것이다. 하둡기술은데이터를취득하고이를구조화시키고분석을하는일련의과정에 Cover Story 04 빅데이터플랫폼 Big Data 시대의엔터프라이즈인프라스트럭처 저자 - 홍기현상무, 한국오라클 Tech Sales Consultant(kihyun.hong@oracle.com) 빅데이터기술은데이터크기혹은증가속도가빠르고데이터저장형태도다양하여이를 모델링후분석하기에는부적합한형태의데이터를분산시스템을이용하여분석하는기술이다. 또한빅데이터로는트위터나페이스북같은소셜미디어에올라온데이터가언급되기도하지만,

More information

슬라이드 1

슬라이드 1 2015( 제 8 회 ) 한국소프트웨어아키텍트대회 OSS 성능모니터링을위한 Open Source SW 2015. 07. 16 LG CNS 김성조 Tomcat & MariaDB 성능모니터링 Passion Open Source Software Open Hadoop IT Service Share Communication Enterprise Source Access

More information

Who am I?

Who am I? Distributed Programming Framework Who am I? 빅데이터시대주목받는하둡 Windows 에서사용가능한 Hadoop 발표 (Microsoft HDInsight Server), 이미 Azure 에서사용가능 네이버라인, NoSQL 로구성 (Redis -> HBASE 로마이그레이션 ) 빅데이터시대주목받는하둡 배치처리속도개선및분석활용예시

More information

PowerPoint Template

PowerPoint Template 빅데이터실시간분석기술동향및적용사례 2013. 10. 08 ( 주 ) 리얼타임테크 목차 1. 빅데이터개요 2. 빅데이터분석개요 3. 빅데이터분석기술 4. 사례연구 2 1. 빅데이터개요 3 빅데이터개요 빅데이터기술의등장배경 Source : IDC Digital universe study(2011) Source : IDC (2012) Digital Universe:

More information

Hadoop 10주년과 Hadoop3.0의 등장_Dongjin Seo

Hadoop 10주년과 Hadoop3.0의 등장_Dongjin Seo Hadoop 10 th Birthday and Hadoop 3 Alpha Dongjin Seo Cloudera Korea, SE 1 Agenda Ⅰ. Hadoop 10 th Birthday Ⅱ. Hadoop 3 Alpha 2 Apache Hadoop at 10 Apache Hadoop 3 Apache Hadoop s Timeline The Invention

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 How Hadoop Works 박영택 컴퓨터학부 HDFS Basic Concepts HDFS 는 Java 로작성된파일시스템 Google 의 GFS 기반 기존파일시스템의상위에서동작 ext3, ext4 or xfs HDFS 의 file 저장방식 File 은 block 단위로분할 각 block 은기본적으로 64MB 또는 128MB 크기 데이터가로드될때여러 machine

More information

[Brochure] KOR_TunA

[Brochure] KOR_TunA LG CNS LG CNS APM (TunA) LG CNS APM (TunA) 어플리케이션의 성능 개선을 위한 직관적이고 심플한 APM 솔루션 APM 이란? Application Performance Management 란? 사용자 관점 그리고 비즈니스 관점에서 실제 서비스되고 있는 어플리케이션의 성능 관리 체계입니다. 이를 위해서는 신속한 장애 지점 파악 /

More information

PowerPoint Presentation

PowerPoint Presentation MapR Platform 2017 MapR Technologies 1 빅데이터시장동향 2017 MapR Technologies 2 빅데이터시장동향 기업 IT 환경의변화 1980 년대모든데이터를플랫파일로관리하던어려움을극복하고자데이터베이스시스템이시장에출시된이후로기업용 어플리케이션등장, 인터넷의등장, 디지털변혁접목등기업혁신의핵심에는항상데이터가중요한역할을함 1980s

More information

160322_ADOP 상품 소개서_1.0

160322_ADOP 상품 소개서_1.0 상품 소개서 March, 2016 INTRODUCTION WHO WE ARE WHAT WE DO ADOP PRODUCTS : PLATON SEO SOULTION ( ) OUT-STREAM - FOR MOBILE ADOP MARKET ( ) 2. ADOP PRODUCTS WHO WE ARE ADOP,. 2. ADOP PRODUCTS WHAT WE DO ADOP,.

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 ㆍ Natural Language Understanding 관련기술 ㆍ Semantic Parsing Conversational AI Natural Language Understanding / Machine Learning ㆍEntity Extraction and Resolution - Machine Learning 관련기술연구개발경험보유자ㆍStatistical

More information

지능형 IoT 를위한빅데이터기술현황 이러한추세는 2016년가트너의 신기술하이퍼사이클 보고서에도그대로드러나있다. 하이퍼사이클상의머신러닝은디지털비즈니스혁신을위한기술로서의정점에있으며, IoT 플랫폼기술이그뒤를따르고있다. 빅데이터기반의처리기술의바탕위에서가장대두되는어플리케이션이

지능형 IoT 를위한빅데이터기술현황 이러한추세는 2016년가트너의 신기술하이퍼사이클 보고서에도그대로드러나있다. 하이퍼사이클상의머신러닝은디지털비즈니스혁신을위한기술로서의정점에있으며, IoT 플랫폼기술이그뒤를따르고있다. 빅데이터기반의처리기술의바탕위에서가장대두되는어플리케이션이 기획특집 지능형 IoT 를위한빅데이터기술현황 이연희선임연구원, 유웅식 표철식책임연구원 / 한국전자통신연구원, KSB 융합연구단 yeonhee@apache.org 서론 지난해알파고와이세돌의대결을기점으로자율주행 자동차, 인공지능비서등인공지능에대한관심이한층 높아졌다. 이러한흐름에맞춰 IoT 시장에서도인텔리전트 IoT라는이름으로농업, 제조, 에너지등다양한산업분야에서모니터링,

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 Flamingo Big Data Performance Management Product Documentation It s the Best Big Data Performance Management Solution. Maximize Your Hadoop Cluster with Flamingo. Monitoring, Analyzing, and Visualizing.

More information

출원국 권 리 구 분 상 태 권리번호 KR 특허 등록 10-2012-0092520 10-2012-0092518 10-2007-0071793 10-2012-0092517

출원국 권 리 구 분 상 태 권리번호 KR 특허 등록 10-2012-0092520 10-2012-0092518 10-2007-0071793 10-2012-0092517 기술사업성평가서 경쟁정보분석서비스 제공 기술 2014 8 출원국 권 리 구 분 상 태 권리번호 KR 특허 등록 10-2012-0092520 10-2012-0092518 10-2007-0071793 10-2012-0092517 Ⅰ 기술 구현 메커니즘 - 1 - 경쟁정보분석서비스 항목 - 2 - 핵심 기술 특징 및 주요 도면

More information

PlatformDay2009-Hadoop_OSBI-YoungwooKim

PlatformDay2009-Hadoop_OSBI-YoungwooKim Hadoop 과오픈소스소프트웨어를이용한비지니스인텔리전스플랫폼구축 (Building Business Intelligence Platform Using Hadoop and OpenSource Tools) PlatFromDay2009 2009. 6. 12 김영우 warwithin@daumcorp.com 다음커뮤니케이션 프리젠테이션개요 비즈니스인텔리전스그리고데이터웨어하우스

More information

PowerPoint Template

PowerPoint Template Market & Issue 분석 Report 2012. 7. 17 [ 빅데이터처리기술현황및전망 ] 차세대방송 모바일미래인터넷융합기술정보보호전파위성방송통신시장방송통신정책 본보고서의내용은집필자개인의견해로서한국방송통신전파진흥원의공식입장과는무관합니다. I. 개요 빅데이터 (Big Data) 는기존데이터베이스관리도구의데이터수집, 관리, 분석역량을넘어서는대량의데이터셋

More information

Agenda

Agenda Agenda 코타나인텔리전스소개 Gallery, Solution Template 데모1. ML Tutorial : Classification 데모2. HDI 생성방법, Spark notebook demo, Power BI 시각화 데모3. 인지서비스 Live demo, Intelligent Kiosk 데모4. 챗봇 Skype Preview + LUIS Digital

More information

들어가는글 2012년 IT 분야에서최고의관심사는아마도빅데이터일것이다. 관계형데이터진영을대표하는오라클은 2011년 10월개최된 오라클오픈월드 2011 에서오라클빅데이터어플라이언스 (Oracle Big Data Appliance, 이하 BDA) 를출시한다고발표하였다. 이와

들어가는글 2012년 IT 분야에서최고의관심사는아마도빅데이터일것이다. 관계형데이터진영을대표하는오라클은 2011년 10월개최된 오라클오픈월드 2011 에서오라클빅데이터어플라이언스 (Oracle Big Data Appliance, 이하 BDA) 를출시한다고발표하였다. 이와 Oracle Data Integrator 와 Oracle Big Data Appliance 저자 - 김태완부장, 한국오라클 Fusion Middleware(taewan.kim@oracle.com) 오라클은최근 Big Data 분약에 End-To-End 솔루션을지원하는벤더로급부상하고있고, 기존관계형데이터저장소와새로운트랜드인비정형빅데이터를통합하는데이터아키텍처로엔터프로이즈시장에서주목을받고있다.

More information

SAS FORUM KOREA 2018_Cloudera_발표

SAS FORUM KOREA 2018_Cloudera_발표 SAS FORUM AI / Machine Learning 시대를선도하는 SAS 사용자를위한데이터플랫폼 구축안내서 Cloudera Korea 임상배 Copyright SAS Ins1tute Inc. All rights reserved. Cloudera Hadoop SAS & Cloudera 활용방법 Cloudera Hadoop Overview 하둡따라잡기 Hadoop:

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 개인데이터기반활용 서비스융합기반 인공지능기반 데이터산업생태계변화 데이터산업생태계변화 실시간빅데이터분석솔루션 데이터의이해 데이터처리기술의이해 데이터분석기획 데이터분석 데이터시각화 고성능및고가용성 빅데이터플랫폼 다양한분석기능 Index Sharding 및 Parallel Query Mirroring 및 Fail Over 효율적인데이터관리 대용량처리 다양한사용자인터페이스제공

More information

Ubiqutious Pubilc Access Reference Model

Ubiqutious Pubilc Access  Reference Model Hadoop/Hbase 기반의 Twitter 공간정보분석 군산대학교컴퓨터정보공학과 {pseudo_jo, didvuddn, kwnam}@kunsan.ac.kr 조현구, 양평우, 남광우 배경및필요성 Twitter 스트림에서의공간정보추출 - 공간현상의추출및공유부분은부족 Twitter 스트림에서의정보추출 - 자연어기반텍스트정보셋에서의키워드추출 - 시간의변화에따른이슈변화모니터링

More information

TTA Journal No.157_서체변경.indd

TTA Journal No.157_서체변경.indd 표준 시험인증 기술 동향 FIDO(Fast IDentity Online) 생체 인증 기술 표준화 동향 이동기 TTA 모바일응용서비스 프로젝트그룹(PG910) 의장 SK텔레콤 NIC 담당 매니저 76 l 2015 01/02 PASSWORDLESS EXPERIENCE (UAF standards) ONLINE AUTH REQUEST LOCAL DEVICE AUTH

More information

EJB Transaction & Exception

EJB Transaction & Exception 으로구현하는 Big Data 기술완벽해부 JBoss User Group 김병곤 fharenheit@gmail.com 소개 ( 주 ) 클라우다인대표이사한국자바개발자협의회 (JCO) 회장 JBoss User Group 대표한국스마트개발자협회부회장지경부 /NIPA 소프트웨어마에스트로멘토 IT전문가협회정회원대용량분산컴퓨팅 Technical Architect 오프라인

More information

OZ-LMS TM OZ-LMS 2008 OZ-LMS 2006 OZ-LMS Lite Best IT Serviece Provider OZNET KOREA Management Philosophy & Vision Introduction OZNETKOREA IT Mission Core Values KH IT ERP Web Solution IT SW 2000 4 3 508-2

More information

슬라이드 1

슬라이드 1 Hadoop Tutorial 2013.2 정재화 Copyright 2013 그루터. All Rights Reserved. 이문서는 그루터의지적자산이므로 그루터의승인없이이문서를임의로배포하거나다른용도로임의변경하여사용할수없습니다. ABOUT ME 현 ) 그루터책임개발자 (http://www.gruter.com ) 전 ) 큐릭스, NHN, 엔씨소프트 E-mail:

More information

: Hadoop 출간 은 출판 분 2013 년 10 월 3 윤 퍼플 주 울 종 종 1 1번 윤 2013 본 전부 반 부를 재 권 동를 셔 면 OpenWithNet 총 상 술 워크 (2006 년) : Hadoop 세만 NoSQL 웹 분

: Hadoop 출간 은 출판 분 2013 년 10 월 3 윤 퍼플 주 울 종 종 1 1번   윤 2013 본 전부 반 부를 재 권 동를 셔 면 OpenWithNet 총 상 술 워크 (2006 년) : Hadoop 세만 NoSQL 웹 분 빅 데이 Hadoop과 분석법(Analytics) 지은이 윤형 : Hadoop 출간 은 출판 분 2013 년 10 월 3 윤 퍼플 주 울 종 종 1 1번 www.kyobobook.co.kr 윤 2013 본 전부 반 부를 재 권 동를 셔 면 OpenWithNet 총 상 술 워크 (2006 년) : Hadoop 세만 NoSQL 웹 분 (2013 년) 세 인넷 (근간)

More information

제목을 입력하십시오

제목을 입력하십시오 Big Data Analytics BK21+ Kick-off Meeting Jong Uk, Lee eastwest9@korea.ac.kr 2013. 10. 21 Section I) Data! Section Ⅱ) Big Data! Section Ⅲ) Big Data Technology Section Ⅳ) Big Data Use Case and Proposal

More information

항목

항목 Cloud 컴퓨팅기반분산파일시스템개요 개발실 UPDATE : 2012. 11 18 INDEX 1. 가용성 2. 확장성 3. PrismFS 4. Q&A 2 가용성 3 Gmail 장애 2011년 2월 27일 34000명의 Gmail 사용자들이일어나보니메일, 주소록, 채팅기록등이사라진것을발견 2011년 2월 28일 스토리지소프트웨어업데이트를진행하는중 Bug로인해발생했다고공지

More information

빅데이터처리의핵심인 Hadoop 을오라클은어떻게지원하나요? Oracle Big Data Appliance Solution 01 빅데이터처리를위한전문솔루션이 Oracle Big Data Appliance 군요. Oracle Big Data Appliance 와함께라면더이

빅데이터처리의핵심인 Hadoop 을오라클은어떻게지원하나요? Oracle Big Data Appliance Solution 01 빅데이터처리를위한전문솔루션이 Oracle Big Data Appliance 군요. Oracle Big Data Appliance 와함께라면더이 Cover Story 03 28 Oracle Big Data Solution 01_Oracle Big Data Appliance 02_Oracle Big Data Connectors 03_Oracle Exdata In-Memory Database Machine 04_Oracle Endeca Information Discovery 05_Oracle Event

More information

슬라이드 1

슬라이드 1 오픈소스를활용한클라우드 / 빅데이터서비스구현 주식회사오픈소스컨설팅 Profile 최지웅 오픈소스컨설팅컨설팅코치 삼성계열사오픈소스전략가이드수립및아키텍처링 대전통합전산센터클라우드아키텍처전략컨설팅 대용량시스템아키텍처구축 / 튜닝 아마존기반시스템구축, 오픈소스미들웨어 (Apache/Tomcat/JBoss), Big Data 백엔드시스템 (Linux, Middleware,

More information

Æí¶÷4-¼Ö·ç¼Çc03ÖÁ¾š

Æí¶÷4-¼Ö·ç¼Çc03ÖÁ¾š 솔루션 2006 454 2006 455 2006 456 2006 457 2006 458 2006 459 2006 460 솔루션 2006 462 2006 463 2006 464 2006 465 2006 466 솔루션 2006 468 2006 469 2006 470 2006 471 2006 472 2006 473 2006 474 2006 475 2006 476

More information

레드햇과 오픈스택 Feb, 2014 Kim Yong Ki Solution Architect Red Hat Korea RED HAT ENTERPRISE LINUX OPENSTACK PLATFORM 2014

레드햇과 오픈스택 Feb, 2014 Kim Yong Ki Solution Architect Red Hat Korea RED HAT ENTERPRISE LINUX OPENSTACK PLATFORM 2014 레드햇과 오픈스택 Feb, 2014 Kim Yong Ki Solution Architect Red Hat Korea Index WHY - WHAT - HOW - WHERE - WHO - WHEN - 왜 오픈스택이 필요한가 오픈스택은 무엇인가 오픈스택은 어떻게 작동하는가 오픈스택은 어디에서 사용될까 누가 오픈스택을 만들었는가 우리는 언제 오픈스택을 사용할 수

More information

NoSQL

NoSQL MongoDB Daum Communications NoSQL Using Java Java VM, GC Low Scalability Using C Write speed Auto Sharding High Scalability Using Erlang Read/Update MapReduce R/U MR Cassandra Good Very Good MongoDB Good

More information

Hallym Communication Policy Research Center 15 빅데이터기술은대용량의데이터를다룰때, 여러과정을거치게되는데, 데이터수집및데이터전처리, 저장, 분석, 활용 ( 시각화 ) 까지의과정을 거치게되며각과정별로핵심기술이존재한다. 빅데이터기술은대용

Hallym Communication Policy Research Center 15 빅데이터기술은대용량의데이터를다룰때, 여러과정을거치게되는데, 데이터수집및데이터전처리, 저장, 분석, 활용 ( 시각화 ) 까지의과정을 거치게되며각과정별로핵심기술이존재한다. 빅데이터기술은대용 14 한림 ICT 정책저널 H a l l y m I C T P o l i c y J o u r n a l 빅데이터기술동향 전략적클라우드림 김광호이재준이사교수 빅데이터기술이란? 빅데이터기술은기존의데이터분석기법에비해 100배이상많은데이터를다루는기술이다. 빅데이터기술이다루는데이터의성격은다양하다. 예를들어시스템운영을통해산출되는로그데이터와구매기록데이터등의정형데이터뿐만아니라,

More information

통신회사에서가장중요한데이터자원이라고하면뭐니뭐니해도고객들의통화기록이라할수있다. 이를 Call Detail Record(CDR) 라고하며, 고객들이유선전화나휴대폰을사용하여통화할때마다통화위치, 통화대상, 통화시간등이로그데이터로기록된다. 매통화마다기록되므로 1일발생량은수억건에

통신회사에서가장중요한데이터자원이라고하면뭐니뭐니해도고객들의통화기록이라할수있다. 이를 Call Detail Record(CDR) 라고하며, 고객들이유선전화나휴대폰을사용하여통화할때마다통화위치, 통화대상, 통화시간등이로그데이터로기록된다. 매통화마다기록되므로 1일발생량은수억건에 White Paper Big Data Case Study 통신회사에서가장중요한데이터자원이라고하면뭐니뭐니해도고객들의통화기록이라할수있다. 이를 Call Detail Record(CDR) 라고하며, 고객들이유선전화나휴대폰을사용하여통화할때마다통화위치, 통화대상, 통화시간등이로그데이터로기록된다. 매통화마다기록되므로 1일발생량은수억건에달하는그야말로대표적인빅데이터라고할수있다.

More information

슬라이드 1

슬라이드 1 Hadoop Tutorial - 설치및실행 2008. 7. 17 한재선 (NexR 대표이사 ) jshan0000@gmail.com http://www.web2hub.com H.P: 016-405-5469 Brief History Hadoop 소개 2005년 Doug Cutting(Lucene & Nutch 개발자 ) 에의해시작 Nutch 오픈소스검색엔진의분산확장이슈에서출발

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 Mining on Hadoop!! ankus 제품 소개서 어니컴 빅데이터 사업팀 팀장 이성준 (leesj@onycom.com) 2015.12 어니컴 목 차 01. ankus 개요 02. 주요 도입 사례 03. 기업소개 2 1.1 ankus 개요 1. ankus 개요 ankus는 대용량의 빅데이터로부터 데이터 마이닝/기계학습 등의 분석을 손 쉽게 수행할 수 있는

More information

Web Application Hosting in the AWS Cloud Contents 개요 가용성과 확장성이 높은 웹 호스팅은 복잡하고 비용이 많이 드는 사업이 될 수 있습니다. 전통적인 웹 확장 아키텍처는 높은 수준의 안정성을 보장하기 위해 복잡한 솔루션으로 구현

Web Application Hosting in the AWS Cloud Contents 개요 가용성과 확장성이 높은 웹 호스팅은 복잡하고 비용이 많이 드는 사업이 될 수 있습니다. 전통적인 웹 확장 아키텍처는 높은 수준의 안정성을 보장하기 위해 복잡한 솔루션으로 구현 02 Web Application Hosting in the AWS Cloud www.wisen.co.kr Wisely Combine the Network platforms Web Application Hosting in the AWS Cloud Contents 개요 가용성과 확장성이 높은 웹 호스팅은 복잡하고 비용이 많이 드는 사업이 될 수 있습니다. 전통적인

More information

sdf

sdf 분산환경에서의 실시간 네트워크 모니터링 2015. 6. 22 이영석 lee@cnu.ac.kr 충남대학교 컴퓨터공학과 데이터네트워크 연구실 (http://networks.cnu.ac.kr ) 1 내용 개요 하둡기반 인터넷 트래픽 측정 실시간 모니터링 이슈 및 사례 결론 2 네트워크 모니터링 Packet Flow Routing SNMP LOG libpcap Cisco

More information

Cloudera Toolkit (Dark) 2018

Cloudera Toolkit (Dark) 2018 BIG DATA LAKE 구축사례 굿모닝아이텍 / 박근봉상무 AGENDA 1. BIGDATA 현황 2. Cloudera Bigdata Lake 3. BIG DATA LAKE 구축사례 2 BIGDATA 현황 3 BIGDATA 현황 2020 년국내빅데이터시장약 9 억달러 2006 년 빅데이터 (Big Data) 가구글검색어로처음등장한이래 2012 년다보스포럼에선그해가장중요한기술중하나로빅데이터를꼽았다.

More information

aws

aws Amazon Web Services AWS MIGRATION MANAGED SERVICE FOR AWS 베스핀글로벌 S AWS OFFERING 베스핀글로벌과 Amazon Web Services (AWS) 가 여러분의 비즈니스에 클라우드 날개를 달아드립니다. AWS에 높은 이해도를 갖춘 베스핀글로벌의 클라우드 전문가가 다양한 산업 영역에서의 구축 경험과 노하우를

More information

슬라이드 1

슬라이드 1 제 2 장 빅데이터기술 2015.02 조완섭충북대학교경영정보학과대학원비즈니스데이터융합학과 wscho@chungbuk.ac.kr 043-261-3258 010-2487-3691 목차 개요 빅데이터기술 클라우드컴퓨팅 Hadoop & Databases 데이터분석기술 다차원분석 통계분석 : R 데이터마이닝 빅데이터시각화기술 2015-07-23 2 개요 빅데이터 -

More information

Cover Story 01 20 Oracle Big Data Vision 01_Big Data의 배경 02_Big Data의 정의 03_Big Data의 활용 방안 04_Big Data의 가치

Cover Story 01 20 Oracle Big Data Vision 01_Big Data의 배경 02_Big Data의 정의 03_Big Data의 활용 방안 04_Big Data의 가치 Oracle Big Data 오라클 빅 데이터 이야기 Cover Story 01 20 Oracle Big Data Vision 01_Big Data의 배경 02_Big Data의 정의 03_Big Data의 활용 방안 04_Big Data의 가치 최근 빅 데이터에 대한 관심이 커지고 있는데, 그 배경이 무엇일까요? 정말 다양한 소스로부터 엄청난 데이터들이 쏟아져

More information

consulting

consulting CONSULTING 전략 컨설팅 클라우드 마이그레이션 애플리케이션 마이그레이션 데이터 마이그레이션 HELPING YOU ADOPT CLOUD. 클라우드로 가기로 결정했다면 누구와 함께 갈지를 선택해야 합니다. 처음부터 끝까지 믿을만한 파트너를 찾는다면 베스핀글로벌이 정답입니다. 전략 컨설팅 다양한 클라우드 공급자가 존재하고, 클라우드 공급자마다 다른 장단점을

More information

슬라이드 1

슬라이드 1 NoSQL 김형준 (gruter) babokim@gmail.com Revision: 2011.06.19 2011 JCO 11th Conference Session ${track_#}-${session_#} Javacommunity.Org 김형준 babokim@gmail.com(gtalk) 그루터, www.gruter.com www.jaso.co.kr www.cloudata.org

More information

gcp

gcp Google Cloud Platform GCP MIGRATION MANAGED SERVICE FOR GCP 베스핀글로벌 S GCP OFFERING 베스핀글로벌과 Google Cloud Platform이 여러분의 비즈니스에 클라우드 날개를 달아드립니다. GCP에 전문성을 갖춘 베스핀글로벌의 클라우드 전문가들이 다양한 산업 영역에서의 구축 경험과 노하우를 바탕으로

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 빅데이터플랫폼 Flamingo 를통해알아보는성공적인오픈소스비즈니스비법 빅데이터개발본부 김병곤상무 GPL 라이선스인 Ghostscript 를한컴오피스에내장 GPL 라이선스위반 Ghostscript 개발사인 Artifex 가소송 소송에서패소 ( 협의만남음 ) 여전히한컴은소스코드를 공개하지않음 오픈소스 (open source) 는소프트웨어의제작자의권리를지키면서원시코드를누구나열람할수있도록한소프트웨어혹은오픈소스라이선스에준하는모든통칭을일컫는다.

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 Hadoop 애플리케이션 테스트하기 클라우다인대표김병곤 fharenheit@gmail.com 2 주제 Hadoop 의기본 MapReduce 의특징과테스트의어려운점 MRUnit 을이용한단위테스트기법 통합테스트를위한 Mini Cluster 성능테스트 3 V Model Requirement Acceptance Test Analysis System Test Design

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 빅데이터분석활용센터 분석활용인프라매뉴얼 목 차 1 분석활용인프라 1. 개요 1.1 개요 1 2. 메뉴구조도 2.1 메뉴구조도 2 3.1 플라밍고로그인 3 3.2 데스크탑화면 8 3.3 대시보드 9 3.4 워크플로우디자이너 13 3.5 파일시스템브라우저 27 3.6 Apache Hive 편집기 42 3.7 Apache Pig 편집기 48 3.8 BI Matrix

More information

슬라이드 1

슬라이드 1 Visual 2008 과신속한애플리케이션 개발 Smart Client 정병찬 ( 주 ) 프리엠컨설팅개발팀장 johnharu@solutionbuilder.co.kr http://www.solutionbuilder.co.kr 목차 Visual Studio 2008 소개 닷넷프레임워크 3.5 소개 Language Integrated Query (LINQ) 어플리케이션개발홖경

More information

5 주차 -mongodb 설치잠깐! CAP 이론 NoSQL이나온이유와 MongoDB NoSQL의데이터저장구조에따른세가지분류 RDBMS와 NoSQL특성비교 RDBMS와 NoSQL의사용시기 MongoDB 소개및특징 MongoDB와 RDBMS와의공통 MongoDB CRUD

5 주차 -mongodb 설치잠깐! CAP 이론 NoSQL이나온이유와 MongoDB NoSQL의데이터저장구조에따른세가지분류 RDBMS와 NoSQL특성비교 RDBMS와 NoSQL의사용시기 MongoDB 소개및특징 MongoDB와 RDBMS와의공통 MongoDB CRUD 5 주차 -mongodb 설치잠깐! CAP 이론 NoSQL이나온이유와 MongoDB NoSQL의데이터저장구조에따른세가지분류 RDBMS와 NoSQL특성비교 RDBMS와 NoSQL의사용시기 MongoDB 소개및특징 MongoDB와 RDBMS와의공통 MongoDB CRUD Data Modeling 참고 MongoDB CRUD Operations MongoDB 실습설치환경구동확인

More information

RED HAT JBoss Data Grid (JDG)? KANGWUK HEO Middleware Solu6on Architect Service Team, Red Hat Korea 1

RED HAT JBoss Data Grid (JDG)? KANGWUK HEO Middleware Solu6on Architect Service Team, Red Hat Korea 1 RED HAT JBoss Data Grid (JDG)? KANGWUK HEO Middleware Solu6on Architect Service Team, Red Hat Korea 1 Agenda TITLE SLIDE: HEADLINE 1.? 2. Presenter Infinispan JDG 3. Title JBoss Data Grid? 4. Date JBoss

More information

슬라이드 1

슬라이드 1 모바일소프트웨어프로젝트 지도 API 1 조 20070216 김성수 20070383 김혜준 20070965 이윤상 20071335 최진 1 매시업? 공개 API? 2 매시업 웹으로제공하고있는정보와서비스를융합하여새로운소프트웨어나서비스, 데이터베이스등을만드는것 < 최초의매시업 > 3 공개 API 누구나사용할수있도록공개된 API 지도, 검색등다양한서비스들에서제공 대표적인예

More information

PowerPoint Presentation

PowerPoint Presentation Hadoop 과 Advanced Analytics 을활용한 Big Data 숨은가치창출 임상배부장 (sangbae.lim@oracle.com) Technology 사업본부, 한국오라클 Safe Harbor The following is intended to outline our general product direction. It is intended for

More information

클라우드 빅데이타 개발자 과정

클라우드 빅데이타 개발자 과정 2017 년정보처리학회단기강좌 빅데이터플랫폼과 Spark - 장형석 - 국민대학교빅데이터경영 MBA 과정교수 - chjang1204@nate.com Part I 빅데이터플랫폼 1. 빅데이터플랫폼 빅데이터수집 / 분석 / 서비스를위한목표플랫폼 빅데이터플랫폼 데이터 서비스 서비스 / 시각화 시각화 활용 내부DB 외부DB 공공DB 문서파일포털 (WEB) SNS A

More information

<4D F736F F D20BBE7BABB202D20C3D6BDC54954B5BFC7E2>

<4D F736F F D20BBE7BABB202D20C3D6BDC54954B5BFC7E2> 최신 IT 동향주간기술동향 2012. 4. 11. NoSQL DB 인기도조사, 하둡진영과몽고 DB 의경쟁양상 * 비즈니스인텔리전스 (BI) 전문기업인재스퍼소프트 (Jaspersoft) 가 NoSQL DB 의인기도를알수있는빅데이터지수 (JBDI) 를발표 - 빅데이터는대규모의정형및비정형데이터를분석하는것이므로, 정형데이터를 SQL 쿼리로관리하는관계형데이터베이스관리시스템

More information

졸업작품중간보고서 - 구글 MapReduce 를이용한클라우드컴퓨팅 조중연 서종덕 지도교수님진현욱교수님 ( 인 )

졸업작품중간보고서 - 구글 MapReduce 를이용한클라우드컴퓨팅 조중연 서종덕 지도교수님진현욱교수님 ( 인 ) 졸업작품중간보고서 - 구글 MapReduce 를이용한클라우드컴퓨팅 - 200814194 조중연 200814187 서종덕 지도교수님진현욱교수님 ( 인 ) 목 차 1. 개요및목적 2. 관련기술및기술동향 I. 관련기술 II. 기술동향및사례조사 3. 프로젝트세부사항 I. 개발내용 II. 동작과정 III. 개발환경 4. 진행사항 I. 개발환경설정 II. 설치및환경설정현황

More information

슬라이드 1

슬라이드 1 Tadpole for DB 1. 도구개요 2. 설치및실행 4. 활용예제 1. 도구개요 도구명 소개 Tadpole for DB Tools (sites.google.com/site/tadpolefordb/) 웹기반의데이터베이스를관리하는도구 Database 스키마및데이터관리 라이선스 LGPL (Lesser General Public License) 특징 주요기능

More information

(주)나우프로필의 이동형 대표 개편의 방향이 시민참여를 많이 하는 방향이라, 홈페이지 시안 이 매우 간편해져서 소통이 쉬워질 것 같다. 다만 웹보다 모바일 이용자가 지속적으로 급증하는 추세이므로 이에 적합한 구조가 되도록 보장해야 한다. 소셜미디어전략연구소 배운철 대표

(주)나우프로필의 이동형 대표 개편의 방향이 시민참여를 많이 하는 방향이라, 홈페이지 시안 이 매우 간편해져서 소통이 쉬워질 것 같다. 다만 웹보다 모바일 이용자가 지속적으로 급증하는 추세이므로 이에 적합한 구조가 되도록 보장해야 한다. 소셜미디어전략연구소 배운철 대표 홈페이지 정비 및 향후 추진방향 자문회의 회의록 일 시 : 2012. 1. 16(월) 14:00 ~ 16:00 장 소 : 1동 3층 스마트정보지원센터 참석자 : 내 외부 자문위원(10명), 관련부서 직원(10명), 정보화기획단장, 정보화기획담당관, 관련팀장, 직원 등 정보화기획단에서는 12. 1. 16(월)에 1동 3층 스마트정보지원센터에서 시정 홈페이지 통

More information

Spring Boot/JDBC JdbcTemplate/CRUD 예제

Spring Boot/JDBC JdbcTemplate/CRUD 예제 Spring Boot/JDBC JdbcTemplate/CRUD 예제 오라클자바커뮤니티 (ojc.asia, ojcedu.com) Spring Boot, Gradle 과오픈소스인 MariaDB 를이용해서 EMP 테이블을만들고 JdbcTemplate, SimpleJdbcTemplate 을이용하여 CRUD 기능을구현해보자. 마리아 DB 설치는다음 URL 에서확인하자.

More information

서현수

서현수 Introduction to TIZEN SDK UI Builder S-Core 서현수 2015.10.28 CONTENTS TIZEN APP 이란? TIZEN SDK UI Builder 소개 TIZEN APP 개발방법 UI Builder 기능 UI Builder 사용방법 실전, TIZEN APP 개발시작하기 마침 TIZEN APP? TIZEN APP 이란? Mobile,

More information

PowerPoint Template

PowerPoint Template 대량기록물의 효율적인 처리를 위한 Database 관리방안 연구 2011.10.08 서강대학교 컴퓨터공학과 이대욱 목 차 1. 연구범위 및 내용 2. 대량기록물의 효율적인 처리를 위한 Database 구조연구 기록관리 서브시스템별 특징,기능 및 DBMS 역할 입수단 / 보존단 / 제공단 3. 인프라 변화에 대응한 Database 관리 방안 연구 대용량데이터처리기술

More information

Microsoft Word - 조병호

Microsoft Word - 조병호 포커스 클라우드 컴퓨팅 서비스 기술 및 표준화 추진 동향 조병호* 2006년에 클라우딩 컴퓨팅이란 용어가 처음 생겨난 이래 글로벌 IT 기업 CEO들이 잇달아 차 기 핵심 기술로 클라우드 컴퓨팅을 지목하면서 전세계적으로 클라우드 컴퓨팅이라는 새로운 파 라다임에 관심이 고조되고 있다. 클라우드 컴퓨팅 기술을 이용하면 효율적인 IT 자원을 운용할 수 있으며 비용절감

More information