오픈데크넷서밋_Spark Overview _SK주식회사 이상훈

Size: px
Start display at page:

Download "오픈데크넷서밋_Spark Overview _SK주식회사 이상훈"

Transcription

1 Spark Overview ( 아파치스파크를써야하는이유 ) SK 주식회사 C&C 이상훈

2 빅데이터플랫폼 Spark Overview Spark 란? Spark Streaming 고급분석

3 빅데이터플랫폼

4 빅데이터플랫폼의필요성 Client UX Log HTTP Server WAS Biz Logic Data Legacy DW Report IoT Mobile Sensor Server Log External data Statistic Mart - 3-Tier 의웹기반서비스가가장보편화되어있음 ( 웹로그, 사용자클릭정보 ) - 고객정보를통한통계, 분석을위한 DW, BI, OLAP 등도입 - 비즈니스로직이 DBMS 영역으로이관되는경우 (Open API 가대표적 ) - Mobile( 스마트폰 ) 시장활황으로고객데이터가급격히증가 - 외부데이터와연동을통한고급 / 연계분석시도 - 센서, 사물인터넷등의데이터증가지속 -> 데이터베이스의확장또는새로운개념의 DB 필요

5 저장플랫폼 Client HTTP Server WAS Data DW Report MongoDB HDFS Hbase - 분산파일시스템 : 데이터를분산환경에분리하여저장 / 처리 / 요청할수있도록구성된파일시스템 - NoSQL : 구글의 BigTable 에기반한 Key/Value DB, Document DB 등 - 사용구분 : RDBMS NoSQL Hadoop HDFS 비즈니스데이타 ( 계좌, 고객등 ) 엄격한트랜잭션처리 (ACID) 다수의사용자에대해정합성과안정성보장 100% SQL Compliance 고비용 SNS, 블로그등의텍스트 Partial Consistency ->Delay 허용 유연성과효율성 특화된용도에맞게사용 RDBMS 와는보완관계 선택의폭이넓어짐 웹 / 센서로그등의 low density data Parallel Batch Processing 트랜잭션지원안함 데이터전처리및집계에적합 저비용 Copyright@2016 SK Holdings C&C Co.Ltd. All Rights Reserved.

6 수집 / 연동플랫폼 Client HTTP Server WAS Data DW Report External MongoDB HDFS Hbase Legacy - 수집 / 연동플랫폼 : 다양한다수의서버로부터데이터를수집하여다양한저장플랫폼에저장 - Flume : 설정및구성이비교적간단하여대표적인로그수집시스템으로이용, Fail-over, 유연성등대규모로그처리에적합한기능을가짐 - Sqoop : JDBC 기반으로다양한 DBMS 벤더와공동작업, 데이터처리하는 MR프로그램지원, Hive 와통합하여 SQL 기반환경으로편리하게이용가능, 안정적인성능보장 - Kafka : 대용량의실시간로그처리에특화된설계를통하여기존메시징시스템보다우수한 TPS - 기타데이터연동방법 : FTP, Fuse, webhdfs, Chukwa, HIHO 등 Copyright@2016 SK Holdings C&C Co.Ltd. All Rights Reserved.

7 배치처리 / 분석플랫폼 Client HTTP Server WAS Data DW Report Spark MLlib - 배치처리 / 분석플랫폼 : 초기의하둡기반플랫폼은배치처리에강점을가지고있었으나실시간 처리, 고급분석등의한계로인해관련에코시스템들이포함되고지속적인기능개선이일어남 - PIG, Hive : Hadoop 초기에 Mapreduce 의숙련시간을줄여비교적간단한기능을수행할수있도록 스크립트레벨의언어를제공, 초기활성화에기여함 - Mahout : MR 을이용해클러스터링, 분류, 분석작업등의병렬처리가능한기계학습라이브러리 - MLlib : Spark 를기반으로빌드된기계학습라이브러리 MR, PIG, Hive - SQL on Hadoop(Tajo, Impala,presto 등 ) : Hive 에단점을보완하기위한시도, hdfs 에저장된파일을 MR 이아닌별도의컴퓨팅플랫폼을이용하여질의실행 HDFS Mahout Tajo, Impala, Hive(Tez) Copyright@2016 SK Holdings C&C Co.Ltd. All Rights Reserved.

8

9 Hive 등장배경 기존시스템을전부.. MapReduce code 로전환한다면필요한시간은? 어떻게설계해야성능이나오지? 잦은수정이필요하다면? 한번만데이터뽑으면되는데 Big Data 기반 Platform 에서복잡한 MapReduce 프로그램을직접개발하지않고.. 기존 SQL 기반으로쉽게개발가능하다면..?!

10 Hive 란? HiveQL(SQL 과이슈 ) 를이용하여 MapReduce 를수행하도록도와주는오픈소스 Hadoop 에있는데이터에쉽게접근할수있으며데이터심화분석을위한사전분석작업이나리포팅작업으로많이사용됨 각종함수뿐만아니라복잡한분석을위한 UDF 지원

11 Hive 아키텍쳐

12 RDBMS 와 Hive 의차이점 - 쿼리응답속도가 ( 작은데이터기준 ) 느림 - 레코드단위 Insert, delete or update - 지원하지않음 - 게다가 Transaction 도지원하지않음 - 그래서 case문등을이용해서복잡하게구현해야함 ( 속도도더느림 ) - 통계정보도바로확인할수없음 - 인풋데이터의오류를바로확인할수없음

13 Schema On WRITE (RDBMS) - Create schema - CREATE TABLE customer(id string, name string,...); - Add data - BULK INSERT custormer FROM "c:\data\customer" WITH filedterminator='"," ; - Quer y - SELECT id, name FROM custormer;

14 Schema On WRITE (RDBMS) - Create schema - CREATE TABLE customer(id string, name string,...); - Add data - BULK INSERT custormer FROM "c:\data\customer" WITH filedterminator='"," ; - Quer y - SELECT id, name FROM custormer; - SQL에서는테이블스키마를선언하기전까지는데이터를넣을수없음 - 테이블스키마가변경되게되면테이블을 drop하고데이터를 reload시켜야함 - 작은데이터에서는문제없음 - 그러나, 수백 TB라면? 그리고 foreing key가변경되었다면?

15 Schema On READ (Hive) - Create schema - CREATE (EXTERNAL) TABLE customer(id string, name string,...) - LOAD THE DATA - hdfs dfs -copyfromlocal /data/ /user/hadoop/customer - Quer y - SELECT id, name FROM custormer

16 Schema On READ (Hive) - Create schema - CREATE (EXTERNAL) TABLE customer(id string, name string,...) - LOAD THE DATA - hdfs dfs -copyfromlocal /data/ /user/hadoop/customer - Quer y - SELECT id, name FROM custormer - SQL 에서는테이블스키마를선언하기전에도데이터를 hdfs 에넣을수있음 => RDBMS 대비부족한점이있어도 Hive 를써야하는이유 : 빅데이터는데이터사이즈가클 뿐만아니라비정형데이터도많기때문에데이터타입이나컬럼들이분석함에따라자주바뀜.

17 실시간처리 / 분석플랫폼 Client HTTP Server WAS Data DW Report Redis HDFS - 실시간처리 / 분석플랫폼 : 데이터종류에따라다양한형태의에코시스템을최적화조합하여데이터 수집, 처리, 전송이모두실시간으로이루어지도록구성 - Message Queue : 실시간으로수집된데이터를 Streaming 전송, 실시간처리를위한첫단추임. Kafka, Storm 등이 MQ 기능을포함하고있음. - Storm : 로컬및분산모드지원, Hadoop 프로세스를메모리상에서처리한다고생각하면간단함 - Spark Streaming : 실시간데이터를대규모, 고성능, 장애허용가능하게스트리밍을처리하는핵심 Spark API 의확장판 Storm Spark streaming - Redis : In-Memory Key-Value DB 라빠른속도가강점, 실시간처리에적합

18 관리 / 운영플랫폼 Client HTTP Server WAS Data DW Report MR, PIG, Hive Mahout HDFS Tajo, Impala, Hive(Tez) Oozie Zookeeper Ambari - 관리운영플랫폼 : 하둡에코시스템이갈수록복잡해짐에따라프로세스관리및클러스터관리의필요성이대두되면서관련된오픈소스프로젝트들이등장 - Ambari : 마법사기반설치지원, 하둡서비스와구성요소의세부구성, metrics 수집및시스템경고에대한 Nagios, Ganglia 포함, 상세 Job 진단및문제해결도구, 클러스터히트맵 - Oozie : MR, Pig, Hive 등을구현한프로세스들의Workflow 를디자인하고실행하게해줌. XML 형식으로프로세스를디자인하므로복잡한프로세스적용에어려움 - 디자인 UI 가필요함 - Zookeeper : 분산환경서버들간에상호조정이필요한다양한서비스를제공. 분산동시처리, 서버들간의동기화, fail-over 로무중단서비스, 서버들간환경설정관리기능등제공

19 Apache Ambari ( HDP )

20 Lambda Architecture

21 너무복잡한기술들 Lambda Architecture 너무많은오픈소스 관리하기어려움 더빠른속도가필요 Etc Window Function Machine Learning Analytics

22 Spark 란?

23 Spark 란? 대용량 Data Processing 을위한빠르고 General 한엔진 Hadoop MapReduce 와비슷한개념의새로운 Computing Framework Written in Scala, Java, Python (Mostly in Scala) Apache License 2.0 Developers: U.C Berkeley, AMPLab, ASF In-memory Cluster Computing 기능을제공 Apache 에서가장활발한 3 개프로젝트중하나 Spark Version Released recently

24 설계목표 Low latency (interactive) queries on historical data 과거데이터들을빠르게처리해대화형질의가가능하도록함. Low Latency가가능해야데이터탐색 - 분석 탐색 분석의반복과정을통해제대로된데이터분석을할수있음 Low latency queries on live data(streaming) 실시간으로들어오는데이터를분석할수있어야함. 스파크는실시간스트리밍처리 분석도가능하도록설계하였음.

25 설계목표 Sophisticated data processing 복잡한분석도가능해야함. Anomaly detection, Trend analysis 등복잡한분석도가능해야좀더나은의사결정을할수있다고생각했음. 머하웃 (Mahout) 이나 R과같은프로젝트의목표와비슷하나반복처리, 병렬처리에훨씬강력함.

26 Unified Platform

27 Fast

28 Fast

29 Simple

30 지원언어 스파크는상당부분이스칼라 (Scala) 라는객체지향성격과함수형성격을모두가지는언어로프로그래밍되어있음. 스칼라만지원하는것은아니라기본적으로스칼라와더불어자바, 파이썬을지원함. 자바는가장범용적인언어중하나이고맵리듀스와같이많은오픈소스들이자바를기반으로프로그램을만들수있도록하고있음. 또한파이썬은최근간결성과다양한기능으로사용자가많아지고있음

31 지원언어 스파크에서 3 가지언어를대부분지원하지만, 모든기능을 3 가지언어에대해동일하게지원하지는않음. 버전마다다르지만 Spark SQL 과의연계, 스트리밍, MLlib 의각종 Matrix 는스칼라를우선지원 또한셀환경은스칼라와파이썬만지원한다. 가급적이면스칼라를권장하고자바나파이썬을사용할경우, 사용하려는기능을제공하는지미리확인해야해야함

32 빅데이터에코시스템과호환 Spark의뛰어난전략 하둡 하둡 2.0 완벽한호환 HDFS 및하둡에코시스템 (Hbase, Casandra, Hive 등 ) 과의호환 Yarn과의호환 ETC Amazon EC2 R RDBMS Tableau

33

34 How Fast? RDDs (Resilient Distributed Datasets) 클러스터전체에서공유되는데이터형태로대부분메모리에올라가있음 병렬로처리될수있는 Immutable (read-only), partitioned 된 elements 의집합 데이터를수정할수있게되면데이터유실시복구가어려움. 대신새로운메모리를확보하여새로운값할당. Update 무시 Cache

35 Fault Tolerance? RDDs (Resilient Distributed Datasets) Fault Tolerance Lineage 를이용한데이터복구 Need not exist in physical storage RDDs 는메모리에분산임시저장하기때문에데이터처리시디스크를사용하지않음. 그러나, 데이터복구시매우안정적인저장공간으로부터 (ex> HDFS) 데이터를복원하기시작함. Laziness : 모든작업은여러작업을설정해두고마지막 Operation 함수수행시계산

36 Spark 데이터흐름

37 Spark SQL Introduction 과거의 Shark (SQL on Spark) 는개발중단하고 SparkSQL로프로젝트가생성되었음 Spark 프로그램과 SQL 쿼리를혼합하여 Seamless 하게사용가능 Hive 테이블, Parquet 파일, JSON 파일과같은여러소스에서 Data Access 가능 기존의 Hive frontend 와 Metastore 를재사용하여기존의 Hive 데이터, 쿼리, UDFs 을그대로사용가능 JDBC 혹은 ODBC를통해서버모드를포함하여기존 BI Tool 과의연동도가능 DataFrame API(1.4), DataSet API(1.6)

38 Iterative operations on MapReduce

39 Interactive operations on MapReduce

40 Iterative operations on Spark RDD

41 Iterative operations on Spark RDD

42 스파크 Streaming

43 Spark Streaming

44 Flume 다양한소스에서발생한대량의로그데이터를중앙데이터스토어. 효과적으로수집집계 (aggregating) 하거나이동시킬수있는신뢰할수있는분산시스템. 스트림지향의데이터플로우를기반으로하며지정된모든서버로부터로그를수집. 하둡 HDFS 와같은중앙저장소에적재하여분석하는시스템을구축해야할때적합. 데이터소스를커스터마이징할수있기때문에로그데이터수집에제한되지않음. 소셜미디어데이터, 이메일메세지등다량의이벤트데이터를전송하는데에사용할수있음.

45 Kafka LinkedIn에서개발된대용량실시간처리를위한고성능분산메시징시스템 큰기업이갖고있을모든실시간데이터피드들을처리하는통합플랫폼 실시간로그집계와같은높은볼륨의이벤트피드들을위한높은처리량을갖아야함 오프라인시스템으로부터주기적인데이터로딩을지원하기위해, 많은데이터백로그들을처리할수있어야함 구식메시징 use-case들을처리하기위해서, low-latency 전송을처리할수있어야함 새로운피드나유래된피드들을생성하기위해분할, 분산, 실시간처리을지원함 다른시스템으로스트림을전송할때에, 장비장애의 fault-tolerance 보장

46 Spark Streaming Overview Scalable, High-throughput, Fault-tolerant stream processing 을가능하게함. Kafka, Flume, Twitter, TCP sockets 등여러가지소스를사용할수있음. Map, Reduce, Join, Window 같은 High Level 기능들을사용하여 Processing 할수있음. Process 된 Data 는 File system, Database 등에저장될수있음.

47 How does it work? 실시간으로들어오는 data stream 은 batch 단위로나뉘어지고나뉘어진 batch 단위의 data 는 Spark 엔진에의해서 processing 된뒤에최종 final stream 이생성됨. Spark streaming 은 Discretized stream 혹은 Dstream 이라고하는 High-level abstraction 을제공한다. DStream 은여러 input 소스에서부터생성될수있음. DStream 은연속적인 RDD라고볼수있음. DStream 내 RDD는일정한인터벌시간내존재하는 Data 가들어있음.

48 Spark Streaming 예제 Line을 split 을통해 words 로바꿈. val words = lines.flatmap(_.split( )) Wordcount 를 DStream 의 API 인 map과 reduce 를통해서수행. val paris = words.map(word => (word, 1)) val wrodcounts = pairs.reducebykey(_ + _)

49 Window Operations Windowed computation 기능을제공하는데이것은 sliding window 내의데이터를 transform 하기위해서임. Window-based operation을수행하기위해서는 2개의파라미터가필요. Window length window 사이즈 Slide interval window-based operation 이수행되는인터벌

50 Fault-tolerance and Zero Data Loss

51 Improvements to Kafka integration

52 Visualizations for Understanding Spark Streaming Applications

53 Combine batch

54 Combine machine learning

55 Combine SQL

56 고급분석

57 Tungsten execution engine Spark 성능 bottleneck 은? I/O 나 network bandwidth? 실제로 CPU 와 memory 에서더욱 bottleneck 발생! 하드웨어의 CPU, Memory 등에서도최대한뽑을수있는새로운아키텍쳐가필요 Project Tungsten Memory Management and Binary Processing Cache-aware computation Code generation: using code generation to exploit modern compilers and CPUs DataFrame(1.4), Dataset(1.6)

58 DataFrame 기술적인개선으로보이지만분석을위한개선!

59 Spark 2.0 Performance optimizations Custom encoders Python Support. Unification of DataFrames with Datasets Static DataFrames -> Countinous DataFrames

60 MLlib, SparkML 보편적인 Machine Learning 알고리즘과유틸리티를 Spark 로구현한프로젝트 Goal is to make practical machine learning scalable and easy. 2 가지패키지 spark.mllib contains the original API built on top of RDDs. spark.ml : provides higher level API built on top of DataFrames for constructing ML pipelines. 제공내용 Classification and regression Collaborative filtering Clustering Dimensionality reduction Optimization

61 Zeppelin

62 Zeppelin 출처 : Craig Lukasik

63 R 분산처리방법 데이터베이스연결 RHadoop SparkR Spark 1.4 버전부터정식으로포함된패키지

64 R 의한계및필요기능 기본적으로 R 은단일쓰레드를사용하여싱글코어, 싱글머신에서작동함 하드웨어에따라처리할수있는데이터크기가한정되어있음 ( 주로 Ram 크기 ) DW 등큰데이터에바로접근해야할경우가있음

65 R 분산처리방법 유료 Revolution R Enterprise + AzureR 가장 R 표준에가까움 Azure 의클라우드컴퓨팅을활용할수있음 Oracle R Enterprise R 의명령어를그대로사용하면서오라클의데이터에접속할수있음 R 언어의함수는오라클내부에서병렬실행이되도록질의로변환됨 IBM Netezza, SAP HANA 등..

66 R 분산처리방법 Parallel 패키지 내장된멀티코어패키지 멀티쓰레드지원과메모리를해결할수있음 Snow 패키지 내장된분산처리패키지 설정이복잡하다는단점이있음

67 R 분산처리방법 데이터베이스연결 RHadoop SparkR Spark 1.4 버전부터정식으로포함된패키지

68 Auto scaling scikit-learn with Spark

69 Deep Learning using Spark

70 학습방법 Databricks Blog Spark 를만든사람들이창업한회사 (Databricks) Spark 글들의좋은내용들이다수올라옴 발표자료그림의상당수출처는 Databricks Blog Spark Summit 대부분의발표자료와동영상공유 책 이미과거버전이라자세한기술보다는기본익히기는좋음 Learning Spark, Advanced Analytics with Spark 등

71 Q&A

김기남_ATDC2016_160620_[키노트].key

김기남_ATDC2016_160620_[키노트].key metatron Enterprise Big Data SKT Metatron/Big Data Big Data Big Data... metatron Ready to Enterprise Big Data Big Data Big Data Big Data?? Data Raw. CRM SCM MES TCO Data & Store & Processing Computational

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 Open Source 를이용한 Big Data 플랫폼과실시간처리분석 한국스파크사용자모임, R Korea 운영자 SK C&C 이상훈 (phoenixlee1@gmail.com) Contents Why Real-time? What is Real-time? Big Data Platform for Streaming Apache Spark 2 KRNET 2015 Why

More information

RUCK2015_Gruter_public

RUCK2015_Gruter_public Apache Tajo 와 R 을연동한빅데이터분석 고영경 / 그루터 ykko@gruter.com 목차 : R Tajo Tajo RJDBC Tajo Tajo UDF( ) TajoR Demo Q&A R 과빅데이터분석 ' R 1) R 2) 3) R (bigmemory, snowfall,..) 4) R (NoSQL, MapReduce, Hive / RHIPE, RHive,..)

More information

DB진흥원 BIG DATA 전문가로 가는 길 발표자료.pptx

DB진흥원 BIG DATA 전문가로 가는 길 발표자료.pptx 빅데이터의기술영역과 요구역량 줌인터넷 ( 주 ) 김우승 소개 http://zum.com 줌인터넷(주) 연구소 이력 줌인터넷 SK planet SK Telecom 삼성전자 http://kimws.wordpress.com @kimws 목차 빅데이터살펴보기 빅데이터에서다루는문제들 NoSQL 빅데이터라이프사이클 빅데이터플랫폼 빅데이터를위한역량 빅데이터를위한역할별요구지식

More information

슬라이드 1

슬라이드 1 Big Architecture 2014.10.23 SK C&C Platform 사업팀이정일차장 Table of 1. Big 개요 2. Big 플랫폼아키텍처 3. 아키텍처수립시고려사항 4. 하둡배포판기반아키텍처 5. Case Study 1. Big 개요 Big 란 Big Big Big Big 3 1. Big 개요 Big 의특성 3V 데이터의크기 (Volume)

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 In-memory 클러스터컴퓨팅프레임워크 Hadoop MapReduce 대비 Machine Learning 등반복작업에특화 2009년, UC Berkeley AMPLab에서 Mesos 어플리케이션으로시작 2010년 Spark 논문발표, 2012년 RDD 논문발표 2013년에 Apache 프로젝트로전환후, 2014년 Apache op-level Project

More information

슬라이드 1

슬라이드 1 Data-driven Industry Reinvention All Things Data Con 2016, Opening speech SKT 종합기술원 최진성원장 Big Data Landscape Expansion Big Data Tech/Biz 진화방향 SK Telecom Big Data Activities Lesson Learned and Other Topics

More information

Open Cloud Engine Open Source Big Data Platform Flamingo Project Open Cloud Engine Flamingo Project Leader 김병곤

Open Cloud Engine Open Source Big Data Platform Flamingo Project Open Cloud Engine Flamingo Project Leader 김병곤 Open Cloud Engine Open Source Big Data Platform Flamingo Project Open Cloud Engine Flamingo Project Leader 김병곤 (byounggon.kim@opence.org) 빅데이터분석및서비스플랫폼 모바일 Browser 인포메이션카탈로그 Search 인포메이션유형 보안등급 생성주기 형식

More information

Intra_DW_Ch4.PDF

Intra_DW_Ch4.PDF The Intranet Data Warehouse Richard Tanler Ch4 : Online Analytic Processing: From Data To Information 2000. 4. 14 All rights reserved OLAP OLAP OLAP OLAP OLAP OLAP is a label, rather than a technology

More information

Cover Story 01 20 Oracle Big Data Vision 01_Big Data의 배경 02_Big Data의 정의 03_Big Data의 활용 방안 04_Big Data의 가치

Cover Story 01 20 Oracle Big Data Vision 01_Big Data의 배경 02_Big Data의 정의 03_Big Data의 활용 방안 04_Big Data의 가치 Oracle Big Data 오라클 빅 데이터 이야기 Cover Story 01 20 Oracle Big Data Vision 01_Big Data의 배경 02_Big Data의 정의 03_Big Data의 활용 방안 04_Big Data의 가치 최근 빅 데이터에 대한 관심이 커지고 있는데, 그 배경이 무엇일까요? 정말 다양한 소스로부터 엄청난 데이터들이 쏟아져

More information

[Brochure] KOR_TunA

[Brochure] KOR_TunA LG CNS LG CNS APM (TunA) LG CNS APM (TunA) 어플리케이션의 성능 개선을 위한 직관적이고 심플한 APM 솔루션 APM 이란? Application Performance Management 란? 사용자 관점 그리고 비즈니스 관점에서 실제 서비스되고 있는 어플리케이션의 성능 관리 체계입니다. 이를 위해서는 신속한 장애 지점 파악 /

More information

Web Application Hosting in the AWS Cloud Contents 개요 가용성과 확장성이 높은 웹 호스팅은 복잡하고 비용이 많이 드는 사업이 될 수 있습니다. 전통적인 웹 확장 아키텍처는 높은 수준의 안정성을 보장하기 위해 복잡한 솔루션으로 구현

Web Application Hosting in the AWS Cloud Contents 개요 가용성과 확장성이 높은 웹 호스팅은 복잡하고 비용이 많이 드는 사업이 될 수 있습니다. 전통적인 웹 확장 아키텍처는 높은 수준의 안정성을 보장하기 위해 복잡한 솔루션으로 구현 02 Web Application Hosting in the AWS Cloud www.wisen.co.kr Wisely Combine the Network platforms Web Application Hosting in the AWS Cloud Contents 개요 가용성과 확장성이 높은 웹 호스팅은 복잡하고 비용이 많이 드는 사업이 될 수 있습니다. 전통적인

More information

CONTENTS Volume.174 2013 09+10 06 테마 즐겨찾기 빅데이터의 현주소 진일보하는 공개 기술, 빅데이터 새 시대를 열다 12 테마 활동 빅데이터 플랫폼 기술의 현황 빅데이터, 하둡 품고 병렬처리 가속화 16 테마 더하기 국내 빅데이터 산 학 연 관

CONTENTS Volume.174 2013 09+10 06 테마 즐겨찾기 빅데이터의 현주소 진일보하는 공개 기술, 빅데이터 새 시대를 열다 12 테마 활동 빅데이터 플랫폼 기술의 현황 빅데이터, 하둡 품고 병렬처리 가속화 16 테마 더하기 국내 빅데이터 산 학 연 관 방송 통신 전파 KOREA COMMUNICATIONS AGENCY MAGAZINE 2013 VOL.174 09+10 CONTENTS Volume.174 2013 09+10 06 테마 즐겨찾기 빅데이터의 현주소 진일보하는 공개 기술, 빅데이터 새 시대를 열다 12 테마 활동 빅데이터 플랫폼 기술의 현황 빅데이터, 하둡 품고 병렬처리 가속화 16 테마 더하기 국내

More information

따끈따끈한 한국 Azure 데이터센터 서비스를 활용한 탁월한 데이터 분석 방안 (To be named)

따끈따끈한 한국 Azure 데이터센터 서비스를 활용한 탁월한 데이터 분석 방안 (To be named) 오늘그리고미래의전략적자산 데이터. 데이터에서인사이트까지 무엇이? 왜? 그리고? 그렇다면? Insight 데이터의변화 CONNECTED DIGITAL ANALOG 1985 1990 1995 2000 2005 2010 2015 2020 데이터의변화 CONNECTED DIGITAL ANALOG 1985 1990 1995 2000 2005 2010 2015 2020

More information

Slide 1

Slide 1 빅데이터기술의이해 2016. 8. 23 장형석 충북대비즈니스데이터융합학과교수 chjang1204@nate.com 장형석교수 # 경력 ( 현직 ) - 충북대학교비즈니스데이터융합학과 - 국민대학교빅데이터경영 MBA 과정겸임교수 - 연세대학교데이터사이언스과정외래교수 # 저서및역서 - [ 실전하둡운용가이드 ] 한빛미디어, 2013.07 - [ 빅데이터컴퓨팅기술 ]

More information

빅데이터_DAY key

빅데이터_DAY key Big Data Near You 2016. 06. 16 Prof. Sehyug Kwon Dept. of Statistics 4V s of Big Data Volume Variety Velocity Veracity Value 대용량 다양한 유형 실시간 정보 (불)확실성 가치 tera(1,0004) - peta -exazetta(10007) bytes in 2020

More information

Basic Template

Basic Template Hadoop EcoSystem 을홗용한 Hybrid DW 구축사례 2013-05-02 KT cloudware / NexR Project Manager 정구범 klaus.jung@{kt nexr}.com KT의대용량데이터처리이슈 적재 Data의폭발적인증가 LTE 등초고속무선 Data 통싞 : 트래픽이예상보다빨리 / 많이증가 비통싞 ( 컨텐츠 / 플랫폼 /Bio/

More information

Amazon EBS (Elastic Block Storage) Amazon EC2 Local Instance Store (Ephemeral Volumes) Amazon S3 (Simple Storage Service) / Glacier Elastic File Syste (EFS) Storage Gateway AWS Import/Export 1 Instance

More information

DBMS & SQL Server Installation Database Laboratory

DBMS & SQL Server Installation Database Laboratory DBMS & 조교 _ 최윤영 } 데이터베이스연구실 (1314 호 ) } 문의사항은 cyy@hallym.ac.kr } 과제제출은 dbcyy1@gmail.com } 수업공지사항및자료는모두홈페이지에서확인 } dblab.hallym.ac.kr } 홈페이지 ID: 학번 } 홈페이지 PW:s123 2 차례 } } 설치전점검사항 } 설치단계별설명 3 Hallym Univ.

More information

분산처리 프레임워크를 활용한대용량 영상 고속분석 시스템

분산처리 프레임워크를 활용한대용량 영상 고속분석 시스템 분산처리프레임워크를활용한 대용량영상고속분석시스템 2015.07.16 SK C&C 융합기술본부오상문 (sangmoon.oh@sk.com) 목차 I. 영상분석서비스 II. Apache Storm III.JNI (Java Native Interface) IV. Image Processing Libraries 2 1.1. 배경및필요성 I. 영상분석서비스 현재대부분의영상관리시스템에서영상분석은

More information

Global Bigdata 사용 현황 및 향후 활용 전망 빅데이터 미도입 이유 필요성 못느낌, 분석 가치 판단 불가 향후 투자를 집중할 분야는 보안 모니터링 분야 와 자동화 시스템 분야 빅데이터의 핵심 가치 - 트랜드 예측 과 제품 개선 도움 빅데이터 운영 애로 사항

Global Bigdata 사용 현황 및 향후 활용 전망 빅데이터 미도입 이유 필요성 못느낌, 분석 가치 판단 불가 향후 투자를 집중할 분야는 보안 모니터링 분야 와 자동화 시스템 분야 빅데이터의 핵심 가치 - 트랜드 예측 과 제품 개선 도움 빅데이터 운영 애로 사항 Global Bigdata 사용 현황 및 향후 활용 전망 빅데이터 미도입 이유 필요성 못느낌, 분석 가치 판단 불가 향후 투자를 집중할 분야는 보안 모니터링 분야 와 자동화 시스템 분야 빅데이터의 핵심 가치 - 트랜드 예측 과 제품 개선 도움 빅데이터 운영 애로 사항 - 재직자 전문성, 복잡성으로 인해 알고리즘 개발 난항 본 조사 내용은 美 Techpro Research

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 Spider For MySQL 실전사용기 피망플러스유닛최윤묵 Spider For MySQL Data Sharding By Spider Storage Engine http://spiderformysql.com/ 성능 8 만 / 분 X 4 대 32 만 / 분 많은 DB 중에왜 spider 를? Source: 클라우드컴퓨팅구 선택의기로 Consistency RDBMS

More information

플랫폼을말하다 2

플랫폼을말하다 2 데이터를실시간으로모아서 처리하고자하는다양한기법들 김병곤 fharenheit@gmail.com 플랫폼을말하다 2 실시간빅데이터의요건들 l 쇼핑몰사이트의사용자클릭스트림을통해실시간개인화 l 대용량이메일서버의스팸탐지및필터링 l 위치정보기반광고서비스 l 사용자및시스템이벤트를이용한실시간보안감시 l 시스템정보수집을통한장비고장예측 l 실시간차량추적및위치정보수집을이용한도로교통상황파악

More information

Business Agility () Dynamic ebusiness, RTE (Real-Time Enterprise) IT Web Services c c WE-SDS (Web Services Enabled SDS) SDS SDS Service-riented Architecture Web Services ( ) ( ) ( ) / c IT / Service- Service-

More information

Portal_9iAS.ppt [읽기 전용]

Portal_9iAS.ppt [읽기 전용] Application Server iplatform Oracle9 A P P L I C A T I O N S E R V E R i Oracle9i Application Server e-business Portal Client Database Server e-business Portals B2C, B2B, B2E, WebsiteX B2Me GUI ID B2C

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 ㆍ Natural Language Understanding 관련기술 ㆍ Semantic Parsing Conversational AI Natural Language Understanding / Machine Learning ㆍEntity Extraction and Resolution - Machine Learning 관련기술연구개발경험보유자ㆍStatistical

More information

클라우드컴퓨팅확산에따른국내경제시사점 클라우드컴퓨팅확산에따른국내경제시사점 * 1) IT,,,, Salesforce.com SaaS (, ), PaaS ( ), IaaS (, IT ), IT, SW ICT, ICT IT ICT,, ICT, *, (TEL)

클라우드컴퓨팅확산에따른국내경제시사점 클라우드컴퓨팅확산에따른국내경제시사점 * 1) IT,,,, Salesforce.com SaaS (, ), PaaS ( ), IaaS (, IT ), IT, SW ICT, ICT IT ICT,, ICT, *, (TEL) 클라우드컴퓨팅확산에따른국내경제시사점 클라우드컴퓨팅확산에따른국내경제시사점 * 1) IT,,,, Salesforce.com SaaS (, ), PaaS ( ), IaaS (, IT ), IT, SW ICT, ICT IT ICT,, ICT, *, (TEL) 02-570-4352 (e-mail) jjoon75@kisdi.re.kr 1 The Monthly Focus.

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 Reasons for Poor Performance Programs 60% Design 20% System 2.5% Database 17.5% Source: ORACLE Performance Tuning 1 SMS TOOL DBA Monitoring TOOL Administration TOOL Performance Insight Backup SQL TUNING

More information

ETL_project_best_practice1.ppt

ETL_project_best_practice1.ppt ETL ETL Data,., Data Warehouse DataData Warehouse ETL tool/system: ETL, ETL Process Data Warehouse Platform Database, Access Method Data Source Data Operational Data Near Real-Time Data Modeling Refresh/Replication

More information

PCServerMgmt7

PCServerMgmt7 Web Windows NT/2000 Server DP&NM Lab 1 Contents 2 Windows NT Service Provider Management Application Web UI 3 . PC,, Client/Server Network 4 (1),,, PC Mainframe PC Backbone Server TCP/IP DCS PLC Network

More information

PowerPoint Presentation

PowerPoint Presentation 1 2 Enterprise AI 인공지능 (AI) 을업무에도입하는최적의제안 Taewan Kim Solution Engineer Data & Analytics @2045 Imagine the endless possibilities to learn from 2.5 quintillion bytes of data generated every day AI REVOLUTION

More information

ecorp-프로젝트제안서작성실무(양식3)

ecorp-프로젝트제안서작성실무(양식3) (BSC: Balanced ScoreCard) ( ) (Value Chain) (Firm Infrastructure) (Support Activities) (Human Resource Management) (Technology Development) (Primary Activities) (Procurement) (Inbound (Outbound (Marketing

More information

RED HAT JBoss Data Grid (JDG)? KANGWUK HEO Middleware Solu6on Architect Service Team, Red Hat Korea 1

RED HAT JBoss Data Grid (JDG)? KANGWUK HEO Middleware Solu6on Architect Service Team, Red Hat Korea 1 RED HAT JBoss Data Grid (JDG)? KANGWUK HEO Middleware Solu6on Architect Service Team, Red Hat Korea 1 Agenda TITLE SLIDE: HEADLINE 1.? 2. Presenter Infinispan JDG 3. Title JBoss Data Grid? 4. Date JBoss

More information

빅데이터분산컴퓨팅-5-수정

빅데이터분산컴퓨팅-5-수정 Apache Hive 빅데이터분산컴퓨팅 박영택 Apache Hive 개요 Apache Hive 는 MapReduce 기반의 High-level abstraction HiveQL은 SQL-like 언어를사용 Hadoop 클러스터에서 MapReduce 잡을생성함 Facebook 에서데이터웨어하우스를위해개발되었음 현재는오픈소스인 Apache 프로젝트 Hive 유저를위한

More information

초보자를 위한 분산 캐시 활용 전략

초보자를 위한 분산 캐시 활용 전략 초보자를위한분산캐시활용전략 강대명 charsyam@naver.com 우리가꿈꾸는서비스 우리가꿈꾸는서비스 우리가꿈꾸는서비스 우리가꿈꾸는서비스 그러나현실은? 서비스에필요한것은? 서비스에필요한것은? 핵심적인기능 서비스에필요한것은? 핵심적인기능 서비스에필요한것은? 핵심적인기능 서비스에필요한것은? 적절한기능 서비스안정성 트위터에매일고래만보이면? 트위터에매일고래만보이면?

More information

빅데이터처리의핵심인 Hadoop 을오라클은어떻게지원하나요? Oracle Big Data Appliance Solution 01 빅데이터처리를위한전문솔루션이 Oracle Big Data Appliance 군요. Oracle Big Data Appliance 와함께라면더이

빅데이터처리의핵심인 Hadoop 을오라클은어떻게지원하나요? Oracle Big Data Appliance Solution 01 빅데이터처리를위한전문솔루션이 Oracle Big Data Appliance 군요. Oracle Big Data Appliance 와함께라면더이 Cover Story 03 28 Oracle Big Data Solution 01_Oracle Big Data Appliance 02_Oracle Big Data Connectors 03_Oracle Exdata In-Memory Database Machine 04_Oracle Endeca Information Discovery 05_Oracle Event

More information

NoSQL

NoSQL MongoDB Daum Communications NoSQL Using Java Java VM, GC Low Scalability Using C Write speed Auto Sharding High Scalability Using Erlang Read/Update MapReduce R/U MR Cassandra Good Very Good MongoDB Good

More information

Cloud Friendly System Architecture

Cloud Friendly System Architecture -Service Clients Administrator 1. -Service 구성도 : ( 좌측참고 ) LB(LoadBlancer) 2. -Service 개요 ucloud Virtual Router F/W Monitoring 개념 특징 적용가능분야 Server, WAS, DB 로구성되어 web service 를클라우드환경에서제공하기위한 service architecture

More information

DW 개요.PDF

DW 개요.PDF Data Warehouse Hammersoftkorea BI Group / DW / 1960 1970 1980 1990 2000 Automating Informating Source : Kelly, The Data Warehousing : The Route to Mass Customization, 1996. -,, Data .,.., /. ...,.,,,.

More information

들어가는글 2012년 IT 분야에서최고의관심사는아마도빅데이터일것이다. 관계형데이터진영을대표하는오라클은 2011년 10월개최된 오라클오픈월드 2011 에서오라클빅데이터어플라이언스 (Oracle Big Data Appliance, 이하 BDA) 를출시한다고발표하였다. 이와

들어가는글 2012년 IT 분야에서최고의관심사는아마도빅데이터일것이다. 관계형데이터진영을대표하는오라클은 2011년 10월개최된 오라클오픈월드 2011 에서오라클빅데이터어플라이언스 (Oracle Big Data Appliance, 이하 BDA) 를출시한다고발표하였다. 이와 Oracle Data Integrator 와 Oracle Big Data Appliance 저자 - 김태완부장, 한국오라클 Fusion Middleware(taewan.kim@oracle.com) 오라클은최근 Big Data 분약에 End-To-End 솔루션을지원하는벤더로급부상하고있고, 기존관계형데이터저장소와새로운트랜드인비정형빅데이터를통합하는데이터아키텍처로엔터프로이즈시장에서주목을받고있다.

More information

Microsoft PowerPoint - Smart CRM v4.0_TM 소개_20160320.pptx

Microsoft PowerPoint - Smart CRM v4.0_TM 소개_20160320.pptx (보험TM) 소개서 2015.12 대표전화 : 070 ) 7405 1700 팩스 : 02 ) 6012 1784 홈 페이지 : http://www.itfact.co.kr 목 차 01. Framework 02. Application 03. 회사 소개 01. Framework 1) Architecture Server Framework Client Framework

More information

Microsoft Word - 조병호

Microsoft Word - 조병호 포커스 클라우드 컴퓨팅 서비스 기술 및 표준화 추진 동향 조병호* 2006년에 클라우딩 컴퓨팅이란 용어가 처음 생겨난 이래 글로벌 IT 기업 CEO들이 잇달아 차 기 핵심 기술로 클라우드 컴퓨팅을 지목하면서 전세계적으로 클라우드 컴퓨팅이라는 새로운 파 라다임에 관심이 고조되고 있다. 클라우드 컴퓨팅 기술을 이용하면 효율적인 IT 자원을 운용할 수 있으며 비용절감

More information

AGENDA 01 02 03 모바일 산업의 환경변화 모바일 클라우드 서비스의 등장 모바일 클라우드 서비스 융합사례

AGENDA 01 02 03 모바일 산업의 환경변화 모바일 클라우드 서비스의 등장 모바일 클라우드 서비스 융합사례 모바일 클라우드 서비스 융합사례와 시장 전망 및 신 사업전략 2011. 10 AGENDA 01 02 03 모바일 산업의 환경변화 모바일 클라우드 서비스의 등장 모바일 클라우드 서비스 융합사례 AGENDA 01. 모바일 산업의 환경 변화 가치 사슬의 분화/결합 모바일 업계에서도 PC 산업과 유사한 모듈화/분업화 진행 PC 산업 IBM à WinTel 시대 à

More information

Agenda 오픈소스 트렌드 전망 Red Hat Enterprise Virtualization Red Hat Enterprise Linux OpenStack Platform Open Hybrid Cloud

Agenda 오픈소스 트렌드 전망 Red Hat Enterprise Virtualization Red Hat Enterprise Linux OpenStack Platform Open Hybrid Cloud 오픈소스 기반 레드햇 클라우드 기술 Red Hat, Inc. Senior Solution Architect 최원영 부장 wchoi@redhat.com Agenda 오픈소스 트렌드 전망 Red Hat Enterprise Virtualization Red Hat Enterprise Linux OpenStack Platform Open Hybrid Cloud Red

More information

vm-웨어-앞부속

vm-웨어-앞부속 VMware vsphere 4 This document was created using the official VMware icon and diagram library. Copyright 2009 VMware, Inc. All rights reserved. This product is protected by U.S. and international copyright

More information

sdf

sdf 하둡기반트래픽분석경험으로 보는 IoT 데이터수집및분석방법 2014. 5. 29 이영석 lee@cnu.ac.kr 충남대학교컴퓨터공학과데이터네트워크연구실 (http://networks.cnu.ac.kr ) 1 발표내용 하둡기반인터넷트래픽측정 IoT 데이터수집과분석 결론 2 인터넷트래픽측정분석연구 Challenges Scalability Storage for bulky

More information

쉽게 풀어쓴 C 프로그래밊

쉽게 풀어쓴 C 프로그래밊 Power Java 제 27 장데이터베이스 프로그래밍 이번장에서학습할내용 자바와데이터베이스 데이터베이스의기초 SQL JDBC 를이용한프로그래밍 변경가능한결과집합 자바를통하여데이터베이스를사용하는방법을학습합니다. 자바와데이터베이스 JDBC(Java Database Connectivity) 는자바 API 의하나로서데이터베이스에연결하여서데이터베이스안의데이터에대하여검색하고데이터를변경할수있게한다.

More information

슬라이드 1

슬라이드 1 2015( 제 8 회 ) 한국소프트웨어아키텍트대회 OSS 성능모니터링을위한 Open Source SW 2015. 07. 16 LG CNS 김성조 Tomcat & MariaDB 성능모니터링 Passion Open Source Software Open Hadoop IT Service Share Communication Enterprise Source Access

More information

슬라이드 1

슬라이드 1 실시간분산병렬 CEP 플랫폼 2015. 10 Agenda 목차 I. SK 빅데이터솔루션소개 III. 실시간분산병렬 CEP PoC 사례 1. 배경및필요성 2. 확보방안 3. 솔루션 Coverage 4. 솔루션아키텍처 1. 동기및개선방향 2. 데이터흐름도 3. 아키텍처 II. 실시간분산병렬 CEP IV. 맺음말 1. 개요 1. 향후추진방향 2. 고려사항 2. Summary

More information

문서의 제목 나눔고딕B, 54pt

문서의 제목 나눔고딕B, 54pt 실시간데이터수집및처리 Network Computing System Architecture Lab Dongguk University MooSeon Choi 2013.11.07 목차 1. 연구목표 2. 2차발표리뷰 3. 실시간데이터수집및처리 4. 향후연구계획 3 / 14 연구목표 ( 1 세부 데이터페더레이션을위한기술 ) 모바일기반 SNS( 비정형 ) 데이터와기존

More information

DKE Templete

DKE Templete Apache Spark 첫걸음 조원형 * 김영국 Department of Computer Science, Kangwon National University Apache Spark 란? Apache Spark 빅데이터처리를위한범용적이며빠른분산처리엔진 하둡 (Apache Hadoop) 기반의맵리듀스 (MapReduce) 작업의단점을보완하기위해연구가시작됨 2009

More information

1217 WebTrafMon II

1217 WebTrafMon II (1/28) (2/28) (10 Mbps ) Video, Audio. (3/28) 10 ~ 15 ( : telnet, ftp ),, (4/28) UDP/TCP (5/28) centralized environment packet header information analysis network traffic data, capture presentation network

More information

<4D F736F F F696E74202D203137C0E55FBFACBDC0B9AEC1A6BCD6B7E7BCC72E707074>

<4D F736F F F696E74202D203137C0E55FBFACBDC0B9AEC1A6BCD6B7E7BCC72E707074> SIMATIC S7 Siemens AG 2004. All rights reserved. Date: 22.03.2006 File: PRO1_17E.1 차례... 2 심벌리스트... 3 Ch3 Ex2: 프로젝트생성...... 4 Ch3 Ex3: S7 프로그램삽입... 5 Ch3 Ex4: 표준라이브러리에서블록복사... 6 Ch4 Ex1: 실제구성을 PG 로업로드하고이름변경......

More information

Chap7.PDF

Chap7.PDF Chapter 7 The SUN Intranet Data Warehouse: Architecture and Tools All rights reserved 1 Intranet Data Warehouse : Distributed Networking Computing Peer-to-peer Peer-to-peer:,. C/S Microsoft ActiveX DCOM(Distributed

More information

PowerPoint Presentation

PowerPoint Presentation 하둡전문가로가는길 심탁길 terryshim@naver.com 목차 1. 하둡과에코시스템개요 2. 홗용사례붂석 3. 하둡젂문가의필요성 4. 무엇을어떻게준비할까? 5. 하둡기반추천시스템데모 하둡개요 구글인프라 배치애플리케이션 온라인서비스 MapReduce Bigtable GFS Client API Chubby Cluster Mgmt 주요소프트웨어스택 Google

More information

Voice Portal using Oracle 9i AS Wireless

Voice Portal using Oracle 9i AS Wireless Voice Portal Platform using Oracle9iAS Wireless 20020829 Oracle Technology Day 1 Contents Introduction Voice Portal Voice Web Voice XML Voice Portal Platform using Oracle9iAS Wireless Voice Portal Video

More information

The Self-Managing Database : Automatic Health Monitoring and Alerting

The Self-Managing Database : Automatic Health Monitoring and Alerting The Self-Managing Database : Automatic Health Monitoring and Alerting Agenda Oracle 10g Enterpirse Manager Oracle 10g 3 rd Party PL/SQL API Summary (Self-Managing Database) ? 6% 6% 12% 55% 6% Source: IOUG

More information

슬라이드 1

슬라이드 1 Tadpole for DB 1. 도구개요 2. 설치및실행 4. 활용예제 1. 도구개요 도구명 소개 Tadpole for DB Tools (sites.google.com/site/tadpolefordb/) 웹기반의데이터베이스를관리하는도구 Database 스키마및데이터관리 라이선스 LGPL (Lesser General Public License) 특징 주요기능

More information

OZ-LMS TM OZ-LMS 2008 OZ-LMS 2006 OZ-LMS Lite Best IT Serviece Provider OZNET KOREA Management Philosophy & Vision Introduction OZNETKOREA IT Mission Core Values KH IT ERP Web Solution IT SW 2000 4 3 508-2

More information

ORANGE FOR ORACLE V4.0 INSTALLATION GUIDE (Online Upgrade) ORANGE CONFIGURATION ADMIN O

ORANGE FOR ORACLE V4.0 INSTALLATION GUIDE (Online Upgrade) ORANGE CONFIGURATION ADMIN O Orange for ORACLE V4.0 Installation Guide ORANGE FOR ORACLE V4.0 INSTALLATION GUIDE...1 1....2 1.1...2 1.2...2 1.2.1...2 1.2.2 (Online Upgrade)...11 1.3 ORANGE CONFIGURATION ADMIN...12 1.3.1 Orange Configuration

More information

Service-Oriented Architecture Copyright Tmax Soft 2005

Service-Oriented Architecture Copyright Tmax Soft 2005 Service-Oriented Architecture Copyright Tmax Soft 2005 Service-Oriented Architecture Copyright Tmax Soft 2005 Monolithic Architecture Reusable Services New Service Service Consumer Wrapped Service Composite

More information

PowerPoint

PowerPoint .. http://www.acs.co.kr -1- .. http://www.acs.co.kr -3- ( Advanced Computer Services Co.,Ltd. ) 345-9 SK B8 ( sh_kim@acs.co.kr ) 116-81-24039 http://www.acs.co.kr, http://www.emanufacturing.co.kr (Fax)

More information

スライド タイトルなし

スライド タイトルなし 2 3 회사 소개 60%출자 40%출자 주식회사 NTT데이타 아이테크 NTT DATA의 영업협력이나 첨단기술제공, 인재육성등 여러가지 지원을 통해서 SII 그룹을 대상으로 고도의 정보 서비스를 제공 함과 동시에 NTT DATA ITEC 가 보유하고 있는 높은 업무 노하우 와 SCM을 비롯한 ERP분야의 기술력을 살려서 조립가공계 및 제조업 등 새로운 시장에

More information

Oracle Apps Day_SEM

Oracle Apps Day_SEM Senior Consultant Application Sales Consulting Oracle Korea - 1. S = (P + R) x E S= P= R= E= Source : Strategy Execution, By Daniel M. Beall 2001 1. Strategy Formulation Sound Flawed Missed Opportunity

More information

J2EE & Web Services iSeminar

J2EE & Web Services iSeminar 9iAS :, 2002 8 21 OC4J Oracle J2EE (ECperf) JDeveloper : OLTP : Oracle : SMS (Short Message Service) Collaboration Suite Platform Email Developer Suite Portal Java BI XML Forms Reports Collaboration Suite

More information

Oracle Database 10g: Self-Managing Database DB TSC

Oracle Database 10g: Self-Managing Database DB TSC Oracle Database 10g: Self-Managing Database DB TSC Agenda Overview System Resource Application & SQL Storage Space Backup & Recovery ½ Cost ? 6% 12 % 6% 6% 55% : IOUG 2001 DBA Survey ? 6% & 12 % 6% 6%

More information

슬라이드 1

슬라이드 1 2015( 제 8 회 ) 한국소프트웨어아키텍트대회 Database In-Memory 2015. 07. 16 한국오라클 김용한 Agenda 1 2 3 4 5 6 In-Memory Computing 개요주요요소기술 In-Memory의오해와실제적용시고려사항 12c In-Memory Option의소개결론 2 1. In-Memory Computing 개요 전통적인데이터처리방식

More information

비식별화 기술 활용 안내서-최종수정.indd

비식별화 기술 활용 안내서-최종수정.indd 빅데이터 활용을 위한 빅데이터 담당자들이 실무에 활용 할 수 있도록 비식별화 기술과 활용방법, 실무 사례 및 예제, 분야별 참고 법령 및 활용 Q&A 등 안내 개인정보 비식별화 기술 활용 안내서 Ver 1.0 작성 및 문의 미래창조과학부 : 양현철 사무관 / 김자영 주무관 한국정보화진흥원 : 김진철 수석 / 김배현 수석 / 신신애 부장 문의 : cckim@nia.or.kr

More information

SQL Developer Connect to TimesTen 유니원아이앤씨 DB 기술지원팀 2010 년 07 월 28 일 문서정보 프로젝트명 SQL Developer Connect to TimesTen 서브시스템명 버전 1.0 문서명 작성일 작성자

SQL Developer Connect to TimesTen 유니원아이앤씨 DB 기술지원팀 2010 년 07 월 28 일 문서정보 프로젝트명 SQL Developer Connect to TimesTen 서브시스템명 버전 1.0 문서명 작성일 작성자 SQL Developer Connect to TimesTen 유니원아이앤씨 DB 팀 2010 년 07 월 28 일 문서정보 프로젝트명 SQL Developer Connect to TimesTen 서브시스템명 버전 1.0 문서명 작성일 2010-07-28 작성자 김학준 최종수정일 2010-07-28 문서번호 20100728_01_khj 재개정이력 일자내용수정인버전

More information

이도경, 최덕재 Dokyeong Lee, Deokjai Choi 1. 서론

이도경, 최덕재 Dokyeong Lee, Deokjai Choi 1. 서론 이도경, 최덕재 Dokyeong Lee, Deokjai Choi 1. 서론 2. 관련연구 2.1 MQTT 프로토콜 Fig. 1. Topic-based Publish/Subscribe Communication Model. Table 1. Delivery and Guarantee by MQTT QoS Level 2.1 MQTT-SN 프로토콜 Fig. 2. MQTT-SN

More information

Oracle9i Real Application Clusters

Oracle9i Real Application Clusters Senior Sales Consultant Oracle Corporation Oracle9i Real Application Clusters Agenda? ? (interconnect) (clusterware) Oracle9i Real Application Clusters computing is a breakthrough technology. The ability

More information

Agenda

Agenda Agenda 코타나인텔리전스소개 Gallery, Solution Template 데모1. ML Tutorial : Classification 데모2. HDI 생성방법, Spark notebook demo, Power BI 시각화 데모3. 인지서비스 Live demo, Intelligent Kiosk 데모4. 챗봇 Skype Preview + LUIS Digital

More information

Microsoft PowerPoint - 3장-MS SQL Server.ppt [호환 모드]

Microsoft PowerPoint - 3장-MS SQL Server.ppt [호환 모드] MS SQL Server 마이크로소프트사가윈도우운영체제를기반으로개발한관계 DBMS 모바일장치에서엔터프라이즈데이터시스템에이르는다양한플랫폼에서운영되는통합데이터관리및분석솔루션 2 MS SQL Server 개요 3.1 MS SQL Server 개요 클라이언트-서버모델을기반으로하는관계 DBMS로서윈도우계열의운영체제에서만동작함 오라클관계 DBMS보다가격이매우저렴한편이고,

More information

Spring Boot/JDBC JdbcTemplate/CRUD 예제

Spring Boot/JDBC JdbcTemplate/CRUD 예제 Spring Boot/JDBC JdbcTemplate/CRUD 예제 오라클자바커뮤니티 (ojc.asia, ojcedu.com) Spring Boot, Gradle 과오픈소스인 MariaDB 를이용해서 EMP 테이블을만들고 JdbcTemplate, SimpleJdbcTemplate 을이용하여 CRUD 기능을구현해보자. 마리아 DB 설치는다음 URL 에서확인하자.

More information

Eclipse 와 Firefox 를이용한 Javascript 개발 발표자 : 문경대 11 년 10 월 26 일수요일

Eclipse 와 Firefox 를이용한 Javascript 개발 발표자 : 문경대 11 년 10 월 26 일수요일 Eclipse 와 Firefox 를이용한 Javascript 개발 발표자 : 문경대 Introduce Me!!! Job Jeju National University Student Ubuntu Korean Jeju Community Owner E-Mail: ned3y2k@hanmail.net Blog: http://ned3y2k.wo.tc Facebook: http://www.facebook.com/gyeongdae

More information

금오공대 컴퓨터공학전공 강의자료

금오공대 컴퓨터공학전공 강의자료 데이터베이스및설계 Chap 2. 데이터베이스관리시스템 2013.03.11. 오병우 컴퓨터공학과 Inconsistency of file system File System Each application has its own private files Widely dispersed and difficult to control File 중심자료처리시스템의한계 i. 응용프로그램의논리적파일구조는직접물리적파일구조로구현

More information

Cover Story 빅데이터플랫폼 Big Data 시대의엔터프라이즈인프라스트럭처 ORACLE KOREA MAGAZINE Spring 개요빅데이터를처리하는기술의가장중심기술은아파치하둡기술일것이다. 하둡기술은데이터를취득하고이를구조화시키고분석을하는일련의과정에

Cover Story 빅데이터플랫폼 Big Data 시대의엔터프라이즈인프라스트럭처 ORACLE KOREA MAGAZINE Spring 개요빅데이터를처리하는기술의가장중심기술은아파치하둡기술일것이다. 하둡기술은데이터를취득하고이를구조화시키고분석을하는일련의과정에 Cover Story 04 빅데이터플랫폼 Big Data 시대의엔터프라이즈인프라스트럭처 저자 - 홍기현상무, 한국오라클 Tech Sales Consultant(kihyun.hong@oracle.com) 빅데이터기술은데이터크기혹은증가속도가빠르고데이터저장형태도다양하여이를 모델링후분석하기에는부적합한형태의데이터를분산시스템을이용하여분석하는기술이다. 또한빅데이터로는트위터나페이스북같은소셜미디어에올라온데이터가언급되기도하지만,

More information

Ubiqutious Pubilc Access Reference Model

Ubiqutious Pubilc Access  Reference Model Hadoop/Hbase 기반의 Twitter 공간정보분석 군산대학교컴퓨터정보공학과 {pseudo_jo, didvuddn, kwnam}@kunsan.ac.kr 조현구, 양평우, 남광우 배경및필요성 Twitter 스트림에서의공간정보추출 - 공간현상의추출및공유부분은부족 Twitter 스트림에서의정보추출 - 자연어기반텍스트정보셋에서의키워드추출 - 시간의변화에따른이슈변화모니터링

More information

Cache_cny.ppt [읽기 전용]

Cache_cny.ppt [읽기 전용] Application Server iplatform Oracle9 A P P L I C A T I O N S E R V E R i Improving Performance and Scalability with Oracle9iAS Cache Oracle9i Application Server Cache... Oracle9i Application Server Web

More information

C# Programming Guide - Types

C# Programming Guide - Types C# Programming Guide - Types 최도경 lifeisforu@wemade.com 이문서는 MSDN 의 Types 를요약하고보충한것입니다. http://msdn.microsoft.com/enus/library/ms173104(v=vs.100).aspx Types, Variables, and Values C# 은 type 에민감한언어이다. 모든

More information

목차 BUG offline replicator 에서유효하지않은로그를읽을경우비정상종료할수있다... 3 BUG 각 partition 이서로다른 tablespace 를가지고, column type 이 CLOB 이며, 해당 table 을 truncate

목차 BUG offline replicator 에서유효하지않은로그를읽을경우비정상종료할수있다... 3 BUG 각 partition 이서로다른 tablespace 를가지고, column type 이 CLOB 이며, 해당 table 을 truncate ALTIBASE HDB 6.1.1.5.6 Patch Notes 목차 BUG-39240 offline replicator 에서유효하지않은로그를읽을경우비정상종료할수있다... 3 BUG-41443 각 partition 이서로다른 tablespace 를가지고, column type 이 CLOB 이며, 해당 table 을 truncate 한뒤, hash partition

More information

<C0CCBCBCBFB52DC1A4B4EBBFF82DBCAEBBE7B3EDB9AE2D313939392D382E687770>

<C0CCBCBCBFB52DC1A4B4EBBFF82DBCAEBBE7B3EDB9AE2D313939392D382E687770> i ii iii iv v vi 1 2 3 4 가상대학 시스템의 국내외 현황 조사 가상대학 플랫폼 개발 이상적인 가상대학시스템의 미래상 제안 5 웹-기반 가상대학 시스템 전통적인 교수 방법 시간/공간 제약을 극복한 학습동기 부여 교수의 일방적인 내용전달 교수와 학생간의 상호작용 동료 학생들 간의 상호작용 가상대학 운영 공지사항,강의록 자료실, 메모 질의응답,

More information

슬라이드 제목 없음

슬라이드 제목 없음 MS SQL Server 마이크로소프트사가윈도우운영체제를기반으로개발한관계 DBMS 모바일장치에서엔터프라이즈데이터시스템에이르는다양한플랫폼에서운영되는통합데이터관리및분석솔루션 2 MS SQL Server 개요 3.1 MS SQL Server 개요 클라이언트-서버모델을기반으로하는관계 DBMS 로서윈도우계열의운영체제에서만동작함 오라클관계 DBMS 보다가격이매우저렴한편이고,

More information

Integ

Integ HP Integrity HP Chipset Itanium 2(Processor 9100) HP Integrity HP, Itanium. HP Integrity Blade BL860c HP Integrity Blade BL870c HP Integrity rx2660 HP Integrity rx3600 HP Integrity rx6600 2 HP Integrity

More information

PowerPoint Presentation

PowerPoint Presentation MapR Platform 2017 MapR Technologies 1 빅데이터시장동향 2017 MapR Technologies 2 빅데이터시장동향 기업 IT 환경의변화 1980 년대모든데이터를플랫파일로관리하던어려움을극복하고자데이터베이스시스템이시장에출시된이후로기업용 어플리케이션등장, 인터넷의등장, 디지털변혁접목등기업혁신의핵심에는항상데이터가중요한역할을함 1980s

More information

chapter4

chapter4 Basic Netw rk 1. ก ก ก 2. 3. ก ก 4. ก 2 1. 2. 3. 4. ก 5. ก 6. ก ก 7. ก 3 ก ก ก ก (Mainframe) ก ก ก ก (Terminal) ก ก ก ก ก ก ก ก 4 ก (Dumb Terminal) ก ก ก ก Mainframe ก CPU ก ก ก ก 5 ก ก ก ก ก ก ก ก ก ก

More information

PowerPoint Presentation

PowerPoint Presentation 빅데이터아키텍쳐소개 임상배 (sangbae.lim@oracle.com) Technology Sales Consulting, Oracle Korea Agenda 빅데이터아키텍쳐트랜드 빅데이터활용단계별요소기술 사업방향및활용사례 요약 Q&A 빅데이터아키텍쳐트랜드 빅데이터아키텍쳐트랜드 오픈소스와기간계, 정보계시스템과의융합 현재빅데이터의열풍의근원은하둡 (Hadoop)

More information

PowerPoint Template

PowerPoint Template 빅데이터실시간분석기술동향및적용사례 2013. 10. 08 ( 주 ) 리얼타임테크 목차 1. 빅데이터개요 2. 빅데이터분석개요 3. 빅데이터분석기술 4. 사례연구 2 1. 빅데이터개요 3 빅데이터개요 빅데이터기술의등장배경 Source : IDC Digital universe study(2011) Source : IDC (2012) Digital Universe:

More information

지능형 IoT 를위한빅데이터기술현황 이러한추세는 2016년가트너의 신기술하이퍼사이클 보고서에도그대로드러나있다. 하이퍼사이클상의머신러닝은디지털비즈니스혁신을위한기술로서의정점에있으며, IoT 플랫폼기술이그뒤를따르고있다. 빅데이터기반의처리기술의바탕위에서가장대두되는어플리케이션이

지능형 IoT 를위한빅데이터기술현황 이러한추세는 2016년가트너의 신기술하이퍼사이클 보고서에도그대로드러나있다. 하이퍼사이클상의머신러닝은디지털비즈니스혁신을위한기술로서의정점에있으며, IoT 플랫폼기술이그뒤를따르고있다. 빅데이터기반의처리기술의바탕위에서가장대두되는어플리케이션이 기획특집 지능형 IoT 를위한빅데이터기술현황 이연희선임연구원, 유웅식 표철식책임연구원 / 한국전자통신연구원, KSB 융합연구단 yeonhee@apache.org 서론 지난해알파고와이세돌의대결을기점으로자율주행 자동차, 인공지능비서등인공지능에대한관심이한층 높아졌다. 이러한흐름에맞춰 IoT 시장에서도인텔리전트 IoT라는이름으로농업, 제조, 에너지등다양한산업분야에서모니터링,

More information

Bigdata가 제공하는 구체적인 혜택과 변화 양상 기업의 데이터 기반의 의사결정 시스템 구축 의지 확대 양상 빅데이터를 활용한 경영 및 마케팅 지속적인 증가세 뚜렷 빅데이터를 도입한 기업은 사전 기대를 뛰어넘는 효과를 경험 본 조사 내용은 美 BARC- Researc

Bigdata가 제공하는 구체적인 혜택과 변화 양상 기업의 데이터 기반의 의사결정 시스템 구축 의지 확대 양상 빅데이터를 활용한 경영 및 마케팅 지속적인 증가세 뚜렷 빅데이터를 도입한 기업은 사전 기대를 뛰어넘는 효과를 경험 본 조사 내용은 美 BARC- Researc Bigdata가 제공하는 구체적인 혜택과 변화 양상 기업의 데이터 기반의 의사결정 시스템 구축 의지 확대 양상 빅데이터를 활용한 경영 및 마케팅 지속적인 증가세 뚜렷 빅데이터를 도입한 기업은 사전 기대를 뛰어넘는 효과를 경험 본 조사 내용은 美 BARC- Researcht 社 가 2015년 대륙별 표본을 추출한 글로벌 546개사를 대상으로 리서치를 수행하여

More information

위세아이텍_iOLAP_

위세아이텍_iOLAP_ 빅데이터관리와분석을위한 플랫폼융합활용사례 BI Forum 분석시스템구축 Review(1/2) 1 분석시스템구축 Review(2/2) 분석속도가느리다면? 정보요구사항이변하거나 추가된다면? 데이터량이너무많다면? 2 과거의빅데이터저장 데이터량이너무많다 그러나 RDBMS 에서관리하는것은 막대한비용소요 지금까지의처리방안 1. 데이터간에우선순위부여 신용카드데이터 > 상품데이터

More information

목 차

목      차 Oracle 9i Admim 1. Oracle RDBMS 1.1 (System Global Area:SGA) 1.1.1 (Shared Pool) 1.1.2 (Database Buffer Cache) 1.1.3 (Redo Log Buffer) 1.1.4 Java Pool Large Pool 1.2 Program Global Area (PGA) 1.3 Oracle

More information

[Brochure] KOR_LENA WAS_

[Brochure] KOR_LENA WAS_ LENA Web Application Server LENA Web Application Server 빠르고확장가능하며장애를선대응할수있는운영중심의고효율차세대 Why 클라우드환경과데이터센터운영의노하우가결집되어편리한 관리기능과대용량트랜잭션을빠르고쉽게구현함으로고객의 IT Ownership을강화하였습니다. 고객의고민사항 전통 의 Issue Complexity Over

More information

vm-웨어-01장

vm-웨어-01장 Chapter 16 21 (Agenda). (Green),., 2010. IT IT. IT 2007 3.1% 2030 11.1%, IT 2007 1.1.% 2030 4.7%, 2020 4 IT. 1 IT, IT. (Virtualization),. 2009 /IT 2010 10 2. 6 2008. 1970 MIT IBM (Mainframe), x86 1. (http

More information

Cloudera Toolkit (Dark) 2018

Cloudera Toolkit (Dark) 2018 BIG DATA LAKE 구축사례 굿모닝아이텍 / 박근봉상무 AGENDA 1. BIGDATA 현황 2. Cloudera Bigdata Lake 3. BIG DATA LAKE 구축사례 2 BIGDATA 현황 3 BIGDATA 현황 2020 년국내빅데이터시장약 9 억달러 2006 년 빅데이터 (Big Data) 가구글검색어로처음등장한이래 2012 년다보스포럼에선그해가장중요한기술중하나로빅데이터를꼽았다.

More information

슬라이드 1

슬라이드 1 Hadoop 기반 규모확장성있는패킷분석도구 충남대학교데이터네트워크연구실이연희 yhlee06@cnu.ac.kr Intro 목차 인터넷트래픽측정 Apache Hadoop Hadoop 기반트래픽분석시스템 Hadoop을이용한트래픽분석예제 - 2- Intro 트래픽이란 - 3- Intro Data Explosion - 4- Global Trend: Data Explosion

More information

IBM Business Intelligence Solution Seminar 2005 Choose the Right Data Integration Solution ; Best Practices on EII/EAI/ETL IBM DB2 Technical Sales BI

IBM Business Intelligence Solution Seminar 2005 Choose the Right Data Integration Solution ; Best Practices on EII/EAI/ETL IBM DB2 Technical Sales BI Choose the Right Data Integration Solution ; Best Practices on EII/EAI/ETL IBM DB2 Technical Sales BI Team (byrhee@kr.ibm.com) 2005 IBM Corporation Agenda I. II. ETL, EII, EAI III. ETL, EII, EAI Best Practice

More information

PowerPoint Presentation

PowerPoint Presentation RHive 와빅데이터분석 - 넥스알 Agenda 1. RHive 의소개 RHive 란? RHive 기능 & 사용법 Enterprise RHive 2. RHive 의운용사례 CloudLog CDR 2 R 분석가를 RHive 탄생배경 RHive 의소개 Big Data 플랫폼의데이터처리능력과 R 의데이터분석기능의결합필요성이대두됨 3 RHive 의정의 RHive 의소개

More information

출원국 권 리 구 분 상 태 권리번호 KR 특허 등록 10-2012-0092520 10-2012-0092518 10-2007-0071793 10-2012-0092517

출원국 권 리 구 분 상 태 권리번호 KR 특허 등록 10-2012-0092520 10-2012-0092518 10-2007-0071793 10-2012-0092517 기술사업성평가서 경쟁정보분석서비스 제공 기술 2014 8 출원국 권 리 구 분 상 태 권리번호 KR 특허 등록 10-2012-0092520 10-2012-0092518 10-2007-0071793 10-2012-0092517 Ⅰ 기술 구현 메커니즘 - 1 - 경쟁정보분석서비스 항목 - 2 - 핵심 기술 특징 및 주요 도면

More information

SANsymphony-V

SANsymphony-V 국내대표적인구축사례 (KR) XXXX공사(공공) 2013년 12월 도입 센터 이전에 따른 스토리지가상화 통합 및 이기종통합 이기종 스토리지 (무중단이중하) 무중단 서비스 확보 24시간 운영 체계의 고가용 확보 스토리지 인프라의 유연한 구성 및 통합 환경 구축 업무서버 Unix 20대 업무서버 V 58대 CIe SSD(Fusion IO 3.2TB) ㅇㅇㅇㅇㅇㅇ

More information