Master presentation template three line maximum — First Lastname Job Title

Similar documents
PowerPoint Presentation

Integ

김기남_ATDC2016_160620_[키노트].key

Microsoft Word - zfs-storage-family_ko.doc

Oracle9i Real Application Clusters


_LG히다찌 브로슈어

3.Bladesystem

CONTENTS 목차 1. 전원 및 설치시 주의사항 2 2. 시스템 사용시 바른 자세 4 3. 시스템 구성품 확인 5 슬림형 케이스1 6 슬림형 케이스2 7 타워형 케이스1 8 타워형 케이스2 9 일체형 케이스1 10 망분리형 케이스 시스템 시작 및 종료

IBM Power Systems

Dell과 함께라면 가능합니다. 처음 도입하는 서버 또는 두 번째로 도입하는 서버이거나 네트워크를 확장시키거나 관리 기능을 강화하는 등의 모든 요구 사항을 Dell은 지원할 수 있습니다. Dell은 특성이 각기 다른 모든 조직과 회사마다 서로 다른 시점에 서로 다른 요

PowerPoint 프레젠테이션

슬라이드 1

CONTENTS CONTENTS CONTENT 1. SSD & HDD 비교 2. SSD 서버 & HDD 서버 비교 3. LSD SSD 서버 & HDD 서버 비교 4. LSD SSD 서버 & 글로벌 SSD 서버 비교 2

Storage advances and Ne over fabric

리뉴얼 xtremI 최종 softcopy

IBM Power Systems Accelerated Compute(AC922) Server IB IBM Power Systems Accelerated Compute(AC922) Server는엔터프라이즈급 AI 환경을위한최강의가속화솔루션입니다. 170GB/s CPU P

Microsoft PowerPoint - eSlim SV [ ]

PowerPoint Presentation

Microsoft PowerPoint - eSlim SV [080116]

<목 차 > 제 1장 일반사항 4 I.사업의 개요 4 1.사업명 4 2.사업의 목적 4 3.입찰 방식 4 4.입찰 참가 자격 4 5.사업 및 계약 기간 5 6.추진 일정 6 7.사업 범위 및 내용 6 II.사업시행 주요 요건 8 1.사업시행 조건 8 2.계약보증 9 3

Copyright IBM Corporation 2017 한국아이비엠주식회사 (07326) 서울시영등포구국제금융로10 서울국제금융센터 (Three IFC) TEL : (02) 년 2 월 Printed in Korea

Copyright IBM Corporation 2017 한국아이비엠주식회사 (07326) 서울시영등포구국제금융로10 서울국제금융센터 (Three IFC) TEL : (02) 년 2 월 Printed in Korea

Slide 1

Ç¥Áö

untitled

User Guide

Microsoft PowerPoint Q AMD DT channel training Nov.ppt

<4D F736F F D203036B1C7BFF8BFC128C6AFC1FD292DC3D6C1BE>

차세대 시스템 개발과 스마트 캠퍼스 구축의 시대! 2014년 현재 대학 정보화 화두는 차세대, 스마트 캠퍼스, 개인정보보호 입니다. 대학 정보화 동향 1990년대 후반부터 2000년대 초반 붐처럼 일었던 학사행정 시스템 구축의 시기를 지나 2000년대 중 후반 부터는

X86 Customer, BP, and Sales Enablement Organization

Microsoft Word - s.doc

AGENDA 모바일 산업의 환경변화 모바일 클라우드 서비스의 등장 모바일 클라우드 서비스 융합사례

Think Z HP Z 워크스테이션이 세상에 나온 지 벌써 30년이 넘었습니다. 다방면의 요구를 충족하도록 설계된 HP Z 워크스테이션은 최신 혁신과 업계 선도적 기술을 도입하여 뛰어난 성능과 신뢰성을 제공합니다. 워크스테이션이 아니라 작업 자체에 더욱 집중할 수 있도

Microsoft PowerPoint - Infiniband 20Gb 40Gb Switch HCA (??_1).ppt [Compatibility Mode]

고객 지향적인 IT 투자와 운영이 요구되는 시대! 2014년 현재 유통, 서비스 업계의 정보화 화두는 BYOD 수용과 고객의 마음을 읽는 분석 입니다. Market Overview _ Cross Industry 의 정보화 동향 유통과 서비스 업계의 IT 환경은 발 빠르

Dell Overview Dell,, CAD, VR., ISV. Dell,. 28% Tower 28%. 60% MHz DDR 60%. 159% 2 Quadro P Tower CATIA 159%, 28, , 56 6

CONTENTS Volume 테마 즐겨찾기 빅데이터의 현주소 진일보하는 공개 기술, 빅데이터 새 시대를 열다 12 테마 활동 빅데이터 플랫폼 기술의 현황 빅데이터, 하둡 품고 병렬처리 가속화 16 테마 더하기 국내 빅데이터 산 학 연 관

Microsoft Word - IBM이 POWER9 칩 대신 AI 플랫폼을 출시한 이유_2018.doc

Dell EMC Korea Partner Summit 2017

슬라이드 1

2 / 26

Microsoft Word - 산업분석리포트 doc

클라우드컴퓨팅이란? WHAT IS CLOUD COMPUTING? 2

SECTION TITLE A PURE PRIMER (AI), // 1

빅데이터처리의핵심인 Hadoop 을오라클은어떻게지원하나요? Oracle Big Data Appliance Solution 01 빅데이터처리를위한전문솔루션이 Oracle Big Data Appliance 군요. Oracle Big Data Appliance 와함께라면더이

<4D F736F F D20C5EBC7D5C7D8BCAEBDC3BDBAC5DB5F D2BC0C720424D54B0E1B0FABAB8B0EDBCAD2E646F63>

MS-SQL SERVER 대비 기능

VNX 성능 및 경쟁사 제품 포지셔닝

Oracle System SPARC COnTEnTS Oracle Software in Silicon Oracle Oracle SParC 11 SPARC M7/T7 15 SPARC M5/M6 16 SPARC T5 17 SPARC

Oracle Database 10g: Self-Managing Database DB TSC

pseries, Systems Group pseries 2003 Corporation (p) Systems Group POWER4/POWER4+ pseries! +! + + The Only Complete UNIX on Demand

PowerPoint 프레젠테이션

aws

I. - II. DW ETT Best Practice

슬라이드 1

Open Cloud Engine Open Source Big Data Platform Flamingo Project Open Cloud Engine Flamingo Project Leader 김병곤

6.24-9년 6월

solution map_....

PowerPoint Presentation

슬라이드 1

<BDBAB8B6C6AEC6F95FBDC3C0E55FC8AEB4EB5FC0CCC1D6BFCF5F E687770>

Windows Storage Services Adoption And Futures

초보자를 위한 분산 캐시 활용 전략

vm-웨어-01장

[Brochure] KOR_TunA

PowerPoint Presentation

슬라이드 1

PowerPoint 프레젠테이션

Title Slide with Name

Microsoft PowerPoint - 알고리즘_1주차_2차시.pptx

Session XX-XX: Name

<4D F736F F D20B0B6B3EBC6AE33C3E2BDC3C8C45FC3D6C1BE5F2D2E646F63>

결과보고서

Microsoft PowerPoint - 발표_090513_IBM세미나_IPTV_디디오넷_완료.ppt

Copyright IBM Corporation 2017 한국아이비엠주식회사 (07326) 서울시영등포구국제금융로 10 서울국제금융센터 (Three IFC) TEL : (02) 년 7 월 Printed in Korea

<C7D1B1B9C1A4BAB8BBEABEF7BFACC7D5C8B82D535720C7C3B7A7C6FB20C7D8B9FD20536F4320C0B6C7D5C0B8B7CE2DB3BBC1F62E687770>

PowerPoint 프레젠테이션

스마트폰 저렴하게 구매하는곳

\\tsclient\C\Users\User\Deskto...

< FC1A6BEC8BFE4C3BBBCAD2E687770>

OpenStack In Telco: Toward 5G Mobile network

vm-웨어-앞부속

<49534F C0CEC1F520BBE7C8C4BDC9BBE720C4C1BCB3C6C320B9D D20BDC3BDBAC5DB20B0EDB5B5C8AD20C1A6BEC8BFE4C3BBBCAD2E687770>

Windows 7 Presentation Template

Microsoft Word 하이닉스 발간_FINAL_.doc

안전을 위한 주의사항 제품을 올바르게 사용하여 위험이나 재산상의 피해를 미리 막기 위한 내용이므로 반드시 지켜 주시기 바랍니다. 2 경고 설치 관련 지시사항을 위반했을 때 심각한 상해가 발생하거나 사망에 이를 가능성이 있는 경우 설치하기 전에 반드시 본 기기의 전원을

SANsymphony-V

Portal_9iAS.ppt [읽기 전용]

ODS-FM1

DB진흥원 BIG DATA 전문가로 가는 길 발표자료.pptx

PowerPoint 프레젠테이션

씨에이에스는 서울특별시 시설관리공단 계약 제1579호( ) 장애인 콜택시 콜센터 차량관제시스템 구축사업 감리용역 에 근거하여 카나스 에서 수행중인 장애인콜택시 콜센터 차량관제시스템 구축사업에 대한 최종감리를 실시하고 본 보고서를 제출합니다

SQL Developer Connect to TimesTen 유니원아이앤씨 DB 기술지원팀 2010 년 07 월 28 일 문서정보 프로젝트명 SQL Developer Connect to TimesTen 서브시스템명 버전 1.0 문서명 작성일 작성자

빅데이터시대 Self-BI 전략 이혁재이사 비아이씨엔에스

Microsoft Word - HD-35 메뉴얼_0429_.doc

슬라이드 1

삼성전자는 Windows 를 권장합니다. PC 소프트웨어 PC 솔루션 삼성 삼성전자만의 편리하고 다양한 소프트웨어를 통해 초보자도 보다 쉽고 빠르게 이용 가능합니다. Easy Settings 삼성 패스트 스타트 Easy File Share (PC to PC) (삼성 컨

Chap7.PDF

Backup Exec

Transcription:

빅데이터분석을가속화하는 GPU 데이터베이스활용을 위한제안 이보란과장 (brlee@kr.ibm.com) IBM Systems-HW, Cognitive Systems

BIG DATA, 얼마나활용하고계신가요? <10% 90% Data Analyzed BI Lost

그렇다면, 앞으로더욱늘어날데이터들은? DATA EXPLOSION IBM Partner Ecosystem / DOC ID / Month XX, 2018 / 2018 IBM Corporation

If it s possible? 분석 20x 더 많은데이터 G P U D ATA W A R E H O U S E 쿼리처리 100x 더 빠르게 FOR MASSIVE DATA ANALYTICS 가격 10% 의 리소스로

기존의분석계시스템은 Petabyte 급의대용량데이터를분석할수없습니다. NoSQL & Hadoop GPU Database Relational DB 1970s-1990s 1990-2010 2005-2010 2010 Classical Relational MPP In-Memory Massive Data Oracle Teradata Mongo DB Map D Kinetica SQREAM DB DB2 SQL Server Vertica Redshift Oracle Exadata IBM Netezza VoltaDB Aerospike IBM DB2 BLU Mem SQL + IBM AC922 GPU 전용시스템공유파일시스템

Massive DATA 처리에최적화된 SQreamDB on POWER9

한계를넘어서, DATA EXPLORATION 사용자의데이터분석범위를확대하여새로운 Insight를도출합니다. 페타바이트급의 RAW DATA 분석가능 표준 SQL Syntax (ODBC, JDBC,.NET, Node.js, ANSI-92) 및 Python Connectivity 지원 기존에사용중인다양한 BI Tool과연계

SQream DB 를더빠르게! 최적의플랫폼 IBM AC922 최신 Tesla V100 GPU 대용량메모리 Scale-up, Scale-out 확장성 CPU-GPU 전용인터커넥트기술 데이터중심의오픈시스템아키텍처 x4 NVLink CPU 2TB/Server V100 150GB/S V100 https://openpowerfoundation.org/wp-content/uploads/2018/10/david-leichner.ibm-openpower-sqream-power9.pdf

PCIe Gen4 CAPI 가속화컴퓨팅플랫폼의문제 IBM POWER9 AC922 의 High Throughput 아키텍처 Data Copy 시간 메모리제약 PCIe 병목 RAM RAM 170GB/s per CPU Power9 CPU IBM SMP bus Power9 CPU NVLink 300GB/s (BiDi) Tesla V100 GPU Tesla V100 GPU Tesla V100 GPU Tesla V100 GPU 900GB/s VRAM VRAM VRAM VRAM

연산중심의워크로드처리에필수적인 I/O 강화 PCIe Gen4 및 CAPI 2.0 은기존 PCIe Gen3 대비 2 배향상 NVLink 2.0 및 OpeCAPI 는기존 NVLink 1.0 (20Gb/s) 대비링크당 1.25 배향상 최신 I/O 및 accelerator 연결기술 PCIe Gen 4 x 48 lanes 192 GB/s duplex 25G Link CAPI x 48 1.0lanes 300 GB/s duplex P8 PCIe Gen3 CAPI 2.0 PCIe Gen4 NVLink 2.0 개방형표준에NVLink 따른견고한가속컴퓨팅생태계 1.0 OpenCAPI CAPI 2.0 POWER8 대비 4배의대역폭 (PCIe Fast PowerAccel Faster PowerAccel Gen4) Interconnects for Interconnect for NVLink Accelerators 2.0 차세대 GPU/CPU Accelerators interconnect NVLink1.0 OpenCAPI / NVLink 2.0 대비 2배의대역폭 PCIe Gen 4 단순해지는 programming model Coherency, virtual addressing, 낮은 overhead P9 1 0 Source : https://openpowerfoundation.org/wp-content/uploads/2016/11/jeff-stuecheli-power9-chip-technology.pdf

POWER9 에서제공하는 CPU-GPU 간 NVLink 2.0 기술 차세대 POWER9 + Volta GPU 서버 POWER9 PCIe Gen3 대비 4.6 배대용량대역폭 NVLink 2.0 링크당 25GB/s 최대 6 개링크연결 (150GB/s, 공랭식기준 ) NVLink 2.0 NVLink 1.0 (now) GPU NVLink 2.0 GPU 75+75 GB/s

2 배더확장된 I/O 대역폭, PCIe Gen4 AC922 상세 I/O Path 2 배더확장된인피니밴드연결성확보 GPU & NVLink CPU & Memory I/O slots etc (management, usb)

4 배더빠른쿼리처리속도 TPC-H Query 를 Sqream DB on IBM POWER9 에서수행시, x86 대비약 2.7 배에서 3.7 배정도더빠르게쿼리를처리했습니다. IBM Power9 AC922: 2x POWER9 16C @ 3.8GHz 256 GB DDR4 2666 MHz SSD storage 4x NVIDIA Tesla V100 (SXM2 NVLINK - 16GB) Dell PowerEdge R740: 2x Intel Xeon Silver 4112 CPU @ 2.60GHz 256GB DDR4 2666MHz SSD storage 4x NVIDIA Tesla V100 (PCIe - 16GB)

2 배더빠른데이터로딩속도 약 60억건 (10TB) 의 TPC-H 레코드를로딩했을때, 약 1.7배더빨리데이터로딩이완료되는것을확인하였습니다. 데이터로딩시, POWER9 CPU와 GPU를모두사용합니다. IBM Power9 AC922: 2x POWER9 16C @ 3.8GHz 256 GB DDR4 2666 MHz SSD storage 4x NVIDIA Tesla V100 (SXM2 NVLINK - 16GB) Dell PowerEdge R740: 2x Intel Xeon Silver 4112 CPU @ 2.60GHz 256GB DDR4 2666MHz SSD storage 4x NVIDIA Tesla V100 (PCIe - 16GB)

Load-and-Go, 쉽고빠른 GPU 기반 SQream DB Dat a Dat Dat a Dat Dat a Dat adat a adat a adat a Data Data Data Data Data Data Data Data Data Raw data Columnar process Chunking + Metadata tagging Automatic adaptive compression GPU Data Data Data Parallel chunk processing Data Skipping

간편하고빠른멀티 -GPU 데이터로드및압축 Data Data Data Data Data Data Data Data Data Source Data 100TB raw Write to disk ~20TB Data Data Data Data Data Data Data Data Data \\ Metadata Data ready ~20.1 TB with metadata SQream DB s GPU compression doesn t make you choose between compression or performance Less data read = less I/O = faster query

GPU 메모리사용을최적화하는 Chunking GPU 리소스를효율적으로사용할수있도록 Chunk 단위데이터 Store 및 Read

유연한 Ad-hoc 쿼리를위한스마트메타데이터

강력한 Querying 성능 SQL 컴파일러및최적화도구로변경없이실행 (ANSI-92) GPU 에서처리가능한관계형대수연산용쿼리로변환 Filter, Join 등복잡한연산의수학적대치

HP SN6000B 16Gb FC Switch 0 4 1 5 2 6 3 7 8 12 9 13 10 14 11 15 16 20 17 21 18 22 19 23 24 28 25 29 26 30 27 31 32 36 33 37 34 38 35 39 40 44 41 45 42 46 43 47 무제한의확장성, Scale-out 아키텍처 컴포넌트별 Scale-out 확장 GPU 리소스 BI fabric 스토리지 Compute 노드 Storage fabric AC922 서버및 Flash System 9100 구성예제 (60 users, 3PB Usable Storage)

최신의 GPU 서버, 고성능스토리지및네트워크기반의 Data-centric 환경을구성합니다. GPU 서버 (AC922) 1. IBM GPU 서버 (IBM POWER9 AC922) Query Execution ETL ML/DL 테스트및분석용 2. Massive I/O 처리를위한인피니밴드네트워크 100G EDR 인피니밴드스위치 공유파일서버 3. 공유파일시스템 #1, #2 (Spectrum (IBM L922) Scale, 구 GPFS) SAN 스위치 (16Gb 이상 ) 4. 고성능 NVMe 기반스토리지 IBM Storage * 위구성도는참조를위한예시이며, 실제구성시상세구성은변경될수있습니다.

데이터로딩 국내도입사례 기존 SAS 시스템의메모리의한계에서벗어나, 새로운분석과제수행 RAM IBM AC922 (V100 GPU) Spectrum Scale Flash System 9100

AD-TECH(PubMatic) 도입사례 기존시스템대비 Query 성능 60 배향상, 4.23 배더많은데이터분석 AD-TEC H 85 TB/day 360 TB/day in ad impressions ingested to enhance for constructing bid histogram bidding accuracy histograms Data Acquisition Sources Extra ct X Queries Not feasible take 5 hours Data Ingest 8x 2x NVIDIA Tesla GPU s Queries take 5 minutes

Retail(Wholesale) 도입사례 Query 수행시간 60 배개선 WHOLESALE $30 Billion Company - Supply Chain Use Case Vast insights uncovered from untapped data Query Time 이 30 분에서 30 초로감소