16X Tesla V100 SXM 3GB NVIDIA DGX- 16x Tesla V100 SXM 3GB 81,90 CUDA cores / 10,40 Tensor Cores FP16 : 1,90 TFLOPS / FP3 : 40 TFLOPS / FP64 : 10 TFLOP

Similar documents
Microsoft PowerPoint - eSlim SV [080116]

Microsoft PowerPoint - eSlim SV [ ]

PowerPoint Presentation

Slide 1

Integ

untitled

Dell과 함께라면 가능합니다. 처음 도입하는 서버 또는 두 번째로 도입하는 서버이거나 네트워크를 확장시키거나 관리 기능을 강화하는 등의 모든 요구 사항을 Dell은 지원할 수 있습니다. Dell은 특성이 각기 다른 모든 조직과 회사마다 서로 다른 시점에 서로 다른 요

Microsoft PowerPoint Q AMD DT channel training Nov.ppt

PowerPoint 프레젠테이션

Copyright IBM Corporation 2017 한국아이비엠주식회사 (07326) 서울시영등포구국제금융로10 서울국제금융센터 (Three IFC) TEL : (02) 년 2 월 Printed in Korea

Copyright IBM Corporation 2017 한국아이비엠주식회사 (07326) 서울시영등포구국제금융로10 서울국제금융센터 (Three IFC) TEL : (02) 년 2 월 Printed in Korea

PowerPoint Presentation

CONTENTS 목차 1. 전원 및 설치시 주의사항 2 2. 시스템 사용시 바른 자세 4 3. 시스템 구성품 확인 5 슬림형 케이스1 6 슬림형 케이스2 7 타워형 케이스1 8 타워형 케이스2 9 일체형 케이스1 10 망분리형 케이스 시스템 시작 및 종료

3.Bladesystem

슬라이드 1

[Brochure] KOR_TunA

Master presentation template three line maximum — First Lastname Job Title

PowerPoint Presentation

Think Z HP Z 워크스테이션이 세상에 나온 지 벌써 30년이 넘었습니다. 다방면의 요구를 충족하도록 설계된 HP Z 워크스테이션은 최신 혁신과 업계 선도적 기술을 도입하여 뛰어난 성능과 신뢰성을 제공합니다. 워크스테이션이 아니라 작업 자체에 더욱 집중할 수 있도

PowerPoint Presentation

Dell Overview Dell,, CAD, VR., ISV. Dell,. 28% Tower 28%. 60% MHz DDR 60%. 159% 2 Quadro P Tower CATIA 159%, 28, , 56 6

Storage advances and Ne over fabric

PowerPoint 프레젠테이션

vm-웨어-01장

solution map_....

Microsoft Word - DELL_PowerEdge_TM_ R710 서버 성능분석보고서.doc

Slide 1

AGENDA 모바일 산업의 환경변화 모바일 클라우드 서비스의 등장 모바일 클라우드 서비스 융합사례

클라우드컴퓨팅이란? WHAT IS CLOUD COMPUTING? 2

안전을 위한 주의사항 제품을 올바르게 사용하여 위험이나 재산상의 피해를 미리 막기 위한 내용이므로 반드시 지켜 주시기 바랍니다. 2 경고 설치 관련 지시사항을 위반했을 때 심각한 상해가 발생하거나 사망에 이를 가능성이 있는 경우 설치하기 전에 반드시 본 기기의 전원을

Slide 1

Microsoft Word - zfs-storage-family_ko.doc

Microsoft PowerPoint - Infiniband 20Gb 40Gb Switch HCA (??_1).ppt [Compatibility Mode]

2005CG01.PDF

APOGEE Insight_KR_Base_3P11

Microsoft PowerPoint - 권장 사양

KDTÁ¾ÇÕ-2-07/03

Office 365, FastTrack 4 FastTrack. Tony Striefel FastTrack FastTrack

K_R9000PRO_101.pdf

IBM Power Systems Accelerated Compute(AC922) Server IB IBM Power Systems Accelerated Compute(AC922) Server는엔터프라이즈급 AI 환경을위한최강의가속화솔루션입니다. 170GB/s CPU P

서현수

Analyst Briefing

Tekla Structures 설치

슬라이드 1

PowerPoint Presentation

Metropolis Font Check

Windows Embedded Compact 2013 [그림 1]은 Windows CE 로 알려진 Microsoft의 Windows Embedded Compact OS의 history를 보여주고 있다. [표 1] 은 각 Windows CE 버전들의 주요 특징들을 담고


Contents I. 칼라스 네트워크 플레이어란 1. Pc-Fi를 넘어서 발전한 차세대 음악 플레이어 칼라스 네트워크 플레이어의 장점 3. 시스템 기본 구성


X86 Customer, BP, and Sales Enablement Organization

_LG히다찌 브로슈어


김기남_ATDC2016_160620_[키노트].key

pseries, Systems Group pseries 2003 Corporation (p) Systems Group POWER4/POWER4+ pseries! +! + + The Only Complete UNIX on Demand

Windows 8에서 BioStar 1 설치하기

EEAP - Proposal Template

CONTENTS CONTENTS CONTENT 1. SSD & HDD 비교 2. SSD 서버 & HDD 서버 비교 3. LSD SSD 서버 & HDD 서버 비교 4. LSD SSD 서버 & 글로벌 SSD 서버 비교 2

<4D F736F F D20C5EBC7D5C7D8BCAEBDC3BDBAC5DB5F D2BC0C720424D54B0E1B0FABAB8B0EDBCAD2E646F63>

비디오 / 그래픽 아답터 네트워크 만약에 ArcGolbe를 사용하는 경우, 추가적인 디스크 공간 필요. ArcGlobe는 캐시파일을 생성하여 사용 24 비트 그래픽 가속기 Oepn GL 2.0 이상을 지원하는 비디오카드 최소 64 MB 이고 256 MB 이상을 메모리

KDTÁ¾ÇÕ-1-07/03

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Nov.; 25(11),

untitled

Contributors: Myung Su Seok and SeokJae Yoo Last Update: 09/25/ Introduction 2015년 8월현재전자기학분야에서가장많이쓰이고있는 simulation software는다음과같은알고리즘을사용하고있다.

Agenda 오픈소스 트렌드 전망 Red Hat Enterprise Virtualization Red Hat Enterprise Linux OpenStack Platform Open Hybrid Cloud

Appendix B

OpenStack In Telco: Toward 5G Mobile network

엔비디아 Nvidia (NVDA US) 4차 산업혁명의 BRAIN 미래에셋대우 리서치센터 글로벌 포트폴리오 GPU(Graphic Processing Unit)는 무엇인가? GPU (Graphic Processing Unit) NVIDIA는 GPU 설계를 메인 사업으로

넥싸이트리플렛최종

VDI Evolution at the speed of GRID – VDI 2.0 IS here!

<목 차 > 제 1장 일반사항 4 I.사업의 개요 4 1.사업명 4 2.사업의 목적 4 3.입찰 방식 4 4.입찰 참가 자격 4 5.사업 및 계약 기간 5 6.추진 일정 6 7.사업 범위 및 내용 6 II.사업시행 주요 요건 8 1.사업시행 조건 8 2.계약보증 9 3

810 & 는 소기업 및 지사 애 플리케이션용으로 설계되었으며, 독립 실행형 장치로 구성하거 나 HA(고가용성)로 구성할 수 있습니다. 810은 표준 운영 체제를 실행하는 범용 서버에 비해 가격 프리미엄이 거의 또는 전혀 없기 때문에 화이트박스 장벽 을

Copyright 2012, Oracle and/or its affiliates. All rights reserved.,.,,,,,,,,,,,,.,...,. U.S. GOVERNMENT END USERS. Oracle programs, including any oper

<4D F736F F D205B4354BDC9C3FEB8AEC6F7C6AE5D3131C8A35FC5ACB6F3BFECB5E520C4C4C7BBC6C320B1E2BCFA20B5BFC7E2>

FMX M JPG 15MB 320x240 30fps, 160Kbps 11MB View operation,, seek seek Random Access Average Read Sequential Read 12 FMX () 2

IBM Power Systems

2 / 26

PCServerMgmt7

01이국세_ok.hwp

Backup Exec

슬라이드 1

USER Manual

Microsoft Word - s.doc

gcp

Azure Stack – What’s Next in Microsoft Cloud

\\tsclient\C\Users\User\Deskto...

Ⅱ. Embedded GPU 모바일 프로세서의 발전방향은 저전력 고성능 컴퓨팅이다. 이 러한 목표를 달성하기 위해서 모바일 프로세서 기술은 멀티코 어 형태로 발전해 가고 있다. 예를 들어 NVIDIA의 최신 응용프 로세서인 Tegra3의 경우 쿼드코어 ARM Corte

Microsoft PowerPoint - HW_SW_LSP강의_조재구강사.ppt

02 Reihe bis 750 bar GB-9.03

Agenda 1 Network Virtualization Today 2 Management Plane Scale-Out 3 Control Plane Evolution 4 High-Performance Data Plane 5 NSX Vision : Driving NSX

1. GigE Camera Interface를 위한 최소 PC 사양 CPU : Intel Core 2 Duo, 2.4GHz이상 RAM : 2GB 이상 LANcard : Intel PRO/1000xT 이상 VGA : PCI x 16, VRAM DDR2 RAM 256MB

[한반도]한국의 ICT 현주소(송부)

Session XX-XX: Name

목차 제 1 장 inexio Touch Driver소개 소개 및 주요 기능 제품사양... 4 제 2 장 설치 및 실행 설치 시 주의사항 설치 권고 사양 프로그램 설치 하드웨

공지사항

15_3oracle

Windows 7 Presentation Template

슬라이드 1

NX Nastran brochure (Korean)

Microsoft Word doc

Transcription:

VISUAL & AI COMPUTING SOLUTION

16X Tesla V100 SXM 3GB NVIDIA DGX- 16x Tesla V100 SXM 3GB 81,90 CUDA cores / 10,40 Tensor Cores FP16 : 1,90 TFLOPS / FP3 : 40 TFLOPS / FP64 : 10 TFLOPS x Xeon CPU / 300GB/s NVLink.0 / 10U 10000W 세계최초맞춤형인공지능 (AI) 슈퍼컴퓨터포트폴리오 딥러닝성능을 5 배로높이기위해완전히상호연결된 16 개의 GPU 를결합하는최초의 페타플롭스시스템인 NVIDIA DGX- 로 AI 속도및확장에대한장벽을뛰어넘 으십시오. 이제품은 NVIDIA DGX 소프트웨어와 NVIDIA NVSwitch 기술을기반으로하는확장가능한아키텍처로구동되므로세계에서가장복잡한 AI 과제를수행할 수있습니다. 혁신적인 AI 네트워크패브릭 DGX- 를이용하면모델복잡성과크기는더이상기존아키텍처의한계에의해제한되지않습니다. 이제여러분은 NVIDIA NVSwitch 네트워크패브릭을통해모델병렬트레이닝을활용하실수있습니다. 이는.5TB/s 의 GPU 간대역폭을갖춘세계최초의 페타플롭스 GPU 가속기를뒷받침하는혁신적인기술로이전세대에비해 1 배 향상된성능과 5 배빠른솔루션도출시간을제공합니다. DGX- 의강력한요소들을모두확인하세요. 1 NVIDIA TESLA V100 3GB, SXM 16 TOTAL GPUS FOR BOTH BOARDS, 51GB TOTAL HBM MEMORY 각각의 GPU 보드에탑재된총 16 개의 NVIDIA Tesla V100. 1 3 3 4 1 TOTAL NVSWITCHES HSI(High Speed Interconnect),.4 TB/ 초의바이섹션대역폭 (bisection bandwidth). 8 EDR INFINIBAND/100 GbE ETHERNET 1600 Gb/ 초의양방향대역폭 (Bi-directional Bandwidth) 과저지연. 5 4 6 8 5 PCIE SWITCH COMPLEX 7 6 TWO INTEL XEON PLATINUM CPUS 7 8 9 1.5 TB SYSTEM MEMORY DUAL 10/5 GbE ETHERNET 30 TB NVME SSDS INTERNAL STORAGE 9 16 개의 GPU 연결이지원되는첫 on-node 스위치아키텍처 NVIDIA NVSwitch 멀티 GPU 프로세싱이 DGX-1 대비개선된오직 DGX- 에서만 1 NODE 16 GPUs 의 NVSwitch 가지원되는모델입니다.

세계 최초 딥 러닝 용 슈퍼컴퓨터 NVIDIA DGX-1 8x Tesla V100 SXM 16GB 40,960 CUDA cores / 5,10 Tensor Cores FP16 : 960 TFLOPS / FP3 : 10 TFLOPS / FP64 : 60 TFLOPS x Xeon CPU / 300GB/s NVLink.0 / 3U 300W 세계 최초 맞춤형 인공지능(AI) 슈퍼컴퓨터 포트폴리오 딥 러닝 및 분석 요구 사항에서 영감을 받은 NVIDIA DGX 시스템은 새롭고 혁신 적인 NVIDIA Volta GPU 플랫폼을 기반으로 구축되었습니다. NVIDIA DGX 시스 템은 데이터 과학자들에게 책상과 데이터센터, 클라우드를 넘나들며 AI를 탐구할 수 있는 가장 강력한 도구를 제공하도록 설계되었습니다. Software NVIDIA GPU CLOUD 1 1 Hardware 11 3 3 3 3 4 4 44 55 빠른 트레이닝과 새로운 혁신 Unparalleled Deep Learning Training Performance 66 7 7 8 8 NVIDIA Tesla V100 GPU 8개와 함께하세요. Built on the latest NVIDIA Volta GPU Architecture TFLOPS (GPU FP16) The power of 800 x86 CPUs 3X deep learning training speedup 10X speed-up with NVLink vs PCIe 30% faster performance with DGX software stack 생산성을 극대화 할 수 있는 플랫폼 Get started in as little as hours with NVIDIA DGX Tesla V100 탑재 Tesla P100 탑재 960 170 GPU 메모리 18GB 총 시스템 CPU Dual 0-Core Intel Xeon E5-698 v4. GHz NVIDIA CUDA 코어 40,960 8,67 NVIDIA 텐서 코어 (V100 기준 시스템) 5,10 N/A NVLink 대 PCIe의 가속 성능 비교 10배 5배 딥 러닝 트레이닝 가속 3배 1배 최대 소요 전력 3,00 W 시스템 메모리 51 GB, 133 MHz DDR4 LRDIMM Deploy Quickly and Simply NVIDIA GPU CLOUD and Support 스토리지 4X 1.9 TB SSD RAID 0 Plug-and-play setup that takes you from Power-on to deep learning in minutes Access to NVIDIA s vast deep learning Knowledge, expertise and the latest Software updates 네트워크 Dual 10GbE, 최대 4 IB EDR 소프트웨어 Ubuntu Linux Host OS 자세한 내용은 소프트웨어 스택 참조 시스템 무게 134 lbs 시스템 크기 866 D x 444 W x 131 H(mm) 패키지 크기 1,180 D x 730 W x 84 H(mm) 작동 온도 10 ~ 35

세계최초딥러닝용워크스테이션 NVIDIA DGX Station 4x Tesla V100 PCIe 16GB 0,480 CUDA cores /,560 Tensor Cores FP16 : 480 TFLOPS / FP3 : 60 TFLOPS / FP64 : 30 TFLOPS Xeon CPU / NVLink.0 / 1500W / Water Cooled 최첨단 AI 개발을위한개인용슈퍼컴퓨터 데이터과학팀은강력한딥러닝과분석을통해통찰력을얻고더빠르게혁신하기위해컴퓨팅성능을활용합니다. 지금까지 AI 슈퍼컴퓨팅은데이터센터에국한되어대규모로트레이닝하기전에인공신경망을테스트하기위해필요한실험을제한적으로실행했습니다. 그러나여기 AI 슈퍼컴퓨팅성능을아주가까운곳으로가져오는동시에딥러닝을실험할수있는능력을제공하는솔루션이있습니다. AI 의신기원 이제는 400 CPU 컴퓨팅용량의워크스테이션을간편하게설치해 1/0 이하의전력으로사용할수있습니다. 사무용으로설계된 NVIDIA DGX Station 은경이로운딥러닝과분석성능을제공하여소음은다른워크스테이션의 1/10 수준에불과합니다. 데이터과학자들과 AI 연구자들은최적화된딥러닝소프트웨어에액세스할수있고일반적인분석소프트웨어를실행하는워크스테이션을통해생산성을즉시향상시킬수있습니다. 딥러닝으로더빠르게시작 DGX Station은자체딥러닝플랫폼구축의한계를뛰어넘는솔루션입니다. 하드웨어와소프트웨어의조달, 통합및테스트를위해 1개월이상을소비하고도프레임워크, 라이브러리, 그리고드라이버를최적화하기위해추가적인전문지식과노력이필요할수있습니다. 트레이닝과실험에투자할수있는소중한시간과비용을시스템통합과소프트웨어엔지니어링에써야하는것입니다. NVIDIA DGX Station 은단하루만에인공신경망을트레이닝할수있는간소화된플러그인과구동경험으로 AI 이니셔티브를시작하도록설계하였습니다. 3 6 6 1 7 9 8 빠른트레이닝과새로운혁신 Unparalleled Deep Learning Training Performance 5 5 4 4 480 TFLOPS 3X the performance of today s fastest GPU workstations Water-cooled performance the only workstation built on 4 Tesla V100 s 30% faster training over non-dgx stack solutions 5X increase in I/O performance with 4-way NVLink vs. PCIeconnected GPU s GPUs 4X Tesla V100 TFLOPS(GPU FP16) 480 GPU 메모리 64GB 총시스템 NVIDIA 텐서코어,560 NVIDIA CUDA 코어 0,480 CPU 시스템메모리 스토리지 네트워크 디스플레이 음향 시스템무게 시스템크기 최대소요전력 Intel Xeon E5-698 v4.ghz (0-Core) 56GB LRDIMM DDR4 데이터 : 3X 1.9TB SSD RAID 0 OS : 1X 1.9TB SSD 이중 10Gb LAN 3X DisplayPort, 4K 해상도 < 35dB 88lbs/40kg 518 D x 56 W x 639 H(mm) 1,500 W 작동온도 10 ~ 30 소프트웨어 Ubuntu Desktop Linux OS DGX 권장 GPU Driver CUDA Toolkit

가장빠르고생산적인 GPU for Deep Learning & HPC NVIDIA Tesla 서버용 TESLA 데이터센터 GPU NVIDIA Tesla GPU를사용하여높은사양을요구하는 HPC와하이퍼스케일데이터센터워크로드를가속화하십시오. 데이터과학자와연구자는이제에너지탐사에서딥러닝에이르는다양한응용분야에서기존의 CPU가지원했던수준보다훨씬더빠르게페타바이트급데이터주문을파싱및이전보다훨씬빠른속도로더욱큰규모의시뮬레이션을실행가능합니다. VOLTA : A GIANT LEAP FOR DEEP LEARNING Tesla V100 SXM NVLink 지원하는 Socket 타입의 GPGPU NVIDIA CUDA Cores 5,10 Tesla V100 PCIe PCIe 타입의 GPGPU, Deep Learning, HPC 용 Double-Precision Performance 7.8 TFLOPS 7 TFLOPS Single-Precision Performance 15.7 TFLOPS 14 TFLOPS Tensor Performance 10 TFLOPS 11 TFLOPS Interconnect Bandwidth 300 GB/sec NVLink 3 GB/sec GPU Memory Memory Bandwidth 16 GB HBM 900 GB/sec Volta Architecture Improved NVLink & HBM Volta MPS Improved SIMT Model Tensor Core Most Productive GPU Efficient Bandwidth Inference Utilization New Algorithms 10 Programmable TFLOPS Deep Learning GPU 성능비교 (P100 vs M40 vs K40) P100 M40 K40 Double-Precision TFLOPS 5.3 0. 1.4 Single-Precision TFLOPS 10.6 7.0 4.3 Half-Precision TFLOPS 1. NA NA GPU Memory 16 GB 1GB, 4GB 1GB Memory Bandwidth(GB/s) 70 88 88 P100 vs V100 성능비교 Training acceleration Inference acceleration P100 V100 Ratio 10.6 TFLOPS 10 TFLOPS 1x 1. TFLOPS 10 TFLOPS 6x FP64/FP3 5.3/10.6 TFLOPS 7.8/15.7 TFLOPS 1.5x HBM Bandwidth 70 GB/s 900 GB/s 1.x NVLink Bandwidth 160 GB/s 300 GB/s 1.9x L Cache 4 MB 6 MB 1.5x L1 Caches 1.3 MB 10 MB 7.7x VOLTA TENSOR CORE 딥러닝에가장최적화된프레임워크, 라이브러리지원 NVIDIA cudnn, cublas, TensorRT 오직 NVIDIA GPU 에서만!

가장빠르고생산적인 GPU for Deep Learning & HPC NVIDIA Tesla Tesla V100 for SXM NVLink.0 지원딥러닝트레이닝, HPC 용 Tesla V100 for PCIe NVLink.0 지원딥러닝트레이닝, HPC 용 Tesla P100 for PCIe (1GB/16GB) 딥러닝트레이닝, HPC 용 Tesla P4 딥러닝트레이닝, 추론용 Tesla P40 딥러닝트레이닝, 추론용 NVIDIA CUDA Cores 5,10 5,10 3584 560 3840 Double-Precision Performance Single-Precision Performance 7.8 TFLOPS 7 TFLOPS 4.7 TFLOPS - - 15.7 TFLOPS 14 TFLOPS 9.3 TFLOPS 5.5 TFLOPS 1 TFLOPS Half-Precision Performance 10 TFLOPS 11 TFLOPS 18.7 TFLOPS 11 TFLOPS 4 TFLOPS GPU Memory 16 GB 16 GB 16GB or 1GB 8 GB 4 GB Memory Bandwidth 900 GB/sec 900 GB/sec 70 GB/s or 540 GB/s 19 GB/s 346 GB/s Pascal Architecture NVLink HBM Stacked Memory Page Migration Engine Highest Compute Performance GPU Interconnect for Maximum Scalability Unifying Compute & Memory in Single Package Simple Parallel Programming with 51 TB of Virtual Memory CUDA CUDA 는 GPU 가속어플리케이션을위한가장강력한소프트웨어플랫폼입니다. 빠른 GPU 가속라이브러리, 유연한스레드관리를위한새로운프로그래밍모델, 컴파일러및 개발자도구개선을포함합니다. CUDA 를사용하면 NVIDIA GPU 응용프로그램의속도 와확장성을향상시킬수있습니다. CUDA 9 은 Volta GPU 에서 AI 및 HPC 애플리케이션을가속화하는새로운알고리즘과 최적화를제공합니다. NVIDIA CUDA 의새로운기능을사용하여심층적인학습을위한이미지확대알고리즘개발 Tesla V100 New GPU Architecture Tensor Cores NVLink Independent Thread Scheduling BUILT FOR VOLTA INTRODUCING CUDA 9 cublas for Deep Learning NPP for Image Processing cufft for Signal Processing FASTER LIBRARIES cublas 의새로운 API 를사용하여 Volta Tensor 코어에서일괄처리된신경망처리및시퀀스모델링작업실행 cufft 에서새로운딥러닝모델을가진다중 GPU 시스템에서보다큰 D 및 3D FFT 문제를이전보다효율적으로해결가능 새로운코어최적화지원으로최대 1 배빠른커널실행 COOPERATIVE THREAD GROUPS Flexible Thread Groups Efficient Parallel Algorithms Synchronize Across Thread Blocks in a Single GPU or Multi-GPUs DEVELOPER TOOLS & PLATFORM UPDATES Faster Compile Times Unified Memory Profiling NVLink Visualization New OS and Compiler Support

Introducing Quadro GV100 Tesla V100 3GB GV 100 CUDA Cores 510 Display Connectors DP 1.4(4), DVI-D DL(1), Stereo FP 3 14.8 TFLOPS V 100 CUDA Cores 510 FP 3 14.8 TFLOPS FP 16 11 TFLOPS Features 3K Texture & Render Processing / Quadro MOSAIC, NVLink, SLI Features NVLink.0, CUDA, NVIDIA GPU Cloud Power 50W Power 50W Memory 3GB HBM Memory 3GB HBM NVIDIA RTX 를소개합니다. 수십년간의알고리즘개발과 GPU 의발전은컴퓨터그래픽을한차원더높은레벨로이끌었습니다. 지난 10 년간의그래픽알고리즘과 GPU 의 Volta 아키텍처로인해 Ray Tracing 기술이매우최적화되었습니다. Partnered with Microsoft 와의협업으로 DirectX 에서 Raytracing 을 API 로사용할수있게되었습니다. NVIDIA TensorRT 추론에가장최적화된 NVIDIA Software 입니다. 트레이닝된모델을가볍게만들 고실제환경에서트레이닝한모델과비슷한성능을낼수있게도와줍니다. 최적화되지않은네트워크 next input concat relu bias 1x1 conv. relu bias 3x3 conv. relu bias 5x5 conv. relu bias 1x1 conv. relu bias relu bias max pool FRAMEWORKS GPU PLATFORMS 1x1 conv. 1x5 conv. input concat TESLA P4 TensorRT JETSON TX TensorRT 로최적화된네트워크 Optimizer Runtime DRIVE PX next input NVIDIA DLA 3x3 CBR 5x5 CBR 1x1 CBR TESLA V100 1x1 CBR max pool input

세계에서가장강력한비주얼컴퓨팅플랫폼 NVIDIA Quadro Quadro Sync 16 개의멀티디스플레이지원가능 Quadro Sync 는전문적인사용자에게전례없는전력효율과성능, 그리고기능들을제공하는세계에서가장진보된전문그래픽솔루션입니다. + Quadro GP100*4 Quadro Sync II 16 Displays 3D Rendering, 시뮬레이션 글로벌시장에서경쟁력을관리하는것은모든규모의제조업체에게중요한과제입니다. 혁신적인제품과파격적인아키텍처를만드는경우모두 NVIDIA 의전문그래픽은 워크플로를최적화하고디자인애플리케이션의성능을강화하는데유용합니다. PHOTOREALISTIC RENDERING CAE ANALYSIS VIRTUAL REALITY MEDIA & ENTERTAINMENT MANUFACTURING & DESIGN ARCHITECTURE, ENGINEERING & CONSTRUCTION ENERGY EXPLORATION Product Design Manufacturing AEC Structural Mechanics Fluid Dynamics Electromagnetics Immersive, Collaborative Design Verification & Validation NVIDIA Quadro 는 VR 및 VR 디자인을지원합니다. VR 에서의탁월한시각화와협업 가상현실 (VR) 의꿈이 NVIDIA 하드웨어및소프트웨어기술을통해실현되고있습니다. 그리고전문가의작업과정에서그혁신이일어나고있습니다. NVIDIA VRWorks TM A Giant Step towards Full Presence

세계에서가장강력한비주얼컴퓨팅플랫폼 NVIDIA Quadro P1000 P000 P4000 P5000 P6000 GP100 CUDA Cores 640 104 179 560 3840 3584 Display Connectors FP 3 mdp(4) DP 1.4 (4) DP 1.4 (4) 1.894 TFLOPS 3.0 TFLOPS 5.3 TFLOPS DP 1.4 (4) +DVI-D DL(1) 8.9 TFLOPS DP 1.4 (4) +DVI-D (1) 1 TFLOPS DP 1.4 (4) +DVI-D (1) 10.3 TFLOPS Features 5K Resolution Mosaic, Iray & Metal Ray Quadro Sync II, Mosaic, Iray & Metal Ray Quadro Sync II, Mosaic, Iray & Metal Ray Quadro Sync II, Mosaic, Iray & Metal Ray Quadro Sync II, Mosaic, Iray & Metal Ray, NVLink Supported Power 47W 75W 105W 180W 50W 35W Memory 4GB GDDR5X 5GB GDDR5X 8GB GDDR5X 16GB GDDR5X 4GB GDDR5X 16GB HBM 성공사례 ASTROBOTIC TECHNOLOGY MOTOCZYSZ PGO AUTOMOBILES SAGE CHESHIRE TRAVERSTON MOTORCYCLES TREK

NVIDIA GRID NVIDIA GRID 가상 GPU 기술 NVIDIA GRID 는여러가상데스크톱및애플리케이션인스턴스에서가상 GPU() 를공유할때사용되는기술중에서도업계에서가장진보된기술입니다. 이제 NVIDIA 데이터센터 GPU의능력을전부활용하여어디서나, 어느기기에나탁월한가상그래픽경험을제공할수있습니다. NVIDIA GRID 플랫폼에서는최고수준의성능, 유연성, 관리기능, 보안을통해모든가상작업흐름에적절한수준의사용자경험을제공합니다. 커스텀그래픽프로파일 IT 관리자는각사용자에게최적의그래픽자원을할당하고커스텀그래픽프로파일을제공할수있습니다. 모든가상데스크톱은실제데스크톱처럼전용그래픽메모리가있기때문에항상최고의성능으로애플리케이션을시작하고실행할수있습니다. NVIDIA GRID 에서는수십명의사용자가각각의실제 GPU를공유하므로사용가능한 GPU 리소스를최적균형상태로가상시스템에할당할수있습니다. VIRTUALIZATION LAYER NVIDIA GRAPHICS NVIDIA GRAPHICS NVIDIA GRAPHICS NVIDIA GRAPHICS NVIDIA QUADRO NVIDIA QUADRO NVIDIA QUADRO NVIDIA QUADRO HYPERVISOR NVIDIA GRID MANAGER HARDWARE CPUs SERVER NVIDIA GPUs NVIDIA GRID Software Edition NVIDIA GRID 는세가지에디션이있으므로실제요구에따라각사용자기반에적절한수준의리소스를할당할수있습니다. XenApp 또는기타 RDSH 솔루션을배포하는조직에적합 PC Windows 애플리케이션을최대성능으로제공하도록설계 가상데스크톱을원하지만 PC 애플리케이션, 브라우저, 고화질비디오를활용한최상의사용자경험도원하는사용자에게적합 어디서나, 어느기기에서나최상의성능으로원격전문그래픽애플리케이션을사용하려는사용자에게적합

NVIDIA GRID NVIDIA GRID GPU 가상화플랫폼 Industry Leading Virtualization Platform 높은성능의어플리케이션을위한향상된성능 Tesla M60 보다 배이상뛰어난 Tesla P40 NVIDIA GRID Support with vrealize Operations for Horizon Entire Stack Monitoring Single Pane of Glass Right-Sized Resources End-User Viewpoints GPU Support Insights into Users, Apps and Infrastructure Monitor both Horizon and XenApp Stacks Utilization Metrics and Management Optimize Performance and Meet SLAs Monitor GPU status

CPU-ONLY SERVERS 0 GPU Servers 1 GPU-ACCELERATED SERVER GPU 가속컴퓨팅이란? GPU 가속컴퓨팅은그래픽처리장치 (GPU) 와 CPU를함께이용하여과학, 분석, 공학, 소비자및기업애플리케이션의처리속도를높이는것을말합니다. NVIDIA에의해 007년도에개척된 GPU 가속은현재전세계정부산하의연구소, 대학교, 대기업및중소기업의에너지효율적인데이터센터에사용되고있습니다. GPU는자동차부터휴대폰, 태블릿, 드론및로봇까지아우르는다양한플랫폼상의애플리케이션을가속합니다. GPU 가애플리케이션을가속하는방법 어플리케이션의연산집약적인부분을 GPU로넘기고나머지코드만을 CPU에서처리하는 GPU 가속컴퓨팅은전례없이강력한어플리케이션성능을제공합니다. 사용자입장에서는어플리케이션의속도가놀라울정도로빨라졌음을느낄수있습니다. BayNex 의 GPU Server 는 NVIDIA Tesla GPU를사용하여높은사양을요구하는 HPC와하이퍼스케일데이터센터워크로드를가속화할수있습니다. 데이터과학자와연구자는다양한응용분야에서기존의 CPU가지원했던수준보다훨씬더빠르게페타바이트급데이터주문을파싱할수있습니다. 그뿐만아니라 BayNex Server는 Tesla 가속기를활용하여훨씬빠른속도로더욱큰규모의시뮬레이션을실행하는데필요한성능을제공합니다. 점점더복잡해지는모델을더욱빠르게트레이닝하는것은데이터과학자의생산성을향상하고 AI 서비스를보다빠르게제공하는데매우중요합니다. NVIDIA Tesla P100/V100을탑재한서버는딥러닝트레이닝시간을몇개월에서몇시간으로단축할수있습니다. 추론은트레이닝을마친신경망이실질적으로역할을수행하는영역입니다. 이미지, 음성, 비주얼및동영상검색과같은새로운데이터요소가등장함에따라추론은수많은 AI 서비스의중심에서그에대한대답과추천을제공합니다. 단한개의 Tesla GPU를장착한서버가싱글소켓 CPU로만구성된서버보다 7배높은추론처리량을제공하여비용을대폭절감할수있습니다. TRAINING DATA CENTER INFERENCE DATA CENTER TRAINING INFERENCE DEVICE

CPU-ONLY SERVERS 0 GPU Servers GPU-ACCELERATED SERVER 1 NVIDIA GPU 전용서버 새로 나온 Intel Skylake 기반의 CPU 와 NVIDIA GPU의 결합은 이전의 Xeon CPU보다 약 30-50% 증가된 성능을 자랑합니다. BayNex 서버에서는 그래픽, HPC 및 머신 러닝(Deep Learning) 분야에 활용되 는 다양한 GPU 옵션을 제공합니다. 업무 용도에 따라 다양한 GPU 중 적합한 모델 을 선택할 수 있으며, 시스템에 따라 여러 개의 GPU 어댑터를 장착하도록 설계되 었습니다. GPU 서버의 장점 고객 맞춤형 서버가능 (다른 Appliance 제품과 달리 내부구성 변경가능) NVIDIA의 최신 아키텍처 적용서버 Volta 아키텍처 사용가능 투자대비 효용성 증가 Tech Support by NVIDIA 다른 Appliance와 달리 즉시 공급이 가능, 엔비디아 파트너사의 4/7 지원가능 GPU 는 수 천개의 코어로 CPU 대비 연산집약적 병렬컴퓨팅에서 수십~수백배의 성능을 자랑합니다. NVIDIA Library를 사용하는 어플리케이션 및 기관 GPU ACCELERATED COMPUTING 10X PERFORMANCE 5X ENERGY EFFICIENCY CPU GPU Accelerator Optimized for Serial Tasks Optimized for Parallel Tasks GPU Server Line up BN80 BN480 BN880 Form Factor U U U U CPU * Skylake TDP up to 165W * Skylake TDP up to 165W * Skylake TDP up to 165W * Skylake TDP up to 165W Chipset Intel C60 series chipset Intel C60 series chipset Intel C60 series chipset Intel C60 series chipset Memory 4 DIMM slots 4 DIMM slots 16 DDR4 DIMM per node 16 DDR4 DIMM per node PCIe Max. ea PCIe Max. 4ea PCIe Max. 8ea SXM 8ea V100 / P40 V100 / P40 V100 / P40 V100 * 500w/800w/1600w * 500w/800w/100w/1600w * 3000w PSU 80plus Titanium * 3000w PSU 80plus Titanium GPU Power BN88

NVIDIA 한국총판 NVIDIA 공식파트너 ( 주 ) 베이넥스서울시영등포구당산로 41길 11 당산 SK V1센터 West동 11호 TEL : 0)785-9977 FAX : 0)785-7447 http://www.baynex.co.kr ( 주 ) 한국인프라서울특별시강남구삼성로 150 ( 대치동, 극동교회빌딩 3층 ) 상담문의 : 0)604-504 jysuh@krinfra.co.kr http://www.krinfra.co.kr