PowerPoint 프레젠테이션

Similar documents
3.Bladesystem

PowerPoint Presentation

Dell과 함께라면 가능합니다. 처음 도입하는 서버 또는 두 번째로 도입하는 서버이거나 네트워크를 확장시키거나 관리 기능을 강화하는 등의 모든 요구 사항을 Dell은 지원할 수 있습니다. Dell은 특성이 각기 다른 모든 조직과 회사마다 서로 다른 시점에 서로 다른 요

Oracle9i Real Application Clusters

슬라이드 1

solution map_....

김기남_ATDC2016_160620_[키노트].key

Microsoft PowerPoint - eSlim SV [080116]

Agenda 오픈소스 트렌드 전망 Red Hat Enterprise Virtualization Red Hat Enterprise Linux OpenStack Platform Open Hybrid Cloud

PowerPoint 프레젠테이션

Microsoft PowerPoint - eSlim SV [ ]

Integ

00-Intro

Microsoft PowerPoint - Infiniband 20Gb 40Gb Switch HCA (??_1).ppt [Compatibility Mode]

슬라이드 1

<4D F736F F F696E74202D204C FBAB4B7C4C7C1B7CEB1D7B7A1B9D6B1E2C3CA2E BC8A3C8AF20B8F0B5E55D>

Service-Oriented Architecture Copyright Tmax Soft 2005

<4D F736F F D203036B1C7BFF8BFC128C6AFC1FD292DC3D6C1BE>

이도경, 최덕재 Dokyeong Lee, Deokjai Choi 1. 서론

Ⅱ. Embedded GPU 모바일 프로세서의 발전방향은 저전력 고성능 컴퓨팅이다. 이 러한 목표를 달성하기 위해서 모바일 프로세서 기술은 멀티코 어 형태로 발전해 가고 있다. 예를 들어 NVIDIA의 최신 응용프 로세서인 Tegra3의 경우 쿼드코어 ARM Corte

Contributors: Myung Su Seok and SeokJae Yoo Last Update: 09/25/ Introduction 2015년 8월현재전자기학분야에서가장많이쓰이고있는 simulation software는다음과같은알고리즘을사용하고있다.


Slide 1

<4D F736F F D20C5EBC7D5C7D8BCAEBDC3BDBAC5DB5F D2BC0C720424D54B0E1B0FABAB8B0EDBCAD2E646F63>

Storage advances and Ne over fabric

PowerPoint Presentation

목 차 < 요약 > Ⅰ. 검토배경 1 Ⅱ. 반도체산업이경기지역경제에서차지하는위상 2 Ⅲ. 반도체산업이경기지역경제에미치는영향 7 Ⅳ. 최근반도체산업의여건변화 15 Ⅴ. 정책적시사점 26 < 참고 1> 반도체산업개관 30 < 참고 2> 반도체산업현황 31

Microsoft Word - DELL_PowerEdge_TM_ R710 서버 성능분석보고서.doc

Windows Embedded Compact 2013 [그림 1]은 Windows CE 로 알려진 Microsoft의 Windows Embedded Compact OS의 history를 보여주고 있다. [표 1] 은 각 Windows CE 버전들의 주요 특징들을 담고

Appendix B

슬라이드 1

6.24-9년 6월

클라우드컴퓨팅이란? WHAT IS CLOUD COMPUTING? 2

DBPIA-NURIMEDIA

CONTENTS CONTENTS CONTENT 1. SSD & HDD 비교 2. SSD 서버 & HDD 서버 비교 3. LSD SSD 서버 & HDD 서버 비교 4. LSD SSD 서버 & 글로벌 SSD 서버 비교 2

Microsoft PowerPoint - 알고리즘_1주차_2차시.pptx

Microsoft Word - 정병권

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Nov.; 25(11),

<4D F736F F D F5357BAB05FC5EBC7D5C7D8BCAEBDC3BDBAC5DB5FBCBAB4C920BAD0BCAE20B0E1B0FABAB8B0EDBCAD F444C F767

슬라이드 1

PowerPoint 프레젠테이션

06_ÀÌÀçÈÆ¿Ü0926

목 차 주요내용요약 1 Ⅰ. 서론 3 Ⅱ. 스마트그리드산업동향 6 1. 특징 2. 시장동향및전망 Ⅲ. 주요국별스마트그리드산업정책 17 Ⅳ. 미국의스마트그리드산업동향 스마트그리드산업구조 2. 스마트그리드가치사슬 3. 스마트그리드보급현황 Ⅴ. 미국의스마트그리드정

03.Agile.key

02 _ The 11th korea Test Conference The 11th korea Test Conference _

<C7D1B1B9C1A4BAB8BBEABEF7BFACC7D5C8B82D535720C7C3B7A7C6FB20C7D8B9FD20536F4320C0B6C7D5C0B8B7CE2DB3BBC1F62E687770>

PowerPoint 프레젠테이션

Think Z HP Z 워크스테이션이 세상에 나온 지 벌써 30년이 넘었습니다. 다방면의 요구를 충족하도록 설계된 HP Z 워크스테이션은 최신 혁신과 업계 선도적 기술을 도입하여 뛰어난 성능과 신뢰성을 제공합니다. 워크스테이션이 아니라 작업 자체에 더욱 집중할 수 있도

<4D F736F F D F5357BAB05FC5EBC7D5C7D8BCAEBDC3BDBAC5DB5FBCBAB4C920BAD0BCAE20B0E1B0FABAB8B0EDBCAD5F F

À¯Çõ Ãâ·Â

Microsoft PowerPoint - 발표_090513_IBM세미나_IPTV_디디오넷_완료.ppt

< D3131C8A32920BFF9B0A35F4954BBEABEF7B5BFC7E22E687770>

레이아웃 1

본보고서는 과학기술정보통신부정보통신진흥기금 을지원받아제작한것으로과학기술정보통신부의공식의견과다를수있습니다. 본보고서의내용은연구진의개인견해이며, 본보고서와관련한의문사항또는수정 보완할필요가있는경우에는아래연락처로연락해주시기바랍니다. 소프트웨어정책연구소기술 공학연구실추형석선임연

Master presentation template three line maximum — First Lastname Job Title

NX Nastran brochure (Korean)

Microsoft PowerPoint Q AMD DT channel training Nov.ppt

PowerPoint 프레젠테이션

클라우드컴퓨팅확산에따른국내경제시사점 클라우드컴퓨팅확산에따른국내경제시사점 * 1) IT,,,, Salesforce.com SaaS (, ), PaaS ( ), IaaS (, IT ), IT, SW ICT, ICT IT ICT,, ICT, *, (TEL)

CONTENTS 목차 1. 전원 및 설치시 주의사항 2 2. 시스템 사용시 바른 자세 4 3. 시스템 구성품 확인 5 슬림형 케이스1 6 슬림형 케이스2 7 타워형 케이스1 8 타워형 케이스2 9 일체형 케이스1 10 망분리형 케이스 시스템 시작 및 종료

항목

<30312DC2F7BCBCB4EBC4C4C7BBC6C32DBED5BACEBAD02E687770>

pseries, Systems Group pseries 2003 Corporation (p) Systems Group POWER4/POWER4+ pseries! +! + + The Only Complete UNIX on Demand

untitled

Backup Exec

Microsoft Word _반도체-최종

2010

Level 학습 성과 내용 1수준 (이해) 1. 기본적인 Unix 이용법(명령어 또는 tool 활용)을 습득한다. 2. Unix 운영체계 설치을 익힌다. 모듈 학습성과 2수준 (응용) 1. Unix 가상화 및 이중화 개념을 이해한다. 2. 하드디스크의 논리적 구성 능력

SW¹é¼Ł-³¯°³Æ÷ÇÔÇ¥Áö2013


Dell Overview Dell,, CAD, VR., ISV. Dell,. 28% Tower 28%. 60% MHz DDR 60%. 159% 2 Quadro P Tower CATIA 159%, 28, , 56 6

I

Simplify your Job Automatic Storage Management DB TSC

Microsoft Word - s.doc



example code are examined in this stage The low pressure pressurizer reactor trip module of the Plant Protection System was programmed as subject for

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

\\tsclient\C\Users\User\Deskto...

AGENDA 모바일 산업의 환경변화 모바일 클라우드 서비스의 등장 모바일 클라우드 서비스 융합사례

°í¼®ÁÖ Ãâ·Â

±èÇö¿í Ãâ·Â

(Microsoft Word - \274\366\301\244Edit _Hynix.doc)

CUDA Programming Tutorial 2 - Memory Management – Matrix Transpose


Microsoft PowerPoint - 권장 사양

UML

AGENDA 1. Cisco UCS 마켓업데이트 2. 진화하는애플리케이션 3. UCS 솔루션업데이트 4. 맺음말 2

Visual Studio online Limited preview 간략하게살펴보기

<BBEABEF7B5BFC7E22DA5B12E687770>

PowerPoint 프레젠테이션

Smarter Computing , Be real in 2012

APOGEE Insight_KR_Base_3P11

_LG히다찌 브로슈어

00내지1번2번

세션 Tutorial 1 강연 시간 5/11(수) 09:30-11:30 주 제 5G System: Vision & Enabling Technologies 성 명 강충구 소속기관명 고려대학교 부서/학과명 전기전자공학부 직 위 교수 5G 이동통신의 응용 분야에 따른 기술

PowerPoint 프레젠테이션

Microsoft PowerPoint - Session2 - Tibero 6

레드햇과 오픈스택 Feb, 2014 Kim Yong Ki Solution Architect Red Hat Korea RED HAT ENTERPRISE LINUX OPENSTACK PLATFORM 2014

목차 1. 제품 소개 특징 개요 Function table 기능 소개 Copy Compare Copy & Compare Erase

Transcription:

HPC 기본및동향

목차 I. 서론 II. III. 국내외동향 주요업체별동향 IV. 엑사스케일컴퓨팅이슈 V. 수행연구소개 1. 매니코어시스템기반작업처리기술연구 2. 매니코어시스템기반고성능 I/O 연구 3. 저전력프로세서기반슈퍼컴퓨팅활용기술개발 VI. 맺음말

I. 슈퍼컴퓨팅소개

I. 슈퍼컴퓨팅소개 슈퍼컴퓨터란? 슈퍼컴퓨터란? Top 500 세계성능순위 500 위권내의컴퓨터를매년유럽 (6 월, International Supercomputing Conference) 과미국 (11 월, Supercomputing Conference) 에서발표 4

I. 슈퍼컴퓨팅소개 슈퍼컴퓨팅이란? PC 나워크스테이션으로는풀기어려운대용량의정보들을초고속으로처리, 활용할수있는컴퓨터시스템 정보통신분야기술혁신을이끄는원천ㆍ기반기술 10 년동안약 1,000 배의성능향상 기술이전주기는더욱단축될것으로예상 초고성능컴퓨터 TFlops(10 12 Flops) 10 년 초고성능컴퓨터 PFlops(10 15 Flops) 서버및데스크탑 PC GFlops(10 9 Flops) HW/SW 기술이전 서버및데스크탑 PC TFlops(10 12 Flops) 모바일기기 MFlops(10 6 Flops) 모바일기기 GFlops(10 9 Flops) * [ 그림 ] 정보통신분야의기술이전방향 5

I. 슈퍼컴퓨팅소개 슈퍼컴퓨팅주요마일스톤 EDSAC (Electronic delay storage automatic calculator) Maurice Wilkes, University of Cambridge Mathematical Laboratory, 1949. Used one of the first assemblers called Initial Orders 제곱표와소수목록계산 Cray-1 Seymour Cray, 1976 Vector pipelining 136 Mflops MPP/Commodity Clusters ASCI Red, 1997 1 Teraflops Sandia National Lab Accelerated Strategic Computing Initiative 지원 Beowulf COTS Clusters, 1994 Thomas Sterling/Don Becker x86, Linux, Ethernet 80% of Top-500 list 6

I. 슈퍼컴퓨팅소개 How HPC fits into Scientific Computing? Air flow around an airplane Navier-stokes equations Algorithms, BCs, Solvers, Application codes, supercomputers Viz software * Source: H. Ryu, Lecture note: Introduction to Parallel Computing for Scientific Applications, 2014. 7

I. 슈퍼컴퓨팅소개 플린분류 (Flynn s Taxonomy) Classic classification of parallel architectures (Michael Flynn, 1966) Based on multiplicity of instruction streams, data storage Three major modes: SIMD, Shared Memory, Distributed Memory Different programming approaches are generally associated with different modes of parallelism (threads for shared, MPI for distributed) A modern supercomputer will have all three major modes present Today: SIMD / ILP, Shared Memory, Distributed Memory * Source: T. Sterling and A. Lumsdaine, Basics of Supercomputing, ISC Tutorial, 2014 8

I. 슈퍼컴퓨팅소개 예시 : 공유메모리및분산메모리활용 < 공유메모리시스템 (ccnuma)> <Hybrid 방식시스템 대부분의범용클러스터 > * Source: G. Hager and G. Wellein, Parallel Computers, Introduction to HPC for Scientists and Engineers, CRC press, 2011 9

I. 슈퍼컴퓨팅소개 슈퍼컴퓨터구성방식 벨의법칙 (Bell's Law) 주요컴퓨터아키텍처가 10 년주기로등장 Early research Early adoption Prime usage Phase out 초고성능컴퓨터구성방식 향후가속기나임베디드프로세서가많이쓰일것으로예상 <20 년간슈퍼컴구성방식비율 > < 벨의법칙기반슈퍼컴구성방식예상 > 10

I. 슈퍼컴퓨팅소개 가속기활용현황 Top500 내가속기활용비율 14% (2015) 최근 3 년간가장좋은에너지효율을보임 Intel Xeon Phi, AMD FirePro, NVIDIA K20x < 년도별가속기활용시스템수 > < 년도별최대에너지효율프로세서 > 11

II. 슈퍼컴퓨팅국내외동향

II. 슈퍼컴퓨팅국내외동향 선진국은슈퍼컴퓨팅의중요성을인식, 관련사업을체계적으로추진, 개발및활용에중점적으로투자중 미국 법적, 제도적인체계확보를통한기술개발주도 테러대응다음으로중요한국가연구개발사업으로지정하여추진 지속적, 적극적투자로세계최강국지위유지 세계최초로 고성능컴퓨팅법 재정 ( 91) 후속법안제정및중장기적전략목표수립ㆍ추진 * 2013 년 NITRD 프로그램은예산의 1/3 이상인약 1.5 조원을슈퍼컴퓨팅관련분야에투자 * 슈퍼컴퓨팅및관련기술개발에대한법적, 제도적인체계확보를통한기술개발을주도하고있으며, 슈퍼컴퓨팅을테러대응다음으로중요한국가연구개발사업으로지정하여추진 일본 세계두번째슈퍼컴퓨터제조국 국가경쟁력강화를위해전략적육성추진 세계 1 위슈퍼컴퓨터자체개발 ( 11) * 1980 년대후반부터국가지원으로슈퍼컴퓨터를개발 2011 년당시세계 1 위 K 컴퓨터개발 이화학연구소주도로엑사스케일을목표로한 Flagship2020 추진 ( 14 부터, 약 1,300 억엔 ) EU 25 개국참여 PRACE 프로제트로공동활용체제구축 * PRACE (Partnership for Advanced computing in Europe): 유럽의과학자와기술자에게최고급슈퍼컴퓨팅서비스를제공 인간의뇌를구현하는휴먼브레인프로젝트추진 * 23 까지약 11 억유로지원 영국은슈퍼컴퓨팅소프트웨어개발프로젝트에약 3,500 백만파운드지원 중국 국가주도의집중투자로신흥강국으로부상 2013 년세계 1 위슈퍼컴퓨터자체개발 863 계획에따라 15 년까지 2 대의 100PFlops 급구축예정 2020 년까지프로세서및시스템칩등자체기술개발목표 13 년약 4,300 억원투자로세계 1 위슈퍼컴퓨터를자체개발 연간 1 조원규모이상을슈퍼컴퓨터관련연구에투자 13

II. 슈퍼컴퓨팅국내외동향 Top 500 현황세계성능순위 500위권내의컴퓨터를매년유럽 (6월, International Supercomputing Conference) 과미국 (11월, Supercomputing Conference) 에서발표실측성능을기준으로한점유율에서미국, 중국, 일본, 독일, 프랑스, 영국의상위 6개국가가전체성능의약 83% 를차지 * [ 그림 ] Top 500 기준국가별성능점유율 ( 15.11) * Source: www.top500.org 14

II. 슈퍼컴퓨팅국내외동향 슈퍼컴퓨팅분야는초강국들의각축장 15

II. 슈퍼컴퓨팅국내외동향 초고성능컴퓨터시장동향 ( 억달러 ) 40 History and Forecast 2009-2018 by Product Class 35 30 25 20 15 10 Other Cloud Networks Software Services Storage Servers 5 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 * Source: Intersect360 Research, 2014 16

II. 슈퍼컴퓨팅국내외동향 슈퍼컴퓨터제작사현황 TOP500 기준 ( 15.11), 62% 의슈퍼컴퓨터는미국기업들이제작 2015년 11월기준 HP(156대 ), Cray(69대 ), IBM(45대 ), SGI(30대 ), Dell(11대 ) 등미국기업이 Top500 중 62% 이상을제작 Sugon(49대 ), lenovo(25대 ), Inspur(15대 ) 등의중국기업도 17% 이상을제작그외에도프랑스의 Bull(21대 ), 일본의 Fujitsu(12대 ) 등이있음 * [ 그림 ] 슈퍼컴퓨터제작사분포 ( 15.11 기준 ) 주요국의산업동향 미국 : 초고성능컴퓨팅시장을주도 중국 : 자국기업시장점유율 50% 이상 일본 : Fujistu, Hitachi 등활발 17

II. 슈퍼컴퓨팅국내외동향 KISTI 슈퍼컴퓨터변천사 1 호기 (1988~1993): 과학적기상예보시작및국산자동차설계및제작, 원자력의안정성분석 2 호기 (1993~2001): 2000 년부터 전략적자원할당제도 ( 현응용연구지원프로그램 ) 를통해일반연구자대상슈퍼컴퓨터활용과제공모 3 호기 (2002~2007): 전략과제, 거대도전과제지원, 산업체지원등으로활용 4 호기 (2008~ 현재 ): 핵심과학자, 창의도전연구, 거대문제, 산업체, 공공국가현안등지원으로확대 18

II. 슈퍼컴퓨팅국내외동향 한국의구축현황 10~ 13년(6월기준 ) 한국의슈퍼컴퓨팅자원및성능은답보상태 미국 6배, 중국 15배증가 14~ 15년한국의슈퍼컴퓨터성능은증가추세 13년 6월대비약 7배증가 ( 미국 1.6배, 중국 1.8배 ) 그러나아직미국, 중국, 일본대비현격히낮은수준 ( 15년 11월기준 ) 한국대비미국 24배, 중국 12배, 일본 5배수준 19

II. 슈퍼컴퓨팅국내외동향 경제력대비현격한성능격차 미국과한국의경제력격차는 13 배, 그러나슈퍼컴퓨팅성능격차는 24 배!! 경제력대비슈퍼컴퓨팅성능 * 한국을 1 로했을때의격차비율 * GDP 2015 년, 슈퍼컴퓨팅성능 2015 년하반기기준 * Source: 2015 년 IMF 자료, www.top500.org 20

II. 슈퍼컴퓨팅국내외동향 국내관련산업은전무한실정 슈퍼컴퓨팅관련산업은미국과유럽이주도하고일본과중국이도전하는상황 국내의경우메모리및하드디스크일부를제외하고전량수입에의존 20 조원 전세계 HPC 시장 39 조원 2,700 억원 ( 12년) ( 20년) ( 12년) 연 7.6% 성장 국내 HPC 시장 5,000 억원 ( 20 년예상 ) 다음분야에서시장규모및수요의폭발적증가예상 빅데이터 고성능서버 (HPC) 클라우드 IC Insight, 저전력시스템연평균 72% 성장예상 21

II. 슈퍼컴퓨팅국내외동향 슈퍼컴퓨터는과학기술수준을높여국가경쟁력을제고하는 핵심인프라로서수요가폭발적으로증가할예정 기술현황 산업특성 해외상황 자체개발기술은현격히낮음 국내슈퍼컴퓨팅시장은전무한현실 높은해외의존도 새로운차원의기술종속과경쟁열위발생 슈퍼컴퓨팅원천 / 기반기술은대규모슈퍼컴퓨터구축경험없이확보불가능 관련자체기술개발추진필요 HPC, 클라우드, 서버분야의향후시장규모의큰확대예상 이종시스템과저전력분야의블루오션가능성대두 미국이시장을주도, 국내는충분한산업경쟁력을갖추지못해정부차원지원필요 현재이종아키텍처를활용, 저전력시스템으로넘어가는기술전환기도래 선진국기술추격및세계적기술선도를이룰수있는좋은기회 국가차원슈퍼컴퓨팅역량및산업육성을위한 국가차원의종합추진체계마련 22

II. 슈퍼컴퓨팅국내외동향 슈퍼컴퓨팅육성법 2011년미국에이어세계 2번째로슈퍼컴퓨터육성법률제정 국가초고성능컴퓨터활용및육성에관한법률 주요내용 : 육성계획수립, 전담기구설치, 활용촉진등 목표 국가초고성능컴퓨팅기반을조성하여과학기술발전조성을통한 국가위기관리, 국민경제의발전, 국민의삶의질향상 주요내용 국가초고성능컴퓨팅육성기본계획, 시행계획수립 국가초고성능컴퓨팅위원회설치, 국가초고성능컴퓨팅센터의설립 초고성능컴퓨팅활용촉진 주요역할 국가초고성능컴퓨팅기반조성 연구개발의확대 국가초고성능컴퓨팅자원의도입 초고성능컴퓨팅전문인력의양성 국가초고성능컴퓨팅활성화 초고성능컴퓨팅자원의공동활용 국가초고성능컴퓨팅의활용촉진 초고성능컴퓨팅산업체지원 23

III. 주요업체별동향

III. 주요업체별동향 인텔매니코어프로세서의발전 High Bandwidth Memory 추가 NVM 및 Burst Buffer Storage 활용 25

III. 주요업체별동향 인텔매니코어프로세서 (Xeon Phi) 로드맵 26

III. 주요업체별동향 인텔매니코어프로세서 (Knights Landing) 구조및사양 27

III. 주요업체별동향 NVIDIA GPU 로드맵 28

III. 주요업체별동향 NVIDIA GPU 성능비교 2-way SIMD - FP16 Format 도입 29

III. 주요업체별동향 NVIDIA NVLINK 4 개의 NVLink 를내장, GPU 클러스터구성은 160GB/s 의 BW 을제공 30

III. 주요업체별동향 OpenPOWER Foundation 31

III. 주요업체별동향 OpenPOWER Foundation 의 NVIDIA 와의협업 32

III. 주요업체별동향 OpenPOWER Foundation 로드맵 33

IV. 엑사스케일컴퓨팅이슈소개

IV. 엑사스케일컴퓨팅이슈소개 엑사스케일슈퍼컴퓨터관련전망 지난 10 년간세계 1 위슈퍼컴퓨터의연산성능 35.86TF*( 03) 에서 20,132TF( 12) 으로약 561 배급증 * Teraflops : 초당 1조 (10 12 ) 회계산속도로대한민국국민전체 (5천만명 ) 가전자계산기로 5.5시간작업할계산량을 1초에연산하는속도 * 연산성능단위 : TF(TeraFlops,10 12 ) PF(PetaFlops, 10 15 ) EF(ExaFlops, 10 18 ) 2020 년, 전력 20MWatt 내엑사스케일 (10 18 ) 슈퍼컴출현예상 < 년도별슈퍼컴성능예상추이 (2014.11)> 35

IV. 엑사스케일컴퓨팅이슈소개 엑사스케일슈퍼컴퓨터관련전망 Top 500 성능증가추이 2015년 11월기준합계실제성능은 418PFlops, 연평균증가율약 77% 최근 2~3년은엑사스케일로의퀀텀점프를위한준비기간 곧엑사스케일도달전망 1위와 500위성능의시차는약 7 8년으로나타남 36

IV. 엑사스케일컴퓨팅이슈소개 엑사스케일컴퓨팅이슈 Tera Peta Peta Exa 국제공동전문가협의회 (International Exascale Software Project) Extreme parallelism and hybrid design Preparing for million/billion way parallelism Tightening memory/bandwidth bottleneck Limits on power/clock speed implication on multicore Reducing communication will become much more intense Memory per core changes, byte-to-flop ratio will change Necessary Fault Tolerance MTTF will drop and Checkpoint/restart has limitations 37

IV. 엑사스케일컴퓨팅이슈소개 Top 10 Exascale Research Challenges (Feb. 2014) 1. Energy efficiency 2. Interconnect 3. Memory Technology 4. Scalable System Software scalable, power and resilience aware 5. Programming systems massive parallelism, data locality, resilience 6. Data management data volume, velocity and diversity 7. Exascale Algorithms mathematical SW & optimization 8. Algorithms for discovery, design, and decision uncertainty quantification 9. Resilience and correctness faults, reproducibility, verification 10. Scientific productivity 38

V. KISTI 슈퍼컴퓨터 SW 연구실수행연구소개

V. 수행연구소개 문제점및해결방안 활용자원 문제점 해결방안 컴퓨팅 복잡성증가 HW & SW 최적화 성능보장 메모리네트워크 대규모화 안정성감소 효율화 안정성보장 소프트웨어 오류증가 에너지자원 전력소모증가 저전력화 40

V. 수행연구소개 슈퍼컴퓨터소프트웨어연구에서의고민 응용소프트웨어발전 ISV (Independent Software Vendor) In-house code 시스템소프트웨어 운영체제 : Linux 주요업체상용프로그램 Intel Parallel Studio, NVIDIA CUDA 등 하드웨어발전 프로세서 : Intel, NVIDIA, IBM, ARM 등 메모리 : 삼성전자, 하이닉스등 저장장치 : 삼성전자등 인터커넥트 : Mellanox, Intel 등 [ 고민 ] 우리가할수있는소프트웨어연구는? 41

V. 수행연구소개 HPC System Stack * Source: T. Sterling and A. Lumsdaine, Basics of Supercomputing, ISC Tutorial, 2014 42

V. 수행연구소개 소프트웨어연구방향 프로세서메모리스토리지인터커넥트 신규하드웨어구성품 ARMv8 (8 cores) x 9 nodes System on Chip (Mobile AP) x86 (72 cores) Manycore (KNL) GPU, SSD, 응용 시스템성능분석 실행성능최적화 안정성보장 저전력소모 최신트렌드 빅데이터기술 Cloud, Deep learning, IoT, 43

V.1. 매니코어시스템기반작업처리기술연구

V.1. 매니코어시스템기반작업처리기술연구 인텔매니코어프로세서변화 High Bandwidth Memory 추가 NVM 및 Burst Buffer Storage 활용 45

V.1. 매니코어시스템기반작업처리기술연구 인텔 KNL - 사양 (1/6) 46

V.1. 매니코어시스템기반작업처리기술연구 인텔 KNL 특징 (2/6) 47

V.1. 매니코어시스템기반작업처리기술연구 인텔 KNL - 구조 (3/6) 48

V.1. 매니코어시스템기반작업처리기술연구 인텔 KNL 메모리및클러스터모드 (4/6) Core: ~ 72 Core Memory: ~ 16GB MCDRAM, ~384GB DDR4 Memory Mode Cluster Mode NO SNC(All2All, Hemisphere, Quadrant), SNC-2, SNC-4 Best-Known Method : Quadrant + Cache mode 로시작 App 실행분석, 최적화진행 -> 다른 mode 로시도 49

V.1. 매니코어시스템기반작업처리기술연구 인텔 KNL MCDRAM 활용모델 (5/6) 50

V.1. 매니코어시스템기반작업처리기술연구 인텔 KNL MPSP (6/6) 51

V.1. 매니코어시스템기반작업처리기술연구 현재 KISTI 보유 KNL 서버현황 Chassis 2U 크기의 enclosure 안에 AP (Adams Pass) 타입의 4 개의서버 사양 36 Tile, 2 Core/Tile, 72 Core (silver버전) 64KB L1(32KB instruction, 32KB data), 1MB L2 2 IMC (Integrated Memory Controller) and 3 Channels/IMC 96GB DDR4 M/M, 2143 MT/s, 8G McDram 테스트결과 (6/22 이후공개 ) 52

V.1. 매니코어시스템기반작업처리기술연구 수행내용 매니코어프로세서기반프로그래밍모델개선연구 차세대매니코어프로세서 (Intel Knights Landing) 성능분석및최적화연구 매니코어프로세서기반기존병렬프로그래밍모델개선을위한요구사항도출 매니코어프로세서의신규메모리아키텍처분석 기존 DDR4 기반 Platform Memory외 On-Package, High-bandwidth Memory MCDRAM의 2계층구조분석 매니코어의연결구조및메모리계층구조를고려한성능분석 Omni Path 연결네트워크환경에서의노드간통신성능분석 53

V.2. 매니코어시스템기반고성능 I/O 연구

V.2. 매니코어시스템기반고성능 I/O 연구 엑사스케일시스템에서의스토리지및 I/O * Source: J. Dongarra, Impact of Architecture and Technology for Extreme Scale on Software and Algorithm Design, Cross-cutting Technologies for Computing at the Exascale, Feb 2-5, 2010. 55

V.2. 매니코어시스템기반고성능 I/O 연구 데이터집약형응용의확대 과학응용분야에서데이터집약형응용연구의지속적인확대 [AS-IS] 시뮬레이션데이터분석및가시화 (post processing) [TO-BE] 시뮬레이션 + 데이터분석및가시화 (in-situ, in-transit processing) 대표적인데이터집약형응용분야 [ 고에너지물리 ] 강입자충돌기 (LHC) 를이용한우주의기원발견 [ 기후과학 ] 전지구모델 (ESM) 을이용한기후변화예측 [ 생명공학 ] 차세대유전자시퀀싱 (NGS) 에기반한인간유전체분석 단계데이터생성 (Data Generation) 데이터처리및구성 (Data Processing) 데이터마이닝 (Data Mining) 인사이트도출 (Derive Insight) 역할시뮬레이션이나거대과학장비를통한데이터생성 (1) 쿼리기반분석및가시화를위한데이터변환, 가공및재구성 (2) 온라인분석 (in-situ analysis) 혹은후처리분석 (3) 데이터수집, 분배, 연계및공유 (1) 데이터간의관계, 연관분석을위한마이닝알고리즘적용 (2) 예측모델수행및지식발견 (1) 인사이트도출 (2) 이후의시뮬레이션혹은실험수행에반영 56

V.2. 매니코어시스템기반고성능 I/O 연구 슈퍼컴퓨터구조변화 데이터집약형응용지원을위한슈퍼컴퓨터구조변화및시스템도입사례확대 I/O 성능향상을위한 NVRAM, Burst Buffer 등의차세대 I/O 기술을이용한 I/O 가속시스템적용확대 도입사례 ( 예정 ): Summit (ORNL), Cori (LBNL) 등 57

V.2. 매니코어시스템기반고성능 I/O 연구 인텔 Omni-Path 기반계층적 I/O 아키텍쳐 NVM 및 Burst Buffer Storage 활용 계산노드로의데이터전진배치를통한데이터집약응용의효율적인지원 58

V.2. 매니코어시스템기반고성능 I/O 연구 NERSC-8 Use Case 시나리오 <NERSC-8(Cori) Architecture > Burst Buffer Use Cases Checkpoint-Restart Data Cache Temporary Job Data Data Analysis and Visualization 59

V.2. 매니코어시스템기반고성능 I/O 연구 수행내용 차세대매니코어프로세서기반 I/O 성능분석연구 KNL 에서의 3 가지구성에대한성능분석 1. SATA Interface + HDD (local) + ext4 2. PCIe + NVMe SSD (local) + ext4 3. Omni-Path Interface + HDD (remote) + Lustre (single node) 오픈소스를활용한계층적 I/O 시스템설계및구축 메모리기반차세대 I/O 스토리지출현으로 Memory-SSD-HDD간의효율적인연계활용이중요 차세대 I/O 스토리지기반계층적 I/O 시스템설계, 구축및최적화 60

V.3. 저전력프로세서기반슈퍼컴퓨팅활용기술개발

V.3. 저전력프로세서기반슈퍼컴퓨팅활용기술개발 전력소비및효율화 전력소비 : 슈퍼컴퓨터운용비용의큰부분 전력및전력분배 /UPS/ 냉각등 : 약 41.6% 향후고성능슈퍼컴의경우, 전력비용이더커질것으로예상 현재 KISTI 슈퍼컴퓨터전기료 : 년 26 억원 (2011 년 ) 전력효율화를위한 Mobile SoC 활용 Mobile SoC 의경우, 기본적으로배터리사용을전제로개발하여일정이하의전력소비에서최대한의성능을낼수있도록개발 < 배정밀도실수연산성능예상 > 62

V.3. 저전력프로세서기반슈퍼컴퓨팅활용기술개발 저전력프로세서기반클러스터프로토타입 프로세서 : 삼성 Exynos 7420 14nm 공정의 big.little 코어, 64bit ARM 프로세서 클러스터구성 관리노드 1 개, 컴퓨팅노드 8 개, 스위치노드 2 개, 스토리지노드 1 개 (250G), 1G Ethernet < 관리노드전자회로기판설계도면및실물 > < 컴퓨팅노드전자회로기판설계도면및실물 > < 스토리지노드전자회로기판설계도면및실물 > < 스위칭노드전자회로기판설계도면및실물 > 63

V.3. 저전력프로세서기반슈퍼컴퓨팅활용기술개발 수행내용 저전력프로세서기반시작품개선 서버집적도향상및소형화 시작품시스템안정화및검증 전력절감을위한시스템분석기법연구활용응용탐색및검증 64

VI. 맺음말

수행연구요약 목표 - 시스템활용극대화 SW 개발 주제 고려사항 : 성능, 안정성, 저전력 ( 단기 ) 매니코어시스템기반소프트웨어연구 ( 장기 ) 엑사스케일컴퓨팅대비소프트웨어연구 수행연구내용 ( 시스템분석기술연구 ) [ 컴퓨팅성능 ] 매니코어시스템기반작업처리기술연구 [I/O 성능 ] 매니코어시스템기반고성능 I/O 연구 [ 저전력프로세서활용 ] 저전력프로세서기반슈퍼컴퓨팅활용기술개발 66