Microsoft Word - Generic_Gas_Simulation_BMT 결과 보고서.doc

Similar documents
Appendix B

<4D F736F F D20C5EBC7D5C7D8BCAEBDC3BDBAC5DB5F D2BC0C720424D54B0E1B0FABAB8B0EDBCAD2E646F63>

Microsoft Word - DELL_PowerEdge_TM_ R710 서버 성능분석보고서.doc

슬라이드 1

<4D F736F F D F5357BAB05FC5EBC7D5C7D8BCAEBDC3BDBAC5DB5FBCBAB4C920BAD0BCAE20B0E1B0FABAB8B0EDBCAD5F F

<4D F736F F D F5357BAB05FC5EBC7D5C7D8BCAEBDC3BDBAC5DB5FBCBAB4C920BAD0BCAE20B0E1B0FABAB8B0EDBCAD F444C F767

<4D F736F F D20C7F6B4EBC0DAB5BFC2F75F44454C4C5FC5EBC7D5C7D8BCAEBDC3BDBAC5DB5F424D54B0E1B0FABAB8B0EDBCAD5F434C554E49585FB3BBBACEBFE

Microsoft Word - WRF_BMT보고서.doc

CONTENTS 목차 1. 전원 및 설치시 주의사항 2 2. 시스템 사용시 바른 자세 4 3. 시스템 구성품 확인 5 슬림형 케이스1 6 슬림형 케이스2 7 타워형 케이스1 8 타워형 케이스2 9 일체형 케이스1 10 망분리형 케이스 시스템 시작 및 종료

공개 SW 기술지원센터

untitled

클라우드컴퓨팅이란? WHAT IS CLOUD COMPUTING? 2

Ä¡¿ì³»ÁöÃÖÁ¾

Microsoft PowerPoint - eSlim SV [ ]

슬라이드 1

Microsoft PowerPoint - eSlim SV [080116]

<B1D7B7A1C7C8C4ABB5E5BBE7BEE72E786C7378>

Microsoft Word - zfs-storage-family_ko.doc

품질검증분야 Stack 통합 Test 결과보고서 [ The Bug Genie ]

Integ

서현수

안전을 위한 주의사항 제품을 올바르게 사용하여 위험이나 재산상의 피해를 미리 막기 위한 내용이므로 반드시 지켜 주시기 바랍니다. 2 경고 설치 관련 지시사항을 위반했을 때 심각한 상해가 발생하거나 사망에 이를 가능성이 있는 경우 설치하기 전에 반드시 본 기기의 전원을

Beyond Relational SQL Server, Windows Server 에디션비교 씨앤토트 SW 기술팀장세원

<목 차 > 제 1장 일반사항 4 I.사업의 개요 4 1.사업명 4 2.사업의 목적 4 3.입찰 방식 4 4.입찰 참가 자격 4 5.사업 및 계약 기간 5 6.추진 일정 6 7.사업 범위 및 내용 6 II.사업시행 주요 요건 8 1.사업시행 조건 8 2.계약보증 9 3

<BDBAB8B6C6AEC6F95FBDC3C0E55FC8AEB4EB5FC0CCC1D6BFCF5F E687770>

Microsoft PowerPoint - o8.pptx

이도경, 최덕재 Dokyeong Lee, Deokjai Choi 1. 서론

<49534F C0CEC1F520BBE7C8C4BDC9BBE720C4C1BCB3C6C320B9D D20BDC3BDBAC5DB20B0EDB5B5C8AD20C1A6BEC8BFE4C3BBBCAD2E687770>

[Brochure] KOR_TunA

비디오 / 그래픽 아답터 네트워크 만약에 ArcGolbe를 사용하는 경우, 추가적인 디스크 공간 필요. ArcGlobe는 캐시파일을 생성하여 사용 24 비트 그래픽 가속기 Oepn GL 2.0 이상을 지원하는 비디오카드 최소 64 MB 이고 256 MB 이상을 메모리


CONTENTS CONTENTS CONTENT 1. SSD & HDD 비교 2. SSD 서버 & HDD 서버 비교 3. LSD SSD 서버 & HDD 서버 비교 4. LSD SSD 서버 & 글로벌 SSD 서버 비교 2

빅데이터시대 Self-BI 전략 이혁재이사 비아이씨엔에스

< FC1A6BEC8BFE4C3BBBCAD2E687770>

1. GigE Camera Interface를 위한 최소 PC 사양 CPU : Intel Core 2 Duo, 2.4GHz이상 RAM : 2GB 이상 LANcard : Intel PRO/1000xT 이상 VGA : PCI x 16, VRAM DDR2 RAM 256MB

APOGEE Insight_KR_Base_3P11

시스템, 네트워크모니터링을통한보안강화 네트워크의미래를제시하는세미나 세미나 NetFocus 2003 : IT 관리자를위한네트워크보안방법론 피지피넷 /

Oracle9i Real Application Clusters

Microsoft Word - 3부A windows 환경 IVF + visual studio.doc

Microsoft PowerPoint - 발표_090513_IBM세미나_IPTV_디디오넷_완료.ppt

Contributors: Myung Su Seok and SeokJae Yoo Last Update: 09/25/ Introduction 2015년 8월현재전자기학분야에서가장많이쓰이고있는 simulation software는다음과같은알고리즘을사용하고있다.

Microsoft Word _whitepaper_latency_throughput_v1.0.1_for_

adfasdfasfdasfasfadf

PCServerMgmt7

pseries, Systems Group pseries 2003 Corporation (p) Systems Group POWER4/POWER4+ pseries! +! + + The Only Complete UNIX on Demand

슬라이드 1

Microsoft PowerPoint APUE(Intro).ppt

<4D F736F F D20524E B1D7B7A1C7C8C3B3B8AEBCBAB4C9BAD0BCAEBAB8B0EDBCAD5F E646F63>

Microsoft Word - CAE 클러스터 환경 구축-ABAQUS.doc

Microsoft PowerPoint Q AMD DT channel training Nov.ppt

PowerPoint Presentation

PowerPoint Presentation

비트와바이트 비트와바이트 비트 (Bit) : 2진수값하나 (0 또는 1) 를저장할수있는최소메모리공간 1비트 2비트 3비트... n비트 2^1 = 2개 2^2 = 4개 2^3 = 8개... 2^n 개 1 바이트는 8 비트 2 2

AGENDA 모바일 산업의 환경변화 모바일 클라우드 서비스의 등장 모바일 클라우드 서비스 융합사례

Result Cache 동작원리및활용방안 엑셈컨설팅본부 /DB 컨설팅팀김철환 개요 ORACLE DBMS 를사용하는시스템에서 QUERY 성능은무엇보다중요한요소중하나이며그 성능과직접적인관련이있는것이 I/O 이다. 많은건수를 ACCESS 해야만원하는결과값을얻을수있는 QUER

Dell과 함께라면 가능합니다. 처음 도입하는 서버 또는 두 번째로 도입하는 서버이거나 네트워크를 확장시키거나 관리 기능을 강화하는 등의 모든 요구 사항을 Dell은 지원할 수 있습니다. Dell은 특성이 각기 다른 모든 조직과 회사마다 서로 다른 시점에 서로 다른 요

NX Nastran brochure (Korean)

Microsoft PowerPoint - HW_SW_LSP강의_조재구강사.ppt

ISP and CodeVisionAVR C Compiler.hwp

슬라이드 1

08이규형_ok.hwp

CyberLink YouCam

6.24-9년 6월

PowerPoint 프레젠테이션

강의10

Microsoft Word - src.doc

초보자를 위한 분산 캐시 활용 전략

PowerPoint 프레젠테이션

Microsoft Word - s.doc

PowerPoint 프레젠테이션

1. 제품 개요 WeGuardia WIPS V2.0(이하 TOE)은 특정 조직에서 운영되는 무선랜에 대한 지속적인 모니터을 통해 내 외부로부터 발생할 수 있는 각종 침입을 탐지 및 차단하여 내부의 네트워크를 보호하는 무선침입방지시스템이다. TOE의 세부 식별자 및 배포

Microsoft Word - How to make a ZigBee Network_kr

슬라이드 1

thesis-shk

삼성전자는 Windows 를 권장합니다. PC 소프트웨어 PC 솔루션 삼성 삼성전자만의 편리하고 다양한 소프트웨어를 통해 초보자도 보다 쉽고 빠르게 이용 가능합니다. Easy Settings 삼성 패스트 스타트 Easy File Share (PC to PC) (삼성 컨

Splentec V-WORM Quick Installation Guide Version: 1.0 Contact Information 올리브텍 주소 : 경기도성남시분당구구미로 11 ( 포인트타운 701호 ) URL: E-M

How to Use the PowerPoint Template

solution map_....

슬라이드 1

歯DCS.PDF

Microsoft PowerPoint - 30.ppt [호환 모드]

Microsoft PowerPoint - ch07.ppt

Microsoft PowerPoint - 권장 사양

Microsoft PowerPoint - Altevo FS-2212S

Microsoft PowerPoint - Infiniband 20Gb 40Gb Switch HCA (??_1).ppt [Compatibility Mode]

Chapter ...

untitled

vostro2월CDM4.0

리뉴얼 xtremI 최종 softcopy

R50_51_kor_ch1

기업은행현황-표지-5도

Microsoft PowerPoint - 알고리즘_5주차_1차시.pptx

Deok9_Exploit Technique

1217 WebTrafMon II

ODS-FM1

Flute-GR_BV199_DOS.indb

歯이시홍).PDF

fprintf(fp, "clf; clear; clc; \n"); fprintf(fp, "x = linspace(0, %d, %d)\n ", L, N); fprintf(fp, "U = [ "); for (i = 0; i <= (N - 1) ; i++) for (j = 0

Tekla Structures 설치

PowerPoint Presentation

Transcription:

HPC 기반 Generic Gas Simulation 성능분석보고서 본자료는 클루닉스에서자사시뮬레이션포털구성제품인 GridCenter-CAP 통합 CAE 해석환경을이용하여동국대공과대의시뮬레이션코드의성능을측정된자료입니다. 클루닉스와동국대공과대의동의없이본자료의무단배포를허가하지않습니다. 테스트환경 : GridCenter-CAP, GridCenter-HPC, CAE 어플리케이션 (ANSYS) 테스트주관 : 클루닉스기술부테스트일자 : 28년 11월 12일 ~28년 11월 14일시스템구축밑튜닝 : 클루닉스기술부 / 서진우 CAE 어플리케이션구축및튜닝 : 클루닉스기술부 / 서진우

BMT 기본환경정보 Simulation Code: sample_smoke.sim( 1 frame 해석 ), sample_smoke_using_mls.sim(1 frame 해석 ) 클러스터기반통합해석환경 : GridCenter-CAP 1.9 클러스터병렬 API 환경 : Lam-7.1.2 BMT 시스템사양정보 BMT1 BMT2 BMT3 Cpu Intel(R) Xeon(R) CPU 542 @2.5GHz (8core) Memory 16GByte Disk SATA2 25GB Network Intel Gigabit Node number 4 Cpu Intel(R) Core(TM)2 Quad CPU Q67 @2.66GHz (4core) Memory 4GByte Disk SATA2 25GB Network Intel Gigabit Node number 3 Cpu Intel(R) Core(TM)2 CPU 66 @ 2.4GHz (2core) Memory 4GByte Disk SATA2 25GB Network Intel Gigabit Node number 3 BMT 시나리오 1. 각 BMT 시스템환경별로 Generic_Gas_Example code에대한클러스터최적환경을구성한후계산수행 processor를증가시킬경우성능확장가능성을측정한다. 2. 각 BMT 시스템환경별성능을비교한다. - 해석예제별 scalability 성능측정 - BMT시스템간의성능비교측정 - 최적화전후성능비교측정 BMT 수행방법 1. 본 BMT 환경에맞게 Makefile(Makefile.common, Makefile.Physbam 등 ) 을수정함. 2. Object 파일명을결정하는 PLATFORM 변수값을클루닉스의슈퍼컴퓨터이름인 teragon으로정의함. 3. 각 BMT 시스템에 lam-7.1.2 와 gcc compiler를연동한 MPI 환경구성후요청받은코드를컴파일함. 4. mpirun np <processor_number>./main_teragon s simple_smoke.sim d 3 수행 5. mpirun np <processor_number>./main_teragon s simple_smoke_using_mls.sim d 3 수행

BMT 결과 측정단위 / 초 (sec) BMT1_HPC Simple_smoke.sim Simple_smoke_using_MLS.sim Np=1 152 169132 Np=4 5429 42389 Np=8 5335 2131 Np=16 2811 177 Np=24 1987 7155 Np=32 1548 5364 BMT2_HPC Simple_smoke.sim Simple_smoke_using_MLS.sim Np=1 14135? 1593 Np=4 858? 39825 Np=8 5714 1995 Np=12 2581 13275 BMT3_HPC Simple_smoke.sim Simple_smoke_using_MLS.sim Np=1 X(FP overflow) x Np=4 X(FP overflow) 5852(2+2) Np=6 X(FP overflow) 2639(2+2+2) 본격적인 BMT 전에 BMT1 시스템에서몇가지단위테스트를진행하여본해석의시스템자원사용현황을미리파악해보았음. Simple_smoke.sim 해석에이용되는시스템자원은 Total Memory가 8~9GByte, 결과데이터가 6.8~7Gbyte 정도생성되는것을확인함. CPU 사용률은매우좋은편 ( 평균96% 이상 ) 으로 CPU의대부분을 user processing에이용되는것을확인함. Simple_smoke_using_MLS.sim 해석의경우는 CPU 사용률은매우우수하며, 해석에필요한메모리는 3~4Gbyte 정도소요되는것을확인함. Simple_smoke.sim의경우 4대구성에 32core를이용하여테스트할경우네트워크최대사용량은 2Mbps 정도사용되는것을확인함. 반면 simple_smoke_using_mls.sim 의경우해석시네트워크자원은거의사용하지않음을확인함. Simple_smoke.sim의경우 BMT2와 BMT3 시스템의경우노드당 4Gbyte 용량의메모리를가지고있으므로 1노드테스트는진행할수없었음. ( 과도한 Swap memory 사용 ) 2노드로계산시 1.5Gbyte의 Swap이사용됨.

또한 BMT3 시스템환경인 Intel(R) Core(TM)2 CPU에서는 6frame 단계에서 Floating point overflow 에러가발생하며, 해석이더이상진행되지않는문제가발생함. 최소메모리용량인 9Gbyte 이상의메모리를이용하고, 다양한 CPU 코어수로계산을하더라도항상 6frame 단계에서같은에러가발생함. BMT3 시스템에서발생한에러콘솔메시지는아래와같음 ** ERROR: SIGNAL SIGFPE (8) ** Floating point exception: reason 4 = "FP overflow", from address xaf14ee 아래는단위테스트를통해확인된주요리소스사용현황을모니터링한화면임. 해석시프로세스모니터링화면 Simple_smoke.sim 해석시주요시스템자원사용현황

Simple_smoke_using_MLS.sim 해석시주요시스템자원사용현황 몇가지단위테스트를통해본해석의최적화요소및해석예제별자원사용패턴을분석하고, 분석된내용을토대로본격적인 BMT를진행함. BMT 결론은 Simple_smoke.sim 예제와 Simple_smoke_using_MLS.sim 예제의해석진행시시스템자원사용패턴은매우다르다는것이다. Simple_smoke.sim 예제는보편적인 MPP 클러스터시스템으로병렬처리해석시 BMT1 환경에서 32core 해석시 1core에비해 6.7배정도의성능향상이확인됨. BMT2의경우 12core로해석시 1core 대비 5.4 배의성능향상이확인됨 (BMT1에비해상대적으로높음 ). 하지만 BMT2 시스템의경우 1core~4core 해석시최소필요한 9GByte 이상의메인메모리확보가안되어, Swap이사용됨을가만하면실제확장성능은 BMT1과유사할것이라추측됨. (BMT2의경우 1core~4core 해석시 1.5Gbyte 정도의 swap 디스크사용으로인해평균 CPU 사용률이 88% 정도유지됨 )

simple_smoke.sim 성능결과 -BMT1 시스템 12 8 1 7 6 8 5 6 4 4 3 speedup speedup 2 2 1 Np=1 Np=4 Np=8 Np=16 Np=24 Np=32 core 수 (1 core 사용시 3 시간실행, 32core 사용시 25 분실행 ) Simple_smoke_using_MLS.sim 예제의경우 BMT1 과 BMT2 시스템모두매우이상적인병렬성이제공됨을확인할수있었음. BMT1 시스템의경우 32core 해석성능이 1core 대비 31배정도의성능이나오는것을확인하였고, BMT2의경우도 12core 해석이 1core 해석시간대비 11배이상의성능개선이되는것을확인할수있었음. simple_smoke_using_mls.sim 성능결과 -BMT1 시스템 18 35 16 14 12 3 25 1 8 2 15 speedup speedup 6 4 2 1 5 Np=1 Np=4 Np=8 Np=16 Np=24 Np=32 core 수 (1core 사용시 47 시간실행, 32core 사용시 1 시간 3 분실행 )

실제두예제해석시시스템리소스사용현황을살펴보면, 두예제모두 CPU 사용률은매우좋은효율을가지고있으나, 네트워크의경우 simple_smoke는 32core 해석의경우 2Mbps 이상의네트워크대역이사용되지만, simple_smoke_using_mls 예제의경우병렬해석시네트워크자원의사용이거의없음을확인할수있었음. 두예제의성능에직접적인영향을주는요소의차이가존재함으로두예제를모두사용하는환경의경우각예제별해석비중과요구수행시간등을고려하여적절한설계가필요할듯함. 본보고서에기록된테스트이외의몇가지입증테스트를통해 node 수, core수, 메모리성능, CPU Clock, disk I/O 처리방식, CPU balancing 방식, L2 Cache Memory 성능, Cache Memory shared 방식, Network 구성방식등에의해상당부분의성능에영향을줄수있음을확인함. 아래는 BMT 1 시스템의 CPU(Intel Xeon E542) 와 BMT2 시스템의 CPU(Intel Quad Q67) 간의성능비교측정결과이다. BMT1 vs BMT2 성능비교 16 14 12 1 8 6 4 2 BMT1 BMT2 np=1 np=4 np=8 core 수 위테스트결과로만보면 BMT1 시스템의 core 별처리성능이더우수한걸로평가된다. 하지만앞서언급한내용처럼 1core ~ 8core 까지 BMT2의경우 Swap 디스크를사용했다는것을고려해야할것이다. BMT2 시스템에서 simple_smoke.sim 해석시 swap의영향을받지않은테스트환경은 np=12에서의환경이다. 이때처리된속도는 2581초로 BMT1의 np=16에서의속도인 2811초보다더우수하다는것을확인할수있다. 하지만그렇다고 Intel Quad Core Q67(BMT2) 환경이 Intel Xeon E542 (BMT1) 환경보다우수하다고볼수는없다. 실제 simple_smoke.sim 의경우 L2 cache memory 성능과 cache memory shared 방식에따라매우큰성능차이를보인다. BMT1 시스템의 processor balancing 방식을실제예제에서요구하는구조로최적화하면, 똑같은 core수에서 BMT2에비해 2배에가까운성능이나오는것을확인하였다. ( 아래테스트결과참고 ) Simple_smoke.sim의경우 MLS를이용한예제에비해상대적으로프로세서의병렬처리효율이떨어지는것을확인되었다. 하지만해당해석에대해성능개선요소를파악한후몇가지최적화요소를적용함으로, 클러스터확장성능의개선을확인할수있었음. 아래는 BMT1 시스템에서 simple_smoke.sim 예

제를가지고클러스터환경을최적화한후동일한방법으로재측정한결과이다. Simple_smoke 예제최적화전후성능비교 12 1 8 6 4 최적화전최적화후 2 Np=1 Np=4 Np=8 Np=16 core 수 Simple_smoke.sim 예제의경우 32core에서 1core 대비 6.7배성능개선효과가본최적화환경에서는 16core에서 6.6 배정도의성능개선이일어났다. 앞서언급한성능주요요소들을최적화하여최적의 processor balanced 상태를유지하면, 3% ~8% 까지성능개선효과를확인할수있었음. 아래는본 BMT 에사용된클러스터시스템구축및운영미들웨어인그리드센터관리주요화면임. 클러스터시스템통합모니터링화면

클러스터시스템프로세스통합모니터링화면 클러스터시스템네트워크실시간모니터링화면