<4D F736F F D20C7F6B4EBC0DAB5BFC2F75F44454C4C5FC5EBC7D5C7D8BCAEBDC3BDBAC5DB5F424D54B0E1B0FABAB8B0EDBCAD5F434C554E49585FB3BBBACEBFE

Similar documents
<4D F736F F D20C5EBC7D5C7D8BCAEBDC3BDBAC5DB5F D2BC0C720424D54B0E1B0FABAB8B0EDBCAD2E646F63>

<4D F736F F D F5357BAB05FC5EBC7D5C7D8BCAEBDC3BDBAC5DB5FBCBAB4C920BAD0BCAE20B0E1B0FABAB8B0EDBCAD F444C F767

<4D F736F F D F5357BAB05FC5EBC7D5C7D8BCAEBDC3BDBAC5DB5FBCBAB4C920BAD0BCAE20B0E1B0FABAB8B0EDBCAD5F F

Microsoft Word - DELL_PowerEdge_TM_ R710 서버 성능분석보고서.doc

슬라이드 1

Appendix B

Microsoft Word - Generic_Gas_Simulation_BMT 결과 보고서.doc

Microsoft Word - WRF_BMT보고서.doc

공개 SW 기술지원센터

Microsoft PowerPoint - Infiniband 20Gb 40Gb Switch HCA (??_1).ppt [Compatibility Mode]

Dell과 함께라면 가능합니다. 처음 도입하는 서버 또는 두 번째로 도입하는 서버이거나 네트워크를 확장시키거나 관리 기능을 강화하는 등의 모든 요구 사항을 Dell은 지원할 수 있습니다. Dell은 특성이 각기 다른 모든 조직과 회사마다 서로 다른 시점에 서로 다른 요

Microsoft PowerPoint - eSlim SV [ ]

Microsoft Word - zfs-storage-family_ko.doc

Microsoft PowerPoint - eSlim SV [080116]

CONTENTS 목차 1. 전원 및 설치시 주의사항 2 2. 시스템 사용시 바른 자세 4 3. 시스템 구성품 확인 5 슬림형 케이스1 6 슬림형 케이스2 7 타워형 케이스1 8 타워형 케이스2 9 일체형 케이스1 10 망분리형 케이스 시스템 시작 및 종료

Microsoft Word - CAE 클러스터 환경 구축-ABAQUS.doc


Æí¶÷4-¼Ö·ç¼Çc03ÖÁ¾š

슬라이드 1

<49534F C0CEC1F520BBE7C8C4BDC9BBE720C4C1BCB3C6C320B9D D20BDC3BDBAC5DB20B0EDB5B5C8AD20C1A6BEC8BFE4C3BBBCAD2E687770>

<목 차 > 제 1장 일반사항 4 I.사업의 개요 4 1.사업명 4 2.사업의 목적 4 3.입찰 방식 4 4.입찰 참가 자격 4 5.사업 및 계약 기간 5 6.추진 일정 6 7.사업 범위 및 내용 6 II.사업시행 주요 요건 8 1.사업시행 조건 8 2.계약보증 9 3

<4D F736F F D20524E B1D7B7A1C7C8C3B3B8AEBCBAB4C9BAD0BCAEBAB8B0EDBCAD5F E646F63>

3.Bladesystem

MZ601_QG_0527_L-SKT.pdf

MB860_Q_0405_L-SKT.pdf

APOGEE Insight_KR_Base_3P11

1. GigE Camera Interface를 위한 최소 PC 사양 CPU : Intel Core 2 Duo, 2.4GHz이상 RAM : 2GB 이상 LANcard : Intel PRO/1000xT 이상 VGA : PCI x 16, VRAM DDR2 RAM 256MB

품질검증분야 Stack 통합 Test 결과보고서 [ The Bug Genie ]

Integ

Microsoft Word _whitepaper_latency_throughput_v1.0.1_for_

이도경, 최덕재 Dokyeong Lee, Deokjai Choi 1. 서론

NX Nastran brochure (Korean)

<BDBAB8B6C6AEC6F95FBDC3C0E55FC8AEB4EB5FC0CCC1D6BFCF5F E687770>


untitled

KDTÁ¾ÇÕ-2-07/03

vostro2월CDM4.0

Ä¡¿ì³»ÁöÃÖÁ¾

목차 윈도우드라이버 1. 매뉴얼안내 운영체제 (OS) 환경 윈도우드라이버준비 윈도우드라이버설치 Windows XP/Server 2003 에서설치 Serial 또는 Parallel 포트의경우.

< FC1A6BEC8BFE4C3BBBCAD2E687770>

클라우드컴퓨팅이란? WHAT IS CLOUD COMPUTING? 2

Microsoft Word - s.doc

SW

1 SW

Dell Overview Dell,, CAD, VR., ISV. Dell,. 28% Tower 28%. 60% MHz DDR 60%. 159% 2 Quadro P Tower CATIA 159%, 28, , 56 6

CONTENTS CONTENTS CONTENT 1. SSD & HDD 비교 2. SSD 서버 & HDD 서버 비교 3. LSD SSD 서버 & HDD 서버 비교 4. LSD SSD 서버 & 글로벌 SSD 서버 비교 2

PowerPoint Presentation

R50_51_kor_ch1

비디오 / 그래픽 아답터 네트워크 만약에 ArcGolbe를 사용하는 경우, 추가적인 디스크 공간 필요. ArcGlobe는 캐시파일을 생성하여 사용 24 비트 그래픽 가속기 Oepn GL 2.0 이상을 지원하는 비디오카드 최소 64 MB 이고 256 MB 이상을 메모리

Microsoft Word - ICT Reprot

삼성전자는 Windows 를 권장합니다. PC 소프트웨어 PC 솔루션 삼성 삼성전자만의 편리하고 다양한 소프트웨어를 통해 초보자도 보다 쉽고 빠르게 이용 가능합니다. Easy Settings 삼성 패스트 스타트 Easy File Share (PC to PC) (삼성 컨

USER Manual

<B1D7B7A1C7C8C4ABB5E5BBE7BEE72E786C7378>

PowerPoint Presentation

PowerPoint 프레젠테이션

1. 제품 개요 AhnLab Policy Center 4.6 for Windows(이하 TOE)는 관리대상 클라이언트 시스템에 설치된 안랩의 안티바이러스 제품인 V3 제품군에 대해 보안정책 설정 및 모니터링 등의 기능을 제공하여 관리대상 클라이언트 시스템에 설치된 V3

Microsoft PowerPoint Q AMD DT channel training Nov.ppt

USER Manual

Microsoft PowerPoint - Lync_Launch_Keynote_Presentation_Session3_Ver_1

PowerPoint Presentation

임베디드시스템설계강의자료 4 (2014 년도 1 학기 ) 김영진 아주대학교전자공학과

CyberLink YouCam

vostro11월CDM188x257 최종

PowerPoint 프레젠테이션

씨에이에스는 서울특별시 시설관리공단 계약 제1579호( ) 장애인 콜택시 콜센터 차량관제시스템 구축사업 감리용역 에 근거하여 카나스 에서 수행중인 장애인콜택시 콜센터 차량관제시스템 구축사업에 대한 최종감리를 실시하고 본 보고서를 제출합니다

Microsoft Word - 3부A windows 환경 IVF + visual studio.doc

OfficeServ 솔루션 OfficeServ 솔루션 OfficeServ는 삼성전자의 기업형 IP 솔루션으로서 음성과 데이터, 유선과 무선이 융합된 미래 오피스형 솔루션입니다. OfficeServ 7400/7200 삼성전자가 다년간 쌓아 온 기간망 사업 경험 및 모바일

Microsoft Word - 21_반도체.doc

HPC Azure - Scalable, Distributed Applications in Windows Azure

Microsoft PowerPoint - HW_SW_LSP강의_조재구강사.ppt

Microsoft Word - 산업분석리포트 doc

스포일러 스포일러 기획 이슈 학교 미디어교육을 위한 협력의 물꼬를 트다 Contents 스포일러 새롭고 여전한 미디어현장을 만들어가는 사람들 기획 + 특집 학교 미디어교육을 위한 협력의 물꼬를 트다 문연옥 인물 + 인터뷰 성서공동체FM 정수경 대표 정보 + 기술 이현주

1. 제품 개요 WeGuardia WIPS V2.0(이하 TOE)은 특정 조직에서 운영되는 무선랜에 대한 지속적인 모니터을 통해 내 외부로부터 발생할 수 있는 각종 침입을 탐지 및 차단하여 내부의 네트워크를 보호하는 무선침입방지시스템이다. TOE의 세부 식별자 및 배포

Microsoft Word - PLC제어응용-2차시.doc

X86 Customer, BP, and Sales Enablement Organization

Oracle9i Real Application Clusters

Microsoft PowerPoint - User Manual pptx

MB525_M_1104_L.pdf

<4D F736F F F696E74202D203137C0E55FBFACBDC0B9AEC1A6BCD6B7E7BCC72E707074>

안전을 위한 주의사항 제품을 올바르게 사용하여 위험이나 재산상의 피해를 미리 막기 위한 내용이므로 반드시 지켜 주시기 바랍니다. 2 경고 설치 관련 지시사항을 위반했을 때 심각한 상해가 발생하거나 사망에 이를 가능성이 있는 경우 설치하기 전에 반드시 본 기기의 전원을

1. PVR Overview PVR (Personal Video Recorder), CPU, OS, ( 320 GB) 100 TV,,, Source: MindBranch , /, (Ad skip) Setop BoxDVD Combo

BY-FDP-4-70.hwp

Microsoft PowerPoint - 발표_090513_IBM세미나_IPTV_디디오넷_완료.ppt

슬라이드 1

solution map_....

Microsoft PowerPoint - ch07.ppt

Level 학습 성과 내용 1수준 (이해) 1. 기본적인 Unix 이용법(명령어 또는 tool 활용)을 습득한다. 2. Unix 운영체계 설치을 익힌다. 모듈 학습성과 2수준 (응용) 1. Unix 가상화 및 이중화 개념을 이해한다. 2. 하드디스크의 논리적 구성 능력

Microsoft PowerPoint - chap01-C언어개요.pptx

Windows Server 2012

pseries, Systems Group pseries 2003 Corporation (p) Systems Group POWER4/POWER4+ pseries! +! + + The Only Complete UNIX on Demand

Contents I. 칼라스 네트워크 플레이어란 1. Pc-Fi를 넘어서 발전한 차세대 음악 플레이어 칼라스 네트워크 플레이어의 장점 3. 시스템 기본 구성

Mango-IMX6Q mfgtool을 이용한 이미지 Write하기

파인드라이브를 사용해 주셔서 대단히 감사합니다. 제품을 사용하시기 전에 반드시 이 설명서를 읽어 주십시오. 제품의 수명은 올바른 사용법과 비례하며, 불완전한 사용은 제품 고장은 물론 차량손상과 교통사고의 원인이 될 수 있습니다. 본 문서는 MONSTER 3 모델을 기준

rv 브로슈어 국문

<C7D1B1B9C1A4BAB8BBEABEF7BFACC7D5C8B82D535720C7C3B7A7C6FB20C7D8B9FD20536F4320C0B6C7D5C0B8B7CE2DB3BBC1F62E687770>


Think Z HP Z 워크스테이션이 세상에 나온 지 벌써 30년이 넘었습니다. 다방면의 요구를 충족하도록 설계된 HP Z 워크스테이션은 최신 혁신과 업계 선도적 기술을 도입하여 뛰어난 성능과 신뢰성을 제공합니다. 워크스테이션이 아니라 작업 자체에 더욱 집중할 수 있도

Boot Camp 설치 및 설정 설명서

ePapyrus PDF Document

* ~2..

Transcription:

현대자동차통합해석시스템 BMT 결과상세분석보고서 클루닉스 본자료는 클루닉스에서 DELL 인터내셔널의요청에의해현대자동차에제안할 DELL PowerEdge R71 System에대한 CAE 해석 S/W의병렬처리성능을측정한 BMT 결과보고서입니다. BMT 환경 : GridCenter-CAP, GridCenter-HPC BMT S/W : LS-DYNA, PAM-STAMP, ABAQUS, STARCCM+, PowerFlow BMT 진행 : 클루닉스 BMT 일자 : 29년 8월 12일 ~29년 8월 23일시스템구축및최적화 : 클루닉스 / 서진우수석 (alang@clunix.com) CAE 어플리케이션구축및최적화 : 클루닉스 / 서진우수석 (alang@clunix.com) 1/21 페이지

목차 1. BMT 요약 2. BMT 환경정보 3. BMT 시나리오소개 4. BMT 항목별세부분석및결론 첨부 > 해석결과후처리화면 GridCenter-CAP 작업진행화면 2/21 페이지

1. BMT 요약 본 BMT는 DELL 인터내셔널의요청에의해진행되었으며, BMT 목적은현대자동자기술연구소에신규도입될 통합해석시스템 의성능을도입전부분예측하고, 구축대상업체에대한관련분야기술력과사업진행가능성을사전에평가하고자함입니다. 클루닉스에서는주어진 BMT 시나리오를바탕으로자사의 CAE 통합해석시스템구축운영솔루션인 GridCenter-CAP 을통해테스트를진행하였으며, 그결과는아래와같습니다. 병렬계산성능결과 표기방식 : 시분초 (hms) 8core 16core 32core 48core ABAQUS 21시간41분12초 11시간48분24초 6시간24분9초 4시간18분52초 LSDYNA 3시간17분29초 17시간2분12초 9시간11분58초 Powerflow 86시간36분2초 47시간23분18초 26시간33분48초 19시간8분2초 PAMSTAMP 19시간25분24초 1시간55분52초 5시간44분7초 STARCCM+ 36 시간 1 분 48 초 2 시간 42 분 28 초 1 시간 45 분 2 초 최적화를통한성능개선결과 H/W 기본구성 H/W, OS 튜닝 네트워크튜닝 스케줄러튜닝 ABAQUS 15시간5분17초 12시간23분16초 11시간48분24초 7시간26분22초 LSDYNA 25시간28분49초 17시간2분12초 17시간2분12초 15시간46분19초 PAMSTAMP 16시간59분2초 1시간55분52초 1시간55분52초 9시간5분1초 STARCCM+ 26 시간 12 분 1 초 2 시간 42 분 28 초 2 시간 42 분 28 초 16 시간 분 2 초 본테스트결과의상세분석및설명은 4 장에기술되어있습니다. 다음장부터는본 BMT의세부적인작업실행환경과각 CAE 해석 S/W 별 BMT 실행과정에대해정리한내용입니다. 3/21 페이지

2. BMT 환경정보 BMT 시스템구성도 본 BMT에사용된서버수는총 8대로계산서버 6대 (48core), 관리서버 1대와파일서버 1대로구성되었습니다. 네트워크채널은 2Gbps의계산전용네트워크와 1Gbps의관리 ( 파일 ) 전용대역폭으로분리하여구성하였습니다. 사용된서버의자세한사양은아래와같습니다. Fast Network 구성정보 (INFINIBAND 2Gbps) 세부사양 자원수 Switch QLogic IB9 series 1 HCA Card QLogic QLE724 8 H/W 구성정보 ( 관리서버 1 대 ) 세부사양 자원수 Cpu Intel(R) Quad Core E552 Xeon(R) CPU, 2.26GHz 1cpu(4 core) Memory 2GB 166MHz, Dual Ranked RDIMMs 4개 (8 Gbyte) Hard disk 146GB 15K RPM SAS 2.5" (2) 4개 3GB 1K RPM SAS 2.5" (2) Network Two Broadcom 579C dual-port Gigabit Ethernet 4port product DELL PowerEdge R71 1 node 4/21 페이지

H/W 구성정보 ( 파일서버 1 대 ) 세부사양 자원수 Cpu Intel(R) Xeon(TM) CPU 511 @ 1.6GHz 2cpu(4 core) Memory 4GB 667MHz Fully-Buffered DIMMs Memory 4개 (16 Gbyte) Hard disk 146GB 15K RPM SAS 3.5" 5개 Network Two Broadcom 578 Gigabit Network 2 Port product DELL PowerVault 5 1 node H/W 구성정보 ( 계산서버 6 대 ) 세부사양 자원수 Cpu Intel(R) Quad Core X555 Xeon(R) CPU, 2.66Ghz 2cpu(8 core) Memory 4GB 166MHz, Dual Ranked RDIMMs 12개 (48 Gbyte) Hard disk 146GB 15K RPM SAS 2.5" 7개 Network Two Broadcom 579C dual-port Gigabit Ethernet 4 port product DELL PowerEdge R71 6 node BMT에사용된서버는 DELL의 PowerEdge R71 모델로 Intel Xeon의최신프로세서인 Nehalem CPU가기본장착되어있습니다. 계산에사용된 Total Core 수는 48개로구성되어있습니다. S/W 구성정보 S/W 명 S/W 버전 운영체제 Redhat Eenterprise Server(x86_64) Release 4 (update 8) HPC 구축 S/W GridCenter 1.9 해석 S/W(1) ABAQUS Version 6.7.5 해석 S/W(2) LSDYNA Mpp971_s_R4.2 해석 S/W(3) PAMSTAMP Version 27 해석 S/W(4) STARCCM+ Version 4..2 해석 S/W(5) Powerflow Version 4.1 MPI S/W HPMPI S/W 별기본공급버전 Compiler Intel Compiler & MKL( 라이브러리 ) Version 1 IB Driver QLogicIB-IFS Version 5..2 5/21 페이지

본 BMT에사용된 HPC 구성, 해석작업실행, 성능최적화솔루션은 클루닉스에서개발한 GridCenter 제품군을이용하였고, BMT에사용된예제는현대자동차기술연구소에서제공한 BMT 예제입니다. 3. BMT 시나리오 본 BMT 진행주요절차는아래와같다. 본 BMT는초기구성된 HPC 환경에서현대자동차기술연구소를통해제공받은예제로기본성능테스트를시행하여, 예제에대한무결성검증및최적해석실행조건을파악하였습니다. 그후각해석 S/W 수행환경및시스템환경을최적화하고, 아래시나리오조건에의해테스트를진행하였습니다. 해석 S/W 별 BMT 실시요건 S/W 버전 Run on CPUs 모델크기 현재소요시간 비고 ABAQUS 6.7.5 16/32 71만격자 16시간 Double (16core) precision LSDYNA Mpp971sR4.2 16/32 13만격자 21시간 (16core) - Powerflow 4.1 32/48 76만격자 36시간 (32core) - Pamstamp 27(DMP) 8/16 15만격자 18.2시간 (2core) - StarCCM+ 4.2 16/32 25만격자 4시간이상 - 6/21 페이지

각해석 S/W 별 BMT 에사용된실행조건은아래와같습니다. ABAQUS ( version 6.7.5 ) 해석작업명령은위의 작업명령 과같으며, <double precision> 으로해석이진행되었습니다. LSDYNA (version mppdyna-971.r4.2 single precision ) 해석작업명령은위의 작업명령 과같으며, 해석방식은 <single precision> 으로진행되었습니다. PAM-STAMP ( version 27 ) 해석작업명령은위의 작업명령 과같으며, 해석조건은 <single precision>, <DMP> 방식으로해석이진행되었습니다. STARCCM+( version 4..2 ) 해석작업명령은위의 작업명령 과같으며, 해석방식은 Single process를통한 Mesh 생성이후, Parallel 방식으로해석수행을진행하였습니다. 7/21 페이지

POWERFLOW( version 4.1a ) 해석작업명령은위화면과동일하며, 작업절차는초기생성된 CASE 파일을통해 discretize 작업후 parallel processing에필요한 domain partition작업인 decompose 작업을수행한후최종적으로 simulation을하는형태로작업을수행하였습니다. 8/21 페이지

4. BMT 항목별성능결과및세부분석 통합해석시스템의병렬계산성능결과분석 본테스트는 INFINIBAND 네트워크환경으로구성된통합해석환경에서 CAE S/W별병렬계산의성능을측정한것입니다. 아래결과는 H/W와운영체제, 네트워크환경을최적화한상태에서측정된결과입니다. 표기방식 : 시분초 (hms) 8core 16core 32core 48core ABAQUS 21시간41분12초 11시간48분24초 6시간24분9초 4시간18분52초 LSDYNA 3시간17분29초 17시간2분12초 9시간11분58초 Powerflow 86시간36분2초 47시간23분18초 26시간33분48초 19시간8분2초 PAMSTAMP 19시간25분24초 1시간55분52초 5시간44분7초 STARCCM+ 36 시간 1 분 48 초 2 시간 42 분 28 초 1 시간 45 분 2 초 위결과중 STARCCM+ 의경우초기 mesh 생성작업은단일프로세서로동작하는데, 이때소요된시간은 1시간 55분입니다. 위결과는 mesh 생성시간이제외된순수해석소요시간입니다. Powerflow의경우제공된 CASE 파일을가지고해석을하기위해서는 discretize, decompose, 과정을거쳐야됩니다. 이때소요된시간은 2분이고. 나머지시간이순수해석시간으로보시면됩니다. 본테스트결과 INFINIBAND로구성된통합해석시스템의경우해석에할당되는 CPU 자원을 2배로확장할경우 1.78~1.93배정도의성능개선이일어나는것으로확인되었습니다. 고속의네트워크성능을통해많은 core를이용한병렬계산에서도성능의 scalability 가최대한보장되는것을확인할수있었습니다. 아래그래프는위결과값을통해각 S/W 별병렬계산효과를표현한것입니다. 9/21 페이지

ABAQUS 병렬계산성능결과 14 6 12 5 elapsed time(minute) 1 8 6 4 4 3 2 speedup ABAQUS speedup 2 1 8core(1node) 16core(2nodes) 32core(4nodes) 48core(6nodes) number of processor ABAQUS 의경우, 6 대서버 (48core) 를이용한병렬계산성능은 1 대서버 (8core) 를이용 한병렬계산성능과비교하여 5 배우수한것으로측정되었습니다. LSDYNA 병렬계산성능결과 2 3.5 18 16 3 elapsed time(minute) 14 12 1 8 6 2.5 2 1.5 1 speedup LSDYNA speedup 4 2.5 8core(1node) 16core(2nodes) 32core(4nodes) number of processor LSDYNA 의경우, 4 대서버 (32core) 를이용한병렬계산성능은 1 대서버 (8core) 를이용 한병렬계산성능과비교하여 3.3 배우수한것으로측정되었습니다. 1/21 페이지

POWERFLOW 병렬계산성능결과 6 5 5 4.5 4 elapsed time(minute) 4 3 2 3.5 3 2.5 2 1.5 speedup Powerflow speedup 1 1.5 8core(1node) 16core(2nodes) 32core(4nodes) 48core(6nodes) number of processor POWERFLOW 의경우, 6 대서버 (48core) 를이용한병렬계산성능은 1 대서버 (8core) 를이 용한병렬계산성능과비교하여 4.6 배우수한것으로측정되었습니다. PAMSTAMP 병렬계산성능결과 14 4 12 3.5 elapsed time(minute) 1 8 6 4 3 2.5 2 1.5 1 speedup PAMSTAMP speedup 2.5 8core(1node) 16core(2nodes) 32core(4nodes) number of processor PAMSTAMP 의경우, 4 대서버 (32core) 를이용한병렬계산성능은 1 대서버 (8core) 를이 용한병렬계산성능과비교하여 3.4 배우수한것으로측정되었습니다. 11/21 페이지

STARCCM+ 병렬계산성능결과 25 4 3.5 elapsed time(minute) 2 15 1 5 3 2.5 2 1.5 1.5 speedup STARCCM+ speedup 8core(1node) 16core(2nodes) 32core(4nodes) number of processor STARCCM+ 의경우, 4 대서버 (32core) 를이용한병렬계산성능은 1 대서버 (8core) 를이 용한병렬계산성능과비교하여 3.3 배우수한것으로측정되었습니다. 통합해석시스템의단계별최적화를통한성능개선결과분석 본테스트는통합해석시스템을구성하는 H/W와운영체제를통해기본환경을구성하여성능을테스트한후, H/W 환경, 운영체제환경, 네트워크환경, 스케줄러환경등을단계별로최적화하여, 각단계별테스트를반복하면서성능개선추이를비교한것입니다. CAE S/W 별 16core를할당한해석의최적화결과는아래와같습니다. H/W 기본구성 H/W, OS 튜닝네트워크튜닝스케줄러튜닝 ABAQUS 15 시간 5 분 17 초 12 시간 23 분 16 초 11 시간 48 분 24 초 7 시간 26 분 22 초 LSDYNA 25 시간 28 분 49 초 17 시간 2 분 12 초 17 시간 2 분 12 초 15 시간 46 분 19 초 PAMSTAMP 16 시간 59 분 2 초 1 시간 55 분 52 초 1 시간 55 분 52 초 9 시간 5 분 1 초 STARCCM+ 26 시간 12 분 1 초 2 시간 42 분 28 초 2 시간 42 분 28 초 16 시간 분 2 초 12/21 페이지

CAE S/W 별최적화전후성능비교 18 6% 16 14 5% elapsed time(minute) 12 1 8 6 4 2 4% 3% 2% 1% 최적화효율 최적화전 최적화후 개선효과 ABAQUS LSDYNA PAMSTAMP STARCCM+ CAE S/W 종류 % 본테스트결과를보면동일한서버상태에서 H/W와네트워크, 운영체제, CAE 해석시스템환경을최적화할경우 4%~5% 정도의성능이향상되는것을확인할수있습니다. 아래내용은본 BMT에적용된최적화작업을간단히설명한내용입니다. Nehalem CPU의경우기존 Intel Xeon CPU와비교하여, 프로세서간의통신구조와프로세서와메모리간의통신성능을대폭개선시키는 3 channel memory architecture 기술이적용되었습니다. 그리고프로세서의 Clock을유동적으로조정하여, 서버의전력소비량를효율적으로절감시켜주는 EIST(Enhanced Intel SpeedStep Technology) 기능도존재합니다. 또한유휴상태로있는 CPU의전력을사용중인 CPU에집중하여해당 CPU의처리성능 (Clock) 을높여주는 Turbo Boost기능이존재합니다. 이러한기능은각벤더사의 H/W( 메인보드 ) 설계상에서어떻게구현하고, 이를기본 BIOS에어떻게적용하느냐에따라계산성능에많은영향을미치게됩니다, 다양한 BMT를통해 H/W 벤더사별로위기능에관련된 BIOS 설정은다소차이가있는걸로확인하였고, 그차이로인해극단적인성능이최우선시되는 HPC 환경에서사양이같다하더라도 H/W 벤더사가다를경우, 출시되는상태의기본환경에서성능테스트를하면, 각벤더사제품별로 15%~3% 정도성능차이가나는걸로확인되었습니다. H/W와운영체제의최적화작업은 HPC의구성에서최우선시되는성능위주로관련설정및환경을재구성하는작업입니다. 각계산서버의 BIOS 환경을성능위주로재구성하고, 운영체제에서도 CPUfreq 모듈을성능중심으로설정을변경하여, CAE 해석환경에서요구하는프로세서성능을제공할수있게설정을변경합니다. 이와같은작업을통해 25%~3% 정도의성능개선이확인되었습니다. 13/21 페이지

네트워크최적화는본 BMT 구성에서기본으로사용되는 INFINIBAND 환경을운영체제와각 CAE S/W의 MPI 환경과최적화시키는작업으로이루어졌습니다. INFINIBAND로고속네트워크환경을구성하여성능테스트를진행할때, 특정벤더의 INFINIBAND의경우 driver version이최신운영체제와호환하지않는문제가발생하였습니다. 하지만 Nehalem Processor를재대로인식하고, 그모든기능을사용하기위해서는최신운영체제가필요하게됩니다. 또한 CAE S/W의 Version이대부분 2~3년전에출시된버전으로해당 S/W의병렬계산기능을제공하는 HPMPI가특정벤더사의 INFINIBAND driver를공식지원하지않는문제도발생할수있습니다. 본최적화단계에서는 INFINIBAND driver 구성시계산서버의 H/W를최적으로지원할수있는운영체제에맞게최적화시키고, CAE S/W의 MPI 환경을해당 INFINIBAND가지원될수있는형태로최적하게됩니다. 이와같은작업을통해 CAE S/W 해석시 INFINIBAND protocol을이용하여병렬계산을수행시킬수있습니다. 이런최적화작업을통해 1%~4% 정도의성능개선을확인할수있었습니다. 최종적으로스케줄러의최적화작업을진행하게되는데, 스케줄러최적화작업은각 CAE S/W의병렬계산시 CPU allocation 방식에따라병렬계산의효율에영향을많이주게되는데, CAE S/W별로최적의조합으로 CPU를할당하여, 그성능을개선하는작업입니다. 이작업을통해각 CAE S/W별 2%~3% 정도의성능개선을확인할수있었습니다. 14/21 페이지

각 S/W 별해석결과후처리화면 ABAQUS 해석예제결과후처리화면 LSDYNA 해석예제결과후처리화면 15/21 페이지

PAM-STAMP 해석예제결과후처리화면 STARCCM+ 해석예제결과후처리화면 16/21 페이지

17/21 페이지

GridCenter 작업진행화면 18/21 페이지

19/21 페이지

2/21 페이지

21/21 페이지