www.altsoft.co.kr www.clunix.com COMSOL4.0a Cluster 성능테스트 2010 년 10 월 클루닉스 / 알트소프트
개요 개요 목차 BMT 환경정보 BMT 시나리오소개 COMSOL4.0a MPP 해석실행조건 BMT 결과 COMSOL4.0a 클러스터분석결과 ( 메모리 / 성능 ) COMSOL4.0a 클러스터최종분석결과 -2-
개요 본 BMT는 ALTSOFT에서슈퍼컴퓨팅전문기업 클루닉스에, 클러스터시스템에서의 COMSOL4.0a의성능을테스트하기위한목적으로의뢰하였다. COMSOL 모델해석을수행, 그결과를측정하여비교하였다. 클루닉스에서는자사의 CAE 통합해석시스템구축운영솔루션인 GridCenter-CAP 을통해테스트를진행하였다. -3-
BMT 환경정보 _01 개인 PC 관리노드 / 계산노드 계산노드 관리서버 / 계산서버 (1 대 ) CPU : Intel(R) Xeon(R) CPU E5630 2.53GHz Memory : 24G(4Gx6) 계산서버 (2 대 ) CPU : Intel(R) Xeon(R) CPU E5630 2.53GHz Memory : 24G(4Gx6) Public Network 1G for Computing 1G for NFS 네트워크구성 Eth0 : Gigabit network 구성 ( 관리전용 ) Eth1 : Gigabit network 구성 ( 해석전용 ) -4-
BMT 환경정보 _02 * H/W 구성정보 ( 관리서버 / 계산서버 1 대 ) 세부사양 CPU Intel(R) Xeon(R) CPU E5630 2.53GHz x 2 Memory Samsung 4G 1066MHz x 6 Hard disk 750GB 7200rpm SATA 3.5 x 2(Raid 1 for OS) 1TB 7200rpm SATA 3.5 x 4 (Raid 5 for HOME) Network Dual Gigabit Ethernet x 2 * H/W 구성정보 ( 계산서버 2 대 ) 세부사양 CPU Intel(R) Xeon(R) CPU E5630 2.53GHz x 2 Memory Samsung 4G 1066MHz x 6 Hard disk 750GB 7200rpm SATA 3.5 * (OS) x 1 Network Dual Gigabit Ethernet x 2-5-
BMT 시나리오 BMT 시나리오진행절차 BMT 시스템환경구성기본테스트수행시스템최적화 BMT 수행결과분석 BMT 완료 BMT 사용명령어 ( 예시 ) Acoustic.mph 모델에대한 8core 를사용하여클러스터에서해석하도록하는명령어 (4+4 해석시 ) comsol nn 2 np 4 batch inputfile acoustic.mph outputfile acoustic_out.mph -6-
COMSOL 4.0a MPP 해석실행조건 병렬해석시사용할노드수를옵션으로반드시지정 - nn : 사용될전체 node 수 - np : ( 한대의 node 에서사용될 core 수 ) 로실행 - 해석시사용될 core 수 ( 사용될 node 수 (nn) x 한대의 node 에서사용될 core 수 (np)) 로지정되어야한다 해석모델이필요로하는메모리사용량에대한대략적사전파악필요 - 메모리가부족할경우, out of memory 에러와함께해석이중지됨 - 메모리증축, 노드증축으로해결가능 -7-
BMT 결과 ( 해석시간 ) 해석결과 표 1 Model(DOF) Core 4(2+2) 8(4+4) 16(8+8) 24(8+8+8) Acoustic(1119455) 음향, steady 해석 12 시간 04 분 7 시간 12 분 4 시간 53 분 4 시간 15 분 antena_230(2286870) 전자기 (RF), steady 해석 1 시간 52 분 1 시간 20 분 0 시간 52 분 0 시간 44 분 battled_mixer(501797) 유동 +moving mesh, unsteady 해석 11 시간 39 분 7 시간 09 분 5 시간 16 분 5 시간 29 분 -8-
해석결과 - Chat BMT 결과 ( 해석시간 ) acoustic antena_230 14시 12시 9시 7시 4시 2시 0시 4 8 16 24 2시 09분 1시 55분 1시 40분 1시 26분 1시 12분 0시 57분 0시 43분 0시 28분 0시 14분 0시 00분 4 8 16 24 battled_mixer 14 시 12 시 9 시 -4,8,16 core 는 2 대의클러스터노드에서실행하였으며, 24 core 는 3 대의클러스터노드에서 BMT 실시함 7 시 4 시 2 시 0 시 4 8 16 24-9-
Comsol 4.0a 클러스터성능측정결과 예제 1) Antena_230 Core 수에따른해석시간 (MPP 해석결과 ) - 4Core(2+2) 와 24Core(8+8+8) 에서해석에사용되는시간을비교한결과최대 2.5배최소 2배이상의성능개선효과를가져오는것으로확인됨.( 이외 4~24 core 의비교결과는 page8~9 에서확인됨 ) 예제 2) Battled_mixer Core 수에따른해석시간 (MPP 해석결과 ) - 4Core(2+2) 와 24Core(8+8+8) 에서해석에사용되는시간을비교한결과최대 2 배최소 1.5 배이상의성능개선효과를가져오는것으로확인됨.( 이외 4~24 core 의비교결과는 page8~9 에서확인됨 ) 1시 26분 1시 12분 0시 57분 0시 43분 0시 28분 0시 14분 0시 00분 14시 12시 9시 7시 4시 2시 0시 antena_230 4core 24core battled_mixer 4 24-10-
Comsol 4.0a 클러스터성능측정결과 예제 3) Acoustic Core 수에따른해석시간 (MPP 해석결과 ) - 4Core(2+2) 와 24Core(8+8+8) 에서해석에사용되는시간을비교한결과최대 3배최소 1.5배이상의성능개선효과를가져오는것으로확인됨 ( 이외 4~24 core 의비교결과는 page8~9 에서확인됨.) 14시 12시 9시 7시 4시 2시 0시 acoustic 4 24-11-
COMSOL 4.0a 클러스터메모리측정결과 해석방법 (SMP/MPP) 에따른메모리 - 동일 Core 에서해석시 SMP 가 MPP 보다다소성능이우수하나, SMP 방식 ( 단일노드 ) 의리소스 ( 메모리 ) 제한으로인해규모가큰해석을할경우에는 MPP 방식이필요 - MPP 해석에사용되는공유메모리는 1 대의서버에종속되어있는 SMP 방식에비해서버의수만큼물리적메모리를공유할수있으므로, MPP 해석시많은양의메모리를이용하여큰규모의해석이가능. -12-
Comsol 4.0a 클러스터최종분석결과 성능개선 - 같은 MPP 방식의 4core~24core 테스트결과에서알수있듯이, 코어수증가에따라속도개선효과를볼수있다. - 일반적으로 1core 대비 24core 개선효과는더크지만, 테스트에사용된예제모델이 1core 해석시메모리부족으로해석이불가능하기에비교대상에서제외하였다. - 속도개선측면이외에도 SMP 환경만지원하던기존버전 (COMSOL3.5a) 과비교시 COMSOL4.0a 에서는 MPP 환경을지원하게되면서큰모델에대한해석구현이가능해졌다. 해석방법에따른 (SMP/MPP) 메모리사용특성 - 테스트에사용된 Cluster server 의메모리는 24G x 3 대이다. SMP 해석에 24G 를사용할수있으며 MPP 해석에 72G 를사용할수있다. 특정모델에대한해석에 30G 의메모리를사용한다고예를들면 SMP 해석에는물리메모리를다사용하며 6G 의가상메모리를사용하게된다 ( 디스크의일정부분을가상메모리로지정하여사용하므로전체적으로느려지게된다 ). 하지만 MPP 해석의경우사용되어지는메모리가 30G 라해도 2 대에서해석시 15G( 실제측정시대략이론치수치의 110%~120% 의메모리양을사용한다 ) 로나뉘어해석을하므로물리메모리 (24G+24G) 만으로도해석이가능하게된다. -13-
COMSOL Multiphysics 관련문의이재연팀장 Tel. 02-547-2344 e-mail. comsol@altsoft.co.kr 클러스터시스템관련문의박진현팀장 Tel. 02-3486-5896(0106) e-mail. jhpark@clunix.com -14-