<B0F8B4EBC0FCBBEABDC720B0EDBCD3B0E8BBEABFEB20C5ACB7AFBDBAC5CD20BDC3BDBAC5DB20C0CCBFEBBEC8B3BBBCAD2E687770>

Similar documents
Microsoft Word - ntasFrameBuilderInstallGuide2.5.doc

슬라이드 1

Microsoft Word - 3부A windows 환경 IVF + visual studio.doc

소개 TeraStation 을 구입해 주셔서 감사합니다! 이 사용 설명서는 TeraStation 구성 정보를 제공합니다. 제품은 계속 업데이트되므로, 이 설명서의 이미지 및 텍스트는 사용자가 보유 중인 TeraStation 에 표시 된 이미지 및 텍스트와 약간 다를 수

TERA Cluster Administrator Menual.hwp

휠세미나3 ver0.4

Microsoft PowerPoint - 02_Linux_Fedora_Core_8_Vmware_Installation [호환 모드]

PowerPoint 프레젠테이션

Microsoft PowerPoint Android-SDK설치.HelloAndroid(1.0h).pptx

ISP and CodeVisionAVR C Compiler.hwp

Adobe Flash 취약점 분석 (CVE )

Microsoft PowerPoint SDK설치.HelloAndroid(1.5h).pptx

untitled

Raspbian 설치 라즈비안 OS (Raspbian OS) 라즈베리파이 3 Model B USB 마우스 USB 키보드 마이크로 SD 카드 마이크로 SD 카드리더기 HDM I 케이블모니터

Microsoft PowerPoint - AME_InstallRoutine_ver8.ppt

안전을 위한 주의사항 제품을 올바르게 사용하여 위험이나 재산상의 피해를 미리 막기 위한 내용이므로 반드시 지켜 주시기 바랍니다. 2 경고 설치 관련 지시사항을 위반했을 때 심각한 상해가 발생하거나 사망에 이를 가능성이 있는 경우 설치하기 전에 반드시 본 기기의 전원을

임베디드시스템설계강의자료 4 (2014 년도 1 학기 ) 김영진 아주대학교전자공학과

Splentec V-WORM Quick Installation Guide Version: 1.0 Contact Information 올리브텍 주소 : 경기도성남시분당구구미로 11 ( 포인트타운 701호 ) URL: E-M

1) 인증서만들기 ssl]# cat > // 설명 : 발급받은인증서 / 개인키파일을한파일로저장합니다. ( 저장방법 : cat [ 개인키

chapter4

Contributors: Myung Su Seok and SeokJae Yoo Last Update: 09/25/ Introduction 2015년 8월현재전자기학분야에서가장많이쓰이고있는 simulation software는다음과같은알고리즘을사용하고있다.

목차 윈도우드라이버 1. 매뉴얼안내 운영체제 (OS) 환경 윈도우드라이버준비 윈도우드라이버설치 Windows XP/Server 2003 에서설치 Serial 또는 Parallel 포트의경우.

Microsoft Word - Automap3

품질검증분야 Stack 통합 Test 결과보고서 [ The Bug Genie ]

<4D F736F F D20C5EBC7D5C7D8BCAEBDC3BDBAC5DB5F D2BC0C720424D54B0E1B0FABAB8B0EDBCAD2E646F63>

PRO1_04E [읽기 전용]

Appendix B

MySQL-Ch10

네이버블로그 :: 포스트내용 Print VMw are 에서 Linux 설치하기 (Centos 6.3, 리눅스 ) Linux 2013/02/23 22:52 /carrena/ VMware 에서 l

MAX+plus II Getting Started - 무작정따라하기

슬라이드 1

<목 차 > 제 1장 일반사항 4 I.사업의 개요 4 1.사업명 4 2.사업의 목적 4 3.입찰 방식 4 4.입찰 참가 자격 4 5.사업 및 계약 기간 5 6.추진 일정 6 7.사업 범위 및 내용 6 II.사업시행 주요 요건 8 1.사업시행 조건 8 2.계약보증 9 3

10X56_NWG_KOR.indd

1) 인증서만들기 ssl]# cat > // 설명 : 발급받은인증서 / 개인키파일을한파일로저장합니다. ( 저장방법 : cat [ 개인키

<4D F736F F D F5357BAB05FC5EBC7D5C7D8BCAEBDC3BDBAC5DB5FBCBAB4C920BAD0BCAE20B0E1B0FABAB8B0EDBCAD5F F

공개 SW 기술지원센터


PowerPoint 프레젠테이션

Install stm32cubemx and st-link utility

Integ

APOGEE Insight_KR_Base_3P11

Mango220 Android How to compile and Transfer image to Target

Microsoft Word _whitepaper_latency_throughput_v1.0.1_for_

아래 항목은 최신( ) 이미지를 모두 제대로 설치하였을 때를 가정한다

Microsoft Word - CAE 클러스터 환경 구축-ABAQUS.doc

/chroot/lib/ /chroot/etc/

Microsoft PowerPoint - chap01-C언어개요.pptx

Snort Install Manual Ad2m VMware libnet tar.gz DebianOS libpcap tar.gz Putty snort tar.gz WinSCP snort rules 1. 첫번째로네트워크설정 1) ifconf

Sena Technologies, Inc. HelloDevice Super 1.1.0

Microsoft Word - Korean_뷰어 메뉴얼_공용_ADVR&SWi_.doc

망고100 보드로 놀아보자-4

<4D F736F F D F5357BAB05FC5EBC7D5C7D8BCAEBDC3BDBAC5DB5FBCBAB4C920BAD0BCAE20B0E1B0FABAB8B0EDBCAD F444C F767

1. GigE Camera Interface를 위한 최소 PC 사양 CPU : Intel Core 2 Duo, 2.4GHz이상 RAM : 2GB 이상 LANcard : Intel PRO/1000xT 이상 VGA : PCI x 16, VRAM DDR2 RAM 256MB

슬라이드 제목 없음

1217 WebTrafMon II

을풀면된다. 2. JDK 설치 JDK 는 Sun Developer Network 의 Java( 혹은 에서 Download > JavaSE 에서 JDK 6 Update xx 를선택하면설치파일을

untitled

목차 백업 계정 서비스 이용 안내...3 * 권장 백업 정책...3 * 넷하드(100G 백업) 계정 서버로 백업하는 2가지 방법...3 * 백업서버 이용시 주의사항...3 WINDOWS 서버 사용자를 위한 백업서비스 이용 방법 네트워크 드라이브에 접속하여

PowerPoint 프레젠테이션

SQL Developer Connect to TimesTen 유니원아이앤씨 DB 기술지원팀 2010 년 07 월 28 일 문서정보 프로젝트명 SQL Developer Connect to TimesTen 서브시스템명 버전 1.0 문서명 작성일 작성자

1. What is AX1 AX1 Program은 WIZnet 사의 Hardwired TCP/IP Chip인 iinchip 들의성능평가및 Test를위해제작된 Windows 기반의 PC Program이다. AX1은 Internet을통해 iinchip Evaluation

PowerPoint 프레젠테이션

<C0CCBCBCBFB52DC1A4B4EBBFF82DBCAEBBE7B3EDB9AE2D D382E687770>

Microsoft Word - windows server 2003 수동설치_non pro support_.doc

vm-웨어-앞부속

Microsoft PowerPoint - comp_prac_081223_2.pptx

fprintf(fp, "clf; clear; clc; \n"); fprintf(fp, "x = linspace(0, %d, %d)\n ", L, N); fprintf(fp, "U = [ "); for (i = 0; i <= (N - 1) ; i++) for (j = 0

Microsoft Word ARM_ver2_0a.docx

Microsoft Word - src.doc

작성자 : 기술지원부 김 삼 수

Microsoft Word - zfs-storage-family_ko.doc

<4D F736F F F696E74202D C61645FB3EDB8AEC7D5BCBA20B9D720C5F8BBE7BFEBB9FD2E BC8A3C8AF20B8F0B5E55D>

Network seminar.key


iii. Design Tab 을 Click 하여 WindowBuilder 가자동으로생성한 GUI 프로그래밍환경을확인한다.

PowerPoint 프레젠테이션

Open Cloud Engine Open Source Big Data Platform Flamingo Project Open Cloud Engine Flamingo Project Leader 김병곤

초보자를 위한 C++

Microsoft Word - DELL_PowerEdge_TM_ R710 서버 성능분석보고서.doc

Chapter 1

vm-웨어-01장

KDTÁ¾ÇÕ-1-07/03

슬라이드 1

PowerPoint 프레젠테이션

[ 컴퓨터시스템 ] 3 주차 1 차시. 디렉토리사이의이동 3 주차 1 차시디렉토리사이의이동 학습목표 1. pwd 명령을사용하여현재디렉토리를확인할수있다. 2. cd 명령을사용하여다른디렉토리로이동할수있다. 3. ls 명령을사용하여디렉토리내의파일목록을옵션에따라다양하게확인할수

Data Sync Manager(DSM) Example Guide Data Sync Manager (DSM) Example Guide DSM Copyright 2003 Ari System, Inc. All Rights reserved. Data Sync Manager

KDTÁ¾ÇÕ-2-07/03

인켈(국문)pdf.pdf

PowerPoint 프레젠테이션

문서 대제목

Network Security - Wired Sniffing 실습 ICNS Lab. Kyung Hee University

주제별로명령들이따로있는것을보면주제끼리의순서는상관없어도명령들의위치를지 켜야할지도모른다. 하지만실험은해보지않았으니심심하면체크해봐도된다. [CRAB] CRAB 을하기위한가장기본적인세팅이다. jobtype = cmssw scheduler = glite 등이있다. 보통 CRAB

Copyright 2012, Oracle and/or its affiliates. All rights reserved.,,,,,,,,,,,,,.,..., U.S. GOVERNMENT END USERS. Oracle programs, including any operat

PowerPoint 프레젠테이션

01Àå

UNIST_교원 홈페이지 관리자_Manual_V1.0

USER Manual

Microsoft Word - Generic_Gas_Simulation_BMT 결과 보고서.doc

C. KHU-EE xmega Board 에서는 Button 을 2 개만사용하기때문에 GPIO_PUSH_BUTTON_2 과 GPIO_PUSH_BUTTON_3 define 을 Comment 처리 한다. D. AT45DBX 도사용하지않기때문에 Comment 처리한다. E.

Transcription:

공대전산실고속계산용클러스터시스템이용안내서 담당자 : 이창성 (7429, hpcman@eng.snu.ac.kr) 1. 시스템(hpceng) 개요 hpceng1.snu.ac.kr : abaqus 147.46.237.137 hpceng2.snu.ac.kr : star_cd / diana: 147.46.237.138 hpceng3.snu.ac.kr : matlab : 147.46.237.139 hpceng4.snu.ac.kr : fluent :147.46.237.140 External network (Fast Ethernet) 공학용 Package 서비스전용 hpceng.snu.ac.kr External network (Fast Ethernet) 24 port Gigabit Switch NAS System master system Gigabit Ethernet local network 1 ( 계산전용 ) GBIC Connection 24 port Gigabit Switch External Network : 100 Mbps : eth0 device Local Network : 1000 Mbps : eth1 device Local Network : 1000 Mbps : eth2 device Gigabit Ethernet local network 2 (NFS 전용 ) 그림 1 hpceng 시스템네트워크구성도 병렬계산용서버 Pool과공학계산용 Package 서비스 Pool로나누어서구성 주요사양 16 Node Cluster System + master node + NAS System CPU : Intel Xeon 2.4 GHz 32개 RAM : 2GB (12 node/ 병렬계산용), 3GB ( 4 node/package 서비스서버) SCSI : 36GB (12 node/ 병렬계산용), 54GB ( 4 node/package 서비스서버) Storage Backup : 1.2TB ( 운영 : RAID 1 Mirroring, 600 GB ) Network : Gigabit Ethernet Network (Computing,NFS,Management), Fast Ethernet Network (External) OS : Linux (RedHat 9.0 기반, Kernel : 2.4.24 ) 주요소프트웨어 Compiler : intel compiler(c/c++/f77/f90), gcc compiler(c/c++/f77), Portland Group Compiler(c/c++/f77/f90) Math Library : BLAS, LAPACK, IMSL (f90) Scheduler : LSF(Platform)

MPI : MPICH, LAM-MPI 공학용 Package - Abaqus 6.4 : Standard / Explicit / Aqa / Design - Fluent fluent 6.0.12 TGrid 3.4.2 Gambit 2.0.4 tfilter 2.5, flpost 1.2.6 - LS-DYNA (Parallel Version - mpp970) : 8 CPUs lspost - Matlab Simulink Optimization Statistics Neural Network Extended Symbolic Math PDE Mapping Spline Curve fitting Signal Processing System Identification Wavelet Filter design Control system Fuzzy logic Robust Control Mu-analysis and LMI Control Stateflow Nonlinear control design blockset -Diana 2. 시스템사용신청 공대전산실에서계정신청서를작성한다. 유의사항은기존의공대전산실사용아이디가있다고해도새롭게신청을해서발급을받아야사용가능. 3. 병렬시스템이용방법 1 로그온하기기본적으로 hpceng 시스템은 SSH Secure Shell 로만접속이가능하다. ssh를이용한접속방법을유닉스 / 리눅스시스템과윈도우즈시스템으로나누어서살펴보면다음과같다.

- 유닉스/ 리눅스시스템현재, 많이사용되고있는리눅스시스템의경우에는대부분의배포판에서 ssh client 이설치되어있다. 다음의명령어로시스템에설치된 ssh 프로그램을확인할수있다. 프로그램 $ rpm qa grep ssh 위와같이명령어를실행시켰을경우에 3.0 이상버전의 ssh 가설치되어있는것이바람직한다. 만약, 시스템에 ssh 가설치되어있지않는경우에는 www.ssh.com 사이트에서 rpm 버전이나소스를다운받아설치해야한다.Unix시스템인경우에는시스템관리자에게문의해서 ssh가설치되어확인해야한다. 시스템에 ssh가설치되어있는지확인한후에는시스템에서 xterm이나 hanterm를실행시키고다음의명령어를수행한다. $xhost+ 그리고나서 hpceng 시스템에접속한다. $ ssh -l userid hpceng.snu.ac.kr 패스워드입력후에성공적으로로그인이되고난후에는아래의명령을실행시킨다.hpceng시스템은기본적으로 Born Shell 을사용하므로, 다음과같이입력해서 DISPLAY 변수를설정해주면 GUI 기반응용프로그램을사용할수있다. $ export DISPLAY=ip-address:0.0 - 윈도우즈 PC 시스템 Windows 인경우에는먼저, it4u.snu.ac.kr에가서sshwinclient-31과 Xmanager 프로그램 을설치한다. 이때 Xmanager 설치시에 파일 메뉴의 설정 을눌러서 xdm을사용하지 않는것이좋다.

SSHWinClient-31 을설치한후에, 실행시키고나서 Quick Connect 를 click 한후에다음과같이 User name에등록한 User ID 를입력한다. 접속이되면패스워드를입력한다. 그런다음, 정상적인로그인이되면 profiles 를 click 해서 Add profile 를 click 한후에아래그림과같이 profile 이름을 hpceng로한후에 Add the current connections to profile 를 click 해서현재설정을등록한다. 그런다음, 일단 logout 을한다. 그런다음, edit profile 명령을실행시킨후아래그림과 Tunneling 설정에서 Tunnel X11 Connections을 On 한후에 save 시킨다.

위의설정을저장한후에, profile에저장되어있는 hpceng를 click하면 hpceng 시스템에저장된설정으로접속이된다. 일단이상태에서는 vi 에디터를이용한파일편집등의 graphic interface를요구하지않는 Text 기반의작업들은모두수행할수있다. 만약, GUI 기반작업을수행해야할경우에는 Xterm 을다음과같이실행시킨후에사용하면된다. 먼저, 접속한 PC에서 Xmanager 를실행시킨다. 다음과같이 xterm 을실행시키면된다.

계산한결과나입력데이터를전송해야할때에는 sftp 를이용할수있다. 유닉스나리눅스시스템의경우에는다음과같은명령어를통해사용한다. $ sftp user_id@hpceng.snu.ac.kr 파일을 hpceng 시스템으로 Upload 할때에는 put 이라는명령어를사용하고, download 할때에는 get 이라는명령어를사용하면된다. 윈도우즈시스템의경우에는 SSHWinClinet에서제공하는 File Transfer Window를이용하면윈도우즈의탐색기와같은편리한유저인터페이스를이용해서자유롭게파일을전송할수있다. 여기를 Click 하면 File Transfer 창이열린다

2 디스크사용관련 hpceng 시스템에로그인한후에 dh -h 라는명령을수행하면아래와같이현재사용할수있는하드디스크용량과파일시스템에대해알수있다. Filesystem 1k-blocks Used Available Use% Mounted on /dev/sda2 8254272 2828848 5006128 37% / /dev/sda1 124427 14996 103007 13% /boot /dev/sda5 25861692 1984 24545996 1% /scratch none 1034716 0 1034716 0% /dev/shm /dev/sdb1 141122196 29471024 104482572 23% /system-bak n000s:/home 345354160 15661976 312149208 5% /home n000s:/data 460470760 8 437080120 1% /data 위의파일시스템들을살펴보면 /system-bak 파티션은시스템이미지백업용이라관리자만접근가능한파티션이다. 유저들의홈디렉토리는 /home 파티션이다. /home 파티션은 NFS(Network File System) 으로연결되어있어서모든클러스터노드들에서동일한이미지를유저에게제공한다. 그러나 /home 파티션은유저들에게 1GB 이상의저장공간을허락하지않는다. 따라서대용량계산결과파일등의저장은 /data 파티션을이용하여야한다. /data 파티션역시 NFS 로연결되어있다. /data 파티션의경우에유저별사용량의제한이없기때문에사용가능한용량까지자유롭게사용가능하지만, 매일새벽 2시에용량이부족할경우관리자가모든데이터를삭제할수있기때문에대용량결과데이터의임시적인저장장소로활용하고중요한데이터는유저의개인 PC 로항상옮겨놓아야한다. 이때조심해야할것은계산중에임시로열어서사용하거나대용량의파일에결과를적어야할경우에는반드시 /scratch 디렉토리밑에서읽고써야한다. 유저의홈디렉토리는 NFS(Network File System) 이므로자신의홈디렉토리에그냥파일을열고쓰게되면굉장히계산이느려질수있다. /scratch 파티션은모든클러스터노드에로컬의별도하드디스크로연결되어있기 때문에이미지는서로다르지만입출력속도는 /home 이나 /data 파티션에비해서빠르다.

3 병렬프로그램수행하기기본적으로 hpceng 시스템은최근에거의사용되지않는 PVM 라이브러리는지원하지않고, MPI 라이브러리만지원한다. MPI 라이브러리중에서는앞에서설치한것처럼 MPICH와 LAM-MPI 를설치하였다. 시스템에서기본(Defalut) 로설정된값은 MPICH와 Intel Compiler 를이용하여 LSF Scheduler를이용하여병렬처리 job을 Submit 하게되어있다. - 병렬코드컴파일하기 mpicc, mpicc, mpif77, mpif90 명령어를이용하여컴파일한다. 이명령어는기본적으로 intel compiler에 MPICH 라이브러리를자동링크되게한것이므로컴파일기본옵션은인텔 컴파일러와동일하다. 인텔컴파일러에대한자세한자료는 support.intel.com에서참조할수 있다. 그런데, 자신이개발한코드가인텔컴파일러에서간혹에러를발생시키는경우가있다. 유 닉스시스템의표준컴파일러인 GNU gcc 컴파일러로컴파일할때는에러가발생하지않는 코드인데인텔컴파일러로컴파일할시에는에러를발생시킬수있다. 특히, Fortran 의경 우가그런경우가많이발생한다. 이럴경우에는 GNU gcc 컴파일러로컴파일할수있고 명령어는 gmpicc, gmpicc, gmpif77 을이용하면된다. 병렬전용컴파일러로많이사용되는또하나의컴파일러가 Portland Group Compiler이며 hpceng 시스템에설치되어있다. 명령어는 pmpicc, pmpicc, pmpif77, pmpif90을사용하 면된다.pgc컴파일러에 대한자세한자료는 www.pgroup.com에서참조할수있다. -병렬코드실행하기병렬코드는 LSF Scheduler를이용하여 submit 하여실행한다. 우선, 시스템의상황을살펴보는명령은다음과같다. [hpcman@n001 hpcman]$ bhosts HOST_NAME STATUS JL/U MAX NJOBS RUN SSUSP USUSP RSV n001 ok - 2 0 0 0 0 0 n002 ok - 2 0 0 0 0 0 n003 ok - 2 0 0 0 0 0 n004 ok - 2 0 0 0 0 0 n005 ok - 2 0 0 0 0 0 n006 ok - 2 0 0 0 0 0 n007 ok - 2 0 0 0 0 0 n008 ok - 2 0 0 0 0 0 n009 ok - 2 0 0 0 0 0 n010 ok - 2 0 0 0 0 0 n011 ok - 2 0 0 0 0 0 n012 ok - 2 0 0 0 0 0 n013 unavail - 2 0 0 0 0 0 n014 unavail - 2 0 0 0 0 0 n015 unavail - 2 0 0 0 0 0 n016 unavail - 2 0 0 0 0 0 위의상황은현재 n001 ~ n012 시스템까지이용가능하며, MAX 라는것은각노드별수행할수있는작업의최대수이다. 각노드별로 2개의 CPU가설치되어있으므로모든노드의 MAX 값은 2 로설정되어있으며, RUN 이라는것은현재수행되고있는작업의수이다. NJOBS는현재수 행하여야하는작업의수이다. n013부터 n016까지는 Package 서비스노드이므로병렬작업수

행에는이용할수없다. 특별히 32개의 CPU 작업을수행해야하는경우에는담당조교에게연 락해서상의해야한다. 그리고각노드별 Resource의현황을살펴보기위해서는 lsload라는명 령을수행한다. 각노드별CPU 가동율과이용가능한RAM 메모리현황등을볼수있다. [hpcman@n001 hpcman]$ lsload HOST_NAME status r15s r1m r15m ut pg ls it tmp swp mem n001 ok 0.0 0.0 0.0 0% 1.1 2 3 5748M 1028M 1771M n006 ok 0.0 0.0 0.0 0% 0.3 0 213 6260M 1027M 1859M n003 ok 0.0 0.0 0.0 0% 0.3 1 52 6092M 1027M 1858M n002 ok 0.0 0.0 0.0 0% 0.3 0 220 5996M 1027M 1860M n007 ok 0.0 0.0 0.0 0% 0.3 0 214 6260M 1027M 1859M n004 ok 0.0 0.0 0.0 0% 0.3 0 53 6260M 1027M 1859M n010 ok 0.0 0.0 0.0 0% 0.3 0 214 6260M 1027M 1859M n011 ok 0.0 0.0 0.0 0% 0.3 0 214 6096M 1027M 1859M n008 ok 0.0 0.0 0.0 0% 0.3 0 214 6260M 1027M 1859M n005 ok 0.0 0.0 0.0 0% 0.3 0 52 6100M 1027M 1859M n012 ok 0.0 0.0 0.0 0% 0.3 0 214 6152M 1027M 1861M n009 ok 0.0 0.0 0.0 0% 0.3 0 213 6316M 1027M 1861M n013 unavail n014 unavail n015 unavail n016 unavail 그런다음에는 Job sumbit 파일을작성한다. 간단한 submit 파일예제는다음과같다. #BSUB -n 24 #BSUB -o 1.out #BSUB -e 1.err mpijob./xhpl 첫번째라인은 CPU를 24 개활용하겠다는것이며, -o 옵션은코드의 stdout 출력을저장할파일이며 -e 옵션은코드의 stderr 출력을저장할파일명이다. 마지막라인이수행할명령어를적어주는라인인데, 실제로유저가컴파일한실행파일앞에 mpijob 이라는 keyword를반드시적어주어야한다. 그리고병렬프로그램컴파일시에사용한명령어와반드시일치시켜주어야하는데규칙은다음과같다. mpijob : mpicc/mpicc/mpif77/mpif90 으로컴파일했을시 mpijob_gcc : gmpicc/gmpicc/gmpif77으로컴파일했을시 mpijob_pgc : pgmpicc/pmpicc/pmpif77/pmpif90으로컴파일했을시 작업 Submit 을작성하고적절한이름으로저장한다. 예를들어위의 Submit 파일예제를 test1이라고저장했다면다음의명령어를사용해서 submit 한다.

$ bsub < test1 submit 한작업이정상적으로수행되는지를알아보기위해서는 bjobs라는명령어를수행시켜본다. submit을한직후에는 stat가 PEND 상태로있다가정상적으로필요한 Resources를할당받으면 RUN 으로바뀌어진다. 그러면 bjobs 명령어를수행시키면 EXEC_HOST에현재작업을수행하고있는시스템의리스트가표시된다. 만약에 submit된작업이잘못수행된것이어서유저가취소하고싶은경우에는 bkill 명령어를실행시킨다. bjobs 명령어로 JOBID 를확인한다음실행한다. $ bkill 671

한편, 병렬 Pool에는모두 4개의 Queue 가설정되어있다. 이것은 24개 CPU를이용한병렬작업이 Queue에쌓여있을경우에다른작업들이실행이되지않는것을방지하기위해서이다. 새벽2시부터오전 8시까지는 16개 CPU 작업이가장높은우선권을가지며실행되고, 나머지시간대에는 4개이하의 CPU 작업이가장우선권이높다. 24개의 CPU를요구하는작업은항상낮은우선권을가지며, Background 환경으로실행이된다. ======================================== QNAME:cpu_4 Qpriority: 새벽 2 시 ~ 8 시까지 : LOW 기타시간 : VERY HIGH cpu limit : 4개까지 ======================================= QNAME:cpu_8 Q priority : 새벽 2 시 ~ 8 시 : LOW 기타시간 : HIGH cpu limit : 8개까지 ======================================= QNAME:cpu_16 Q priority : 새벽 2 시 ~ 8 시 : HIGH 기타시간 : LOW cpu limit : 16개까지 ====================================== QNAME:cpu_24 QPriority:low cpu limit=24 유저의경우에 job을 submit 할때, 특별히 Queue를지정하지않아도유저가요구한 CPU 개수를보고자동으로시스템에서판단하여 Queue 를지정하도록되어있다. 아래는 cpu 6개를요구한유저작업을 submit 했을시의실행모습이다. [hpcman@n001 Linux_mpich_intel]$ bsub < test1 No running job found in queue <cpu_4> No pending job found in queue <cpu_4> No running job found in queue <cpu_8> No pending job found in queue <cpu_8> No running job found in queue <cpu_16> No pending job found in queue <cpu_16> No running job found in queue <cpu_24> No pending job found in queue <cpu_24>... hpcman 's Job submitted to cpu_8 Queue Job <1880> is submitted to queue <cpu_8>. 만약유저가특정 Queue를지정하고자할경우에는 -q 옵션을줄수있다. 이러한경우는 다음에설명할 Parametric Study 의경우에유용하게사용할수있다.

4 반복적작업수행 : Parametric Study 클러스터시스템은병렬응용프로그래밍의개발및수행에도많이활용되지만, 많은공학 분야에서널리활용되는 Parametirc Study와같이동일한작업을여러개의입력데이터를 이용해서수행해야하는, 이른바 High-throughput Computing 환경에도매우적합하다. hpceng 시스템의 Scheduler인 LSF에서도 High-throughput Computing을쉽게구현할수있 다. 예) p4c 라는실행코드를이용하여 10개의서로다른입력데이터를이용해서계산을수행한후 Stdout 출력을서로다른파일에저장할경우. 먼저수행할프로그램을컴파일한다. 인텔컴파일러, GNU gcc 컴파일러등적합한컴파일러로컴파일한다. 그런다음, 입력데이터파일을첨자를이용해서구별되도록작성한다. 10개의입력데이터일경우다음과같이작성하고, 실행코드와같은위치에옮겨놓는다. input.1 input.2 input.10 그런다음, bsub 명령을통해서작업을 submit 을하는데, 문법은다음과같다. bsub -J arrayname[indexlist,...]" myjob 위의예제의경우에는다음과같이수행할수있다. $ bsub -J "testarray[1-10]" -i"input.%i" -o"output.%i" -e"err.%i"./p4c ( 주의 %I에서 I는대문자 i 입니다) 위의명령을통해서실제로수행하는작업은다음과같다../p4c input.1 : stdout => output.1, stderr => err.1./p4c input.2 : stdout => output.2, stderr => err.2./p4c input.10 : stdout => output.10, stderr => err.10 그런데이러한 Parametric Study의경우에는동시에요구되는 cpu는 1개이므로앞에서설명한것처럼가장우선권이높은 cpu_4 Queue 를사용하게된다. 이럴경우의문제는우선권이높아서작업이빨리실행되기는하지만, 동시에 4개의 cpu 밖에활용할수없게된다. 따라서 16개이상의경우의수를보다빨리수행시키기위해서는 -q 옵션으로 cpu_24 Queue를지정해주는것이바람직하다. $ bsub -q cpu_24 -J "testarray[1-10]" -i"input.%i" -o"output.%i" -e"err.%i"./p4c submit 한작업을상황을알아보기위해서는앞에서설명한 bjobs 명령을통해서살펴볼수있다. array를이용해서 submit 한작업은모두동일한 JOBID 를가지게된다. bjobs 명 령을통해서 arrary를통해 submit 된작업의전체정보를보려면다음과같이사용한다.

bjobs -A JOBID submit 한작업을취소할때도별로취소할수있다. array 전체작업을한번에취소할수있고각각의단위작업 $ bkill JOBID : (Ex. bkill 798 ) 전체작업취소 $ bkill "JOBID[Index]" (Ex. bkill "798[2]" 798의 JOBID 작업중 2 번째작업취소)

hpceng 시스템에서작업의 dependency를설정하는방법은 -w "done(jobname)" 이라는옵션을사용하는것입니다. 한가지명심할것은 jobname을이용하기위해서 -J 옵션으로모든 Q 작업에 Jobname을설정해주는것입니다. 예를들어서 p4c라는 serial job과 test1 파일에명시된병렬 job을이용해서돌리는것을살펴보겠습니다. 먼저 test1 파일에병렬 job 을설정해줍니다. #BSUB -n 8 #BSUB -o 1.out #BSUB -e 1.err mpijob./xhpl 그런다음, jobexec 라는파일을만들어서다음과같이적습니다. bsub -J Job1./p4c bsub -J mpijob1 -w "done(job1)" < test1 bsub -J Job2 -w "done(mpijob1)"./p4c bsub -J mpijob2 -w "done(job2)" < test1 저장하고나와서 chmod +x jobexec 라는명령을통해서실행권한을설정해줍니다. jobexec 파일을살펴보면두번째라인의의미는 Job1 이라는이름의 Jobname을가지는작업이완료되면 test1에설정된병렬작업을수행하라는의미입니다. Job1은첫번째라인에명시된 p4c serial 작업입니다. 세번째라인의의미는두번째라인에정의된 mpijob1이완료되면 p4c 코드를돌리라는의미입니다. jobexec 를수행하실때는./jobexec라고하시면되고각단계별로 bjobs 를살펴보면다음과같습니다. [hpcman@n009 Linux_mpich_intel]$./jobtest3 Job <1099> is submitted to default queue <normal>. Job <1100> is submitted to default queue <normal>. Job <1101> is submitted to default queue <normal>. Job <1102> is submitted to default queue <normal>. [hpcman@n009 Linux_mpich_intel]$ bjobs JOBID USER STAT QUEUE FROM_HOST EXEC_HOST JOB_NAME SUBMIT_TIME 1099 hpcman PEND normal n009 Job1 Mar 25 11:10

1100 hpcman PEND normal n009 mpijob1 Mar 25 11:10 1101 hpcman PEND normal n009 Job2 Mar 25 11:10 1102 hpcman PEND normal n009 mpijob2 Mar 25 11:10 [hpcman@n009 Linux_mpich_intel]$ bjobs JOBID USER STAT QUEUE FROM_HOST EXEC_HOST JOB_NAME SUBMIT_TIME 1099 hpcman RUN normal n009 n002 Job1 Mar 25 11:10 1100 hpcman PEND normal n009 mpijob1 Mar 25 11:10 1101 hpcman PEND normal n009 Job2 Mar 25 11:10 1102 hpcman PEND normal n009 mpijob2 Mar 25 11:10 [hpcman@n009 Linux_mpich_intel]$ bjobs JOBID USER STAT QUEUE FROM_HOST EXEC_HOST JOB_NAME SUBMIT_TIME 1100 hpcman RUN normal n009 n005 mpijob1 Mar 25 11:10 n005 n012 n012 n007 n007 n006 n006 1101 hpcman PEND normal n009 Job2 Mar 25 11:10 1102 hpcman PEND normal n009 mpijob2 Mar 25 11:10 [hpcman@n009 Linux_mpich_intel]$ bjobs JOBID USER STAT QUEUE FROM_HOST EXEC_HOST JOB_NAME SUBMIT_TIME 1101 hpcman RUN normal n009 n011 Job2 Mar 25 11:10 1102 hpcman PEND normal n009 mpijob2 Mar 25 11:10 [hpcman@n009 Linux_mpich_intel]$ bjobs JOBID USER STAT QUEUE FROM_HOST EXEC_HOST JOB_NAME SUBMIT_TIME 1102 hpcman RUN normal n009 n003 mpijob2 Mar 25 11:10 n003 n008 n008 n004 n004 n010 n010

4. 공학용 Package 이용하기 현재, 설치된공학용소프트웨어들과해당시스템은다음과같다. fluent : hpceng4.snu.ac.kr (147.46.237.140) diana : hpceng3.snu.ac.kr (147.46.237.139) matlab : hpceng2.snu.ac.kr (147.46.237.138) abaqus : hpceng1.snu.ac.kr (147.46.237.137) ls-dyna: hpceng.snu.ac.kr (147.46.237.136) 3절 1항의로그온하기항목을참조하여 SSH를이용하여위의해당시스템으로접속하면사용할수있다. 각소프트웨어별로이용가능한 On-line 매뉴얼등은공대홈페이지 (http://eng.snu.ac.kr) 에서전산환경을클릭한다음소프트웨어설명을보면이용가능하다. 1 fluent hpceng4.snu.ac.kr로접속한후에 xterm을실행시키면 fluent, gambit 등의명령어를통해 서사용할수있다. 2 matlab hpceng2.snu.ac.kr로접속한후에 xterm을실행시키고 matlab이라는명령어로이용가능하 다. matlab 자체적으로 help 명령어를통해서각 Command 별로상세한정보를얻을수있 다. GUI 인터페이스를쓰지않고싶으면 -nodesktop 옵션을주고실행시키면 text 모드로 쓸수있다. 3 abaqus hpceng1.snu.ac.kr로접속한후에 abaqus 라는명령어로사용할수있다. abaqus viewer 등을실행하기위해서는xterm 을실행한후에수행한다. 4 ls-dyna hpceng.snu.ac.kr 로접속한후에 "lsdyna ncpu=<cpu 개수> i=<input file>" 의명령으로실 행시킬수있으며 stdout 은 <input file>.out 으로, stderr 는 <inputfile>.err로각각저 장된다. ls-dyna 작업을위해할당될수있는최대CPU 개수는8 개이다. lspost를실행하 기위해서는xterm 을실행한후에수행한다.