TR-SDIO-Heterogeneity.hwp

Similar documents

이도경, 최덕재 Dokyeong Lee, Deokjai Choi 1. 서론

Microsoft PowerPoint - chap02-C프로그램시작하기.pptx

Microsoft PowerPoint - chap01-C언어개요.pptx

04 ÇÐ¼ú_±â¼ú±â»ç

경우 1) 80GB( 원본 ) => 2TB( 복사본 ), 원본 80GB 는 MBR 로디스크초기화하고 NTFS 로포맷한경우 복사본 HDD 도 MBR 로디스크초기화되고 80GB 만큼포맷되고나머지영역 (80GB~ 나머지부분 ) 은할당되지않음 으로나온다. A. Window P

[Brochure] KOR_TunA

<5BB0EDB3ADB5B55D B3E2B4EBBAF12DB0ED312D312DC1DFB0A32DC0B6C7D5B0FAC7D02D28312E BAF2B9F0B0FA20BFF8C0DAC0C720C7FCBCBA2D D3135B9AEC7D72E687770>

Storage_for_Megapixel_Video01

Windows Server 2012

Microsoft PowerPoint - 알고리즘_1주차_2차시.pptx

PowerPoint 프레젠테이션

Microsoft Word - windows server 2003 수동설치_non pro support_.doc

Microsoft PowerPoint - chap10-함수의활용.pptx

1_12-53(김동희)_.hwp

2 PX-8000과 RM-8000/LM-8000등의 관련 제품은 시스템의 간편한 설치와 쉬운 운영에 대한 고급 기술을 제공합니다. 또한 뛰어난 확장성으로 사용자가 요구하는 시스템을 손쉽게 구현할 수 있습니다. 메인컨트롤러인 PX-8000의 BGM입력소스를 8개의 로컬지

리뉴얼 xtremI 최종 softcopy

현재 유사 시스템은 카페에 도입될 수 없는 실정이 즉, 현 카페의 좌석 관리는 빈 좌석 현황을 자 동적으로, 실시간으로 알 수 없기 때문에 고객과 카 페의 점원 및 점주 모두가 불편함을 겪고 있는 것이 이는 카페 이해관계자들의 요구사항을 충분히 반영하지 못한 결과라고

< FBEC8B3BBB9AE2E6169>

비디오 / 그래픽 아답터 네트워크 만약에 ArcGolbe를 사용하는 경우, 추가적인 디스크 공간 필요. ArcGlobe는 캐시파일을 생성하여 사용 24 비트 그래픽 가속기 Oepn GL 2.0 이상을 지원하는 비디오카드 최소 64 MB 이고 256 MB 이상을 메모리

한국어교재_2급 1~12과_선-인쇄용.indd

설치 순서 Windows 98 SE/Me/2000/XP 1 PC를 켜고 Windows를 시작합니다. 아직 컴퓨터에 프린터를 연결하지 마십시오. 2 PC에 P-S100 CD-ROM(프 린터 드라이버)을 삽입합니다. 3 설치 프로그램을 시작합니다. q CD-ROM의 PS1

<4D F736F F F696E74202D203137C0E55FBFACBDC0B9AEC1A6BCD6B7E7BCC72E707074>

Straight Through Communication

Microsoft Word - PLC제어응용-2차시.doc

PowerPoint 프레젠테이션

Microsoft PowerPoint - eSlim SV [ ]

DBMS & SQL Server Installation Database Laboratory

2013unihangulchar {45380} 2unihangulchar {54617}unihangulchar {44592} unihangulchar {49328}unihangulchar {50629}unihangulchar {51312}unihangulchar {51

Microsoft PowerPoint - 알고리즘_5주차_1차시.pptx

커알못의 커널 탐방기 이 세상의 모든 커알못을 위해서

<B3EDB9AEC0DBBCBAB9FD2E687770>

아이콘의 정의 본 사용자 설명서에서는 다음 아이콘을 사용합니다. 참고 참고는 발생할 수 있는 상황에 대처하는 방법을 알려 주거나 다른 기능과 함께 작동하는 방법에 대한 요령을 제공합니다. 상표 Brother 로고는 Brother Industries, Ltd.의 등록 상

Oracle9i Real Application Clusters

CLX8380_KR.book

ThinkVantage Fingerprint Software

RHEV 2.2 인증서 만료 확인 및 갱신

시편강설-경건회(2011년)-68편.hwp

<C1D6BFE4BDC7C7D0C0DA5FC6EDC1FDBFCF28B4DCB5B5292E687770>

와플-4년-2호-본문-15.ps

Drucker Innovation_CEO과정

Microsoft PowerPoint - chap05-제어문.pptx

목 차 1. 드라이버 설치 설치환경 드라이버 설치 시 주의사항 USB 드라이버 파일 Windows XP에서 설치 Windows Vista / Windows 7에서 설치 Windows

Microsoft PowerPoint - 30.ppt [호환 모드]

U.Tu System Application DW Service AGENDA 1. 개요 4. 솔루션 모음 1.1. 제안의 배경 및 목적 4.1. 고객정의 DW구축에 필요한 메타정보 생성 1.2. 제품 개요 4.2. 사전 변경 관리 1.3. 제품 특장점 4.3. 부품화형

AGENDA 모바일 산업의 환경변화 모바일 클라우드 서비스의 등장 모바일 클라우드 서비스 융합사례

(001~006)개념RPM3-2(부속)

Microsoft PowerPoint - 알고리즘_2주차_1차시.pptx

Microsoft PowerPoint - 02_Linux_Fedora_Core_8_Vmware_Installation [호환 모드]

BY-FDP-4-70.hwp

<BACFC7D1B3F3BEF7B5BFC7E22D3133B1C733C8A BFEB2E687770>

Sequences with Low Correlation

= ``...(2011), , (.)''

Microsoft Word - New_MMB_120921

쓰리 핸드(삼침) 요일 및 2405 요일 시간, 및 요일 설정 1. 용두를 2의 위치로 당기고 반시계방향으로 돌려 전날로 를 설정합니다. 2. 용두를 시계방향으로 돌려 전날로 요일을 설정합니다. 3. 용두를 3의 위치로 당기고 오늘 와 요일이 표시될 때까지 시계방향으로

KARAAUTO_4¿ù.qxd-ÀÌÆå.ps, page Normalize

Windows 8에서 BioStar 1 설치하기

KDTÁ¾ÇÕ-1-07/03

KDTÁ¾ÇÕ-2-07/03

호랑이 턱걸이 바위

(72) 발명자 이동희 서울 동작구 여의대방로44길 10, 101동 802호 (대 방동, 대림아파트) 노삼혁 서울 중구 정동길 21-31, B동 404호 (정동, 정동상 림원) 이 발명을 지원한 국가연구개발사업 과제고유번호 부처명 교육과학기술부

solution map_....

Run 봄 연습 Mar 18 Mar 24, 2018, Week 3 문제 1. 초코바 입력 파일: 출력 파일: 시간 제한: 메모리 제한: standard input standard output 1 seconds 128 megabytes H W 격자 모양의 초콜릿이 있다.

Splentec V-WORM Quick Installation Guide Version: 1.0 Contact Information 올리브텍 주소 : 경기도성남시분당구구미로 11 ( 포인트타운 701호 ) URL: E-M

Microsoft Word - s.doc

i-movix 특징 l 안정성 l 뛰어난화질 l 차별화된편의성

한눈에-아세안 내지-1

이슈분석 2000 Vol.1

가볍게읽는-내지-1-2

Microsoft PowerPoint - eSlim SV [080116]

Figure 1: 현존하는 정적 분석 기술의 한계와 본 연구의 목표. 이러한 허위경보(false alarm)를 가질 수 밖에 없는데, 오탐율(전체 경보중 허위경보의 비율)이 정확도의 척도가 된다. 유용한 정적 분석기는 충분히 낮은 허위경보율을 가져야 한다. 대형 프로그

Microsoft 을 열면 깔끔한 사용자 중심의 메뉴 및 레이아웃이 제일 먼저 눈에 띕니다. 또한 은 스마트폰, 테블릿 및 클라우드는 물론 가 설치되어 있지 않은 PC 에서도 사용할 수 있습니다. 따라서 장소와 디바이스에 관계 없이 언제, 어디서나 문서를 확인하고 편집

PathEye 공식 블로그 다운로드 받으세요!! 지속적으로 업그래이드 됩니다. 여러분의 의견을 주시면 개발에 반영하겠 습니다.

Transcription:

단일 디스크 입출력에서의 디스크 이질성 지원 김호진(Hojin Ghim) 한국과학기술원 전자전산학과 전산학전공 컴퓨터구조연구실 2004년 8월 20일 요약 본 보고서에서는 클러스터 상에서 다양한 종류의 디스크를 지원하도록 개선된 단일 디스크 입출력에 대해 설명한다. 단일 디스크 입출력은 리눅스의 커널 모듈의 형태로 제작되었으며 클러스터 내의 다양한 디스크를 하나의 큰 디스크 장치처럼 보이도록 해주는 역할을 한다. 또한 다양한 성능의 디스크가 존재할 때 모든 디스크의 성능을 최대한 활용하도록 한다. 1

1. 서론 클러스터 시스템은 저렴한 가격과 확장성으로 인해 큰 인기를 얻고 있다. 클러스터 시스템 이 많이 쓰이게 되고 규모 또한 점차 커지면서 이질적인 하드웨어에 대한 지원이 필수적이 게 되었다. 본 보고서에서는 이질적인 디스크를 보유한 클러스터 시스템에서 SDIO [1] 가 어 떻게 이질적인 디스크를 활용할 것인가에 대한 해결 방안을 모색한다. SDIO는 클러스터 시스템의 각 노드의 디스크를 묶어 하나의 큰 디스크로 보이게 하는 소프 트웨어이다. 기존의 SDIO는 모든 디스크를 동일한 성능과 동일한 용량의 디스크로 간주하 고있다. 디스크의 이질성은 다양한 각도에서 정의될 수 있지만 본 연구에서는 디스크의 성능과 용량 을 이질성의 기준으로 삼는다. 또한 성능이나 용량이 다른 디스크가 두 종류 이상 존재할 때의 시스템 환경을 이질적인 디스크 환경이라 부른다. 본 연구에서는 이질성 문제를 해결하기 위해 디스크의 이질성에 따라 디스크 블락의 배치를 조정할 수 있는 알고리즘을 제시하고 이 알고리즘을 적용시킨 명한 후 실험에 의한 성능을 보인다. SDIO(SDIO-HETERO) 를 설 2

2. 관련연구 가. AdaptRaid5 여러 개의 디스크를 활용하여 전체 디스크 시스템의 성능을 높이고 데이터 신뢰도를 높이기 위해 일반적으로 RAID [2] 기법을 사용한다. 이 중 RAID-5는 여러 개의 디스크 중 하나에 패리티를 저장하여 디스크 장애 발생시에 데이터를 복구할 수 있도록 하며, 큰 데이터의 읽 기/ 쓰기, 작은 데이터의 읽기에서 높은 성능을 보인다. 기존의 RAID는 homogeneous한 disk configuration 만을 고려한 것이다. AdaptRaid5 [3] 는 널리 쓰이고 있는 RAID-5를 heterogeneous 디스크 환경에서 사용하도록 변형시킨 것이다. 따라서 RAID-5 의 장점을 그대로 얻을 수 있으며, 다양한 용량의 디스크 에서 용량 활용률을 최대화시킨다. 이를 위해 AdaptRaid5 에서는 다음의 순서에 따라 데이터 블락을 여러 디스크에 배치한다. 1. 디스크 성능이 좋을수록 디스크 용량도 크다고 가정한다. 용량이 큰 디스크에 많은 데이 터를 저장하고, 용량이 작은 디스크에 적은 데이터를 저장한다. 이에 따라 디스크 주소에 따라 스트라이프의 크기가 달라진다. 2. RAID-5 는 작은 데이터의 쓰기 작업이 느리다는 고질적인 문제점을 가지고 있다. 이러한 작은 데이터 쓰기의 성능이 낮은 문제를 최소화시키기 위해 모든 스트라이프를 가장 큰 스트라이프의 약수가 되도록 줄인다. 이로써 파일 시스템 레벨에서 가장 큰 스트라이프 크기를 기준으로 디스크 작업을 수행함으로써 작은 데이터에 대한 기록 작업 횟수를 줄 일 수 있다. 3. 스트라이프 크기가 줄어들어서 비게 된 디스크 블락에 다음 디스크 블락의 내용을 밀어 채운다. 이로써 빈 공간 없이 모든 디스크 공간을 활용할 수 있다. 디스크 공간 활용률은 거의 100% 에 가깝게 된다. 4. 앞의 순서가 끝난 상태에서 용량이 작은 디스크는 주소 공간의 앞쪽에만 위치되게 된다. 따라서 전체 디스크 시스템의 주소 공간 중 앞쪽에 있는 파일은 큰 스트라이프를 사용해 모든 디스크에 다 저장되지만 주소 공간 중 뒤쪽에 위치한 파일은 작은 스트라이프를 사 3

그림 1 AdaptRaid5의 디스크 블락 배치 용하므로 보다 작은 수의 디스크에 분포되게 된다. 를 낮춤으로써 비교적 낮은 성능을 나타내게 한다. 이는 후자에 대해 병렬 작업의 효과 이 문제를 해결하기 위해 스트라이프 를 큰 것부터 만들지 않고 크고 작은 스트라이프의 패턴을 반복시킨다. 이로써 파일이 주소 공간의 어느 위치에 있어도 큰 스트라이프와 작은 스트라이프가 골고루 사용되게 된다. 그림 1 은 위 알고리즘의 결과를 보여준다. AdaptRaid5는 위의 알고리즘을 사용함으로써 heterogeneous 디스크 환경의 모든 용량을 활용하면서 RAID-5 와 비슷한 성능과 신뢰도를 보이고 있다. 그러나 단순한 계산으로 주소 가 결정되는 RAID-5와 달리 addressing에 다중 레벨의 테이블을 필요로 하며 그 검색 알 고리즘도 복잡해진다. 또한 디스크 블락 배치가 고정되어 disk configuration의 변동에 적 응하기 어렵다. 4

나. Panda Panda [4] 는 대용량 과학 계산 어플리케이션을 위해 개발된 I/O 라이브러리이다. Panda는 collective I/O 형태의 API 를 제공하며 원래 수퍼 컴퓨터에서 개발되었으나, 후에 클러스터 시스템에서도 사용할 수 있도록 개선되었다. collective I/O API를 통해 받는 데이터는 파 일 시스템에서 보통 쓰이는 바이트 스트림이 아니고 다차원 배열의 데이터이다. Panda 라 이브러리는 이 데이터를 I/O 노드에 적절히 분배하여 저장한다. 데이터가 디스크에 분배되는 과정은 다음과 같다. 1. I/O 서버 개수와 I/O 서버의 선택 I/O 서버의 수는 미리 정해져 있을 수도 있고 동적으로 결정할 수도 있다. 일단 모든 노드 의 I/O 성능을 측정한 후 그 결과에 따라 전체 throughput의 합계가 가장 높을 것으로 예 측되는 I/O 서버 수를 선택한다. 클러스터의 인터커넥션 네트웍의 속도가 낮을 경우에는 데 이터의 locality를 고려하여 I/O 서버를 결정한다. 인터커넥션 네트웍의 속도가 높을 경우에 는 I/O 서버의 load balancing을 고려하여 I/O 서버를 결정한다. 2. 데이터 나누기 데이터 나누기는 두 단계로 이루어진다. 첫 단계는 데이터의 액세스 패턴에 따라 사용자가 직접 지정해주는 것이다. 다음 단계는 사용자에 의해 나누어진 데이터를 작은 단위로 잘게 나누는 작업이다. 데이터를 좀더 잘게 나눔으로써 더욱 세밀하게 load balancing을 수행할 수있다. 3. I/O 서버에 데이터 할당 이 작업은 1번 과정에서 측정된 I/O 서버의 성능에 따라 데이터를 배당하는 작업이다. 1번 과정에서의 성능을 기준으로 할당해놓고 계속 사용하는 static 방법이 있고, 매번 I/O가 발 생할 때마다 지난 I/O에서의 성능을 기준으로 재할당하는 dynamic 방법이 있다. dynamic 과 static을 적절히 조합한 hybrid 방법을 사용할 수도 있다. 5

Panda는 여러 노드에서 대용량의 데이터를 동시에 읽고 쓰는 collective I/O에 알맞게 만들 어져 있다. collective I/O API를 사용하는 어플리케이션에서 아주 높은 성능을 보일 수 있 다. 그러나 collective I/O는 블락 단위로 작업하는 디스크 레벨에서는 제공할 수 없는 API 이다. 따라서 일반적인 사용에는 적합지 않다. 다. RIO RIO [5] (Randomized I/O) 는 멀티미디어 데이터를 위한 스토리지 시스템이다. 여러 개의 디 스크를 사용하여 멀티미디어 데이터 요구에 대한 동시 처리량을 높이고 또한 최대 지연 시 간을 보장함으로써 실시간 전송을 지원하는 것을 목적으로 한다. RIO는원본데이터와복제본의두가지측면에서데이터allocation 을수행한다. 원본 데이터는 random 디스크의 random 블락에 저장된다. uniform random 함수를 사용 함으로써 모든 데이터의 long-term load balance 가 보장된다. 그러나 randomization으로 short-term load balance 는 제공되지 않는다. RIO에서는 short-term load balance를 제공 하기 위해 복제본을 저장한다. 복제본의 저장 위치를 결정하기 위해 디스크의 성능을 나타내는 지표 중 하나인 BSR [6] 을 사용한다. BSR은 Bandwidth-Space Ratio의 약자로서 용량에 비해 높은 성능을 보이는 디 스크에서 높게 나타나는 척도이다. 원본 데이터를 BSR이 높은 디스크에 저장하고 복제본은 BSR이 낮은 디스크에 데이터의 일부분을 중복 저장하면 기본적인 로드는 원본 데이터에서 가져가고 부족한 밴드위쓰에 대해 복제본을 사용함으로써 목표하는 최대 밴드위쓰를 만족시 키고, short-term load balance 를 이룰 수 있다. 복제본이 기록된 낮은 BSR의 디스크는 비교적 용량이 크므로 많은 복제본이 기록되지만 각각의 복제본은 원본 데이터의 일부만을 저장하며 보조적인 역할을 하므로 디스크의 밴드위쓰를 초과하지 않을 수 있다. 시뮬레이션 결과 원본 데이터의 100% 복제본을 만들면 BSR이 높은 디스크에 복제본을 만 드는 것과 확률적으로 같은 성능을 보였다. RIO 는 덩어리가 크고, 쓰기보다는 읽기가 주 작업인 데이터에 대해 좋은 성능을 보인다. 그 러나 randomization 된 각각의 블락의 위치를 기록하기 위한 매핑 테이블의 크기가 필연적 으로 커지게 되므로 성능의 장애 요소가 된다. 또한 작은 데이터나 메타데이터를 많이 사용 6

하는 파일 시스템 작업에서는 좋은 성능을 낼 수 없다. 두 가지 종류의 디스크만을 사용할 수 있으므로 heterogeneity 의 지원이 제한적이다. 7

3. Single Disk I/O (SDIO) 그림 2 SDIO 서비스 개념 SDIO는 클러스터 환경에서 여러 노드에 장착되어 있는 디스크들을 하나의 디스크처럼 사용 하도록 해주는 SSI 서비스의 일종이다. SDIO는 장치 드라이버 수준에서 구현되어 있으며 응용 프로그램에서 하나의 디스크를 사용하듯이 시스템에 흩어져 있는 디스크에 저장된다. SDIO를 사용하면 실제 데이터는 클러스터 이처럼 하나의 가상 디스크를 제공함으로써 응용 프로그램은 데이터의 실제 위치에 신경쓸 필요없이 전체 클러스터 시스템의 디스크를 모두 사용할 수 있다. 또한 여러 개의 디스크를 병렬 작업에 활용하여 하나의 디스크에서보다 더욱 높은 성능을 얻을 수 있으며, 데이터를 중복 저장하여 필연적으로 발생할 수밖에 없는 디스크의 장애에도 불구하고 데이터의 유실 을방지할수있다. SDIO는 장치 드라이버 수준에서 구현되어 있으므로 블락 단위의 Application Programming Interface(API)에서 투명성이 보장되므로 응용 프로그램이 보기에 물리적인 하드디스크와 완전히 같다. 따라서 SDIO에서 제공하는 가상 디스크에 일반적인 디스크에 사용되는 파일시스템을 수정 없이 사용하는 것이 가능하다. 파일시스템을 사용하는 응용 프 로그램들도 마찬가지로 소스코드 수정이나 재 컴파일이 필요 없으므로 이진 코드 수준의 호 환성이 제공된다. 8

그림 3 SDIO 서비스 구성도 SDIO는 여러 노드에서 수행중인 여러 응용 프로그램에 의해 동시에 접근될 때의 일관성을 보장하지는 않는다. SDIO는 응용 프로그램에 블락 단위의 API를 제공하는데 블락 단위의 API는 파일 단위의 API와는 달리 한 블락에 대한 작업 요청이 이어지는 다른 작업 요청과 연관성이 없다. 여러 노드에서 여러 응용 프로그램의 동시 접근을 일관성 있게 허용하기 위 해서 SDIO 위에 분산 파일시스템을 사용할 수 있다. 그림 3은 SDIO 의 구성도이다. 이 그림은 클러스터 시스템의 각 노드에 적재되어 있는 장치 드라이버의 내부 구조를 나타낸 것이다. SDIO 장치 드라이버로 들어오는 I/O 요청은 Request Redirector Module 로 전달된다. 이 모듈은 Localtion Lookup Module을 사용하여 요청된 데이터 블락이 로컬 노드의 디스크에 있는지 확인한다. 데이터 블락이 로컬 노드의 디스크 안에 있을 때 Request Redirector Module은 Local Disk Manager Module 에 디스크 작업을 요청한다. 데이터 블락이 로컬 노드의 디스크 안에 있지 않을 때 Request Redirector Module은 I/O 요청에 해당하는 내 용을 Request Forwarding Module 로 보낸다. 이 때 Localtion Lookup Module에서 알아 낸 데이터 블락의 위치도 함께 보내진다. Request Forwarding Module은 네트웍을 통해 데이터 블락을 가지고 있는 노드로 I/O 요청을 전송한다. 네트웍을 통해 전송된 I/O 요청은 리모트 노드의 SDIO 장치 드라이버 내의 Remote Request Handler Module 이 받는다. Remote Request Handler Module은 Local Disk Manager Module을 이용하여 디스크에 9

원하는 작업을 수행하고 난 뒤 다시 네트웍을 통해 결과값을 전송한다. Request Forwarding Module에서 결과값을 받으면 Request Redirector Module에서 응용 프로그램 으로 결과를 되돌려준다. 각 데이터 블락이 어느 노드의 어느 디스크에 존재하는지는 Location Lookup Module에 의해 결정되어 있다. 현재 Location Lookup Module은 기존에 RAID 레벨 0과 RAID 레벨 1 을 사용하여 제작되어 있고, 필요에 따라 새로운 방법을 사용할 수 있도록 유연하게 설계 되어 있다. 10

block (8K) 1K 1K 2K 2K 3K sub-block 2K 2K 3K 그림 4 디스크와 블락과 서브블락의 관계 4. SDIO-HETERO 가. 기본 알고리즘 SDIO-HETERO는 본 절에서 설명하는 알고리즘을 사용하여 디스크 블락의 배치를 결정한 다. 디스크 블락의 배치는 시스템 초기 설치시에만 수행할 수 있다. SDIO-HETERO 에서 하나의 블락은 여러 개의 서브블락으로 구성되며, 각 서브블락은 서로 다른 노드의 다른 디스크에 존재할 수 있다. 모든 블락의 크기는 같지만 블락을 구성하는 서브블락의 크기와 수는 다를 수 있다. 서브블락의 크기는 디스크의 특성에 따라 결정되기 때문에, 한 디스크에 존재하는 서브블락의 크기는 모두 같다. 디스크와 블락, 서브블락의 관 계를 그림 4 에서 설명하고 있다. 모든 디스크 접근의 단위는 블락이고, 한 번의 블락 접근에 여러 개의 서브블락에 대한 접 근이 동시에 일어나게 된다. 디스크 블락 배치 알고리즘은 각 블락이 어떤 서브블락으로 구성되며, 각 서브블락이 어느 노드의 어느 디스크에 위치하는지를 결정하는 과정이다. 1. 시스템에 포함된 모든 디스크에 대해 서브블락의 크기를 정한다. 모든 디스크에서 서브 블락에 접근하는데 필요한 시간이 동일하도록 서브블락의 크기를 정한다. 디스크의 성능 에 따라 데이터에의 접근 시간이 다르므로 빠른 디스크의 서브블락은 용량이 비교적 크 고. 느린 디스크의 서브블락은 용량이 작아진다. 모든 서브블락에 대한 접근 시간이 같아 11

지므로 하나의 블락에 접근할 때 속도가 느린 디스크가 병목 현상을 발생시키지 않게 된 다. 현재 대부분의 디스크의 최소 접근단위는 512바이트이므로 서브블락의 크기는 512바이 트의 배수가 된다. 2. 서브블락들이 구성하는 블락은 SDIO-HETERO 에서 기본 작업 단위가 된다. 일반 디스크 사용시 대부분의 작업 단위가 4KB이거나 그 약수이므로 기존 파일시스템이나 어플리케 이션들은 4KB 의 배수의 단위로 디스크에 접근하도록 최적화되어 있는 경우가 많다. 따 라서 SDIO-HETERO에서도 블락을 4KB의 배수로 맞추면 기존 어플리케이션의 최적화 기법이 그대로 적용될 수 있다. 블락의 크기를 4KB의 배수로 맞추기 위해 먼저 모든 디스크의 서브블락의 크기의 합계 가 4KB 의 배수가 되도록 한다. 서브블락의 크기는 다음과 같이 조정할 수 있다. 가.모든디스크의서브블락을두배한다. 나. 디스크 중 BSR 이 가장 큰 디스크의 서브블락 크기를 한 단계(512 바이트) 줄인다. BSR(Bandwidth-to-Space Ratio)은 디스크의 특성 중 하나로 제공하는 용량에 비해 성능이 얼마나 좋은지를 나타내는 지표이다. 서브블락의 크기를 줄이는 양은 디스크의 하드웨어적인 특성상 512바이트로 정해져 있는데 줄어드는 512에 따른 디스크 밴드위 스 활용률의 감소는 디스크의 BSR 에 따라 달라진다. 1 단계를 수행하면 모든 서브블락은 접근 시간이 같게 된다. 여기서 한 서브블락의 크 기를 줄이는 것은 해당 디스크가 다른 디스크보다 작업을 일찍 끝내고 다른 디스크의 작업이 끝나길 기다리는 결과를 가져온다. BSR이 가장 큰 디스크의 서브블락을 줄이면 줄어든 512바이트에 대한 작업 시간의 감소가 가장 작으므로 디스크 밴드위스 활용률 이가장적게줄어든다고볼수있다. 3. 서브블락을 여러 개의 그룹으로 나눈다. 이 때 모든 그룹은 속한 서브블락의 크기의 합 계가 같아야 한다. 한 그룹으로 묶인 서브블락들이 곧 하나의 블락을 이루게 된다. 같은 크기의그룹으로묶기가불가능한경우2. 가단계를한번더거치고3 단계를수행한다. 그림 5 는 그룹으로 묶은 결과를 예시한 것이다. 12

2K 2K 1K 1K 3K 2K 2K 3K 그림 5 서브블락을 그룹지어 하나의 블락을 만든다. 나. 구현 SDIO-HETERO의 구조는 SDIO 와 전체적으로 같다. 그러나 하나의 블락 작업 수행시 여러 개의 서브 블락에 대한 접근을 위해 Request Redirector Module 이 수정되었으며, 서브 블 락의위치를찾기위해 Location Lookup Module 또한변경되었다. Reqest Redirector Module은 한 번의 블락 작업에서 여러 서브블락에 대한 요청을 생성해 서 Local Disk Manager Module이나 Request Forwarding Module 에 전달한다. Location Lookup Module은 블락에 속한 서브블락이 어느 디스크에 있는지를 저장하는 간 단한 테이블을 생성함으로써 작업이 이루어질 디스크를 신속히 검색할 수 있다. 디스크 내 에서의 서브블락의 위치는 블락 번호(B) 와 그룹 수(G), 서브블락의 크기(s) 를 사용하여 다음 의식으로계산할수있다. 주어진 디스크의 서브블락 크기(s) 가 몇인지도 하나의 작은 테이블에 저장해놓고 사용한다. 블락-> 디스크 테이블의 크기는 디스크 수이며, 서브블락 크기 테이블의 크기도 디스크 수 이므로매주작은메모리만을차지하며검색또한빠르다. 13

5. 성능 평가 성능 평가에 사용된 장비는 다음과 같다. 기종 A B CPU Intel Pentium IV 1.8GHz Intel Pentium III 850MHz 메모리 512MB 1.5GB 하드디스크 모델명 IBM Deskstar 120GXP SAMSUNG SpinPoint 40GB 하드디스크 인터페이스 UATA100 UATA100 하드디스크 내장 버퍼 2MB 512KB 하드디스크 전송률 100MB/s 100MB/s 하드디스크 평균탐색시간 8.5ms 9ms 100메가바이트를 읽고 쓰는 간단한 실험 결과 위 기종의 디스크 작업 성능은 다음과 같이 나타났다. 기종 A B 읽기 41323 KB/s 9051 KB/s 쓰기 29022 KB/s 6899 KB/s 위 결과에 따르면 A는 B에 비해 읽기에서 약 4.5 배, 쓰기에서 약 4.2 배의 성능을 보인다. 성능 평가는 데이터 읽기와 쓰기를 반복했을 때 읽기와 쓰기의 시간당 평균 데이터 전송률 을 척도로 이루어졌다. 데이터에 대한 읽기와 쓰기는 일정한 레코드 크기의 데이터를 연속 적으로 읽어서 총 읽은 양이 100메가가 될 때까지 진행하여 읽기의 시간당 전송률을 구하 고, 같은 방법으로 쓰기의 시간당 전송률을 구한다. 읽기와 쓰기를 번갈아 4번 반복하여 처 음 반복의 전송률은 버리고 나머지 세 번의 전송률의 평균을 계산하였다. 쓰기를 수행할 때 한 번의 레코드를 저장할 때마다 디스크에 동기화를 수행하여 메모리 캐 시의 영향을 줄이도록 했다. 클러스터 시스템 구성은 다음의 네 가지를 사용하였다. A와 B는 사용된 노드 기종을 나타 내고, 괄호 안의 숫자는 해당 디스크에 적용된 서브블락 크기를 뜻한다.( 단위: KB) 아래 표 중 hetero가 SDIO-HETERO 가 적용된 구성이다. 앞에서 나타난 A 기종과 B 기종 의 성능 차에 따라 A 기종에는 B 기종의 네 배의 크기의 서브블락을 사용하도록 하였다. 14

small-b hetero small-a large-a B(4) B(4) A(4) A(16) B(4) B(4) A(4) A(16) B(4) A(16) A(4) A(16) B(4) A(16) A(4) A(16) 그림 6은 읽기 작업에 있어서 레코드 크기가 달라짐에 따라 위의 네 가지 구성의 데이터 전송률을 나타내며, 그림 7은 쓰기 작업에 있어서 레코드 크기가 달라짐에 따라 위의 네 가 60 50 전송률(MB/s) 40 30 20 small-b hetero small-a large-a 10 0 16 40 64 레코드 크기(KB) 그림 6 읽기 작업에 대한 전송률 지구성에서의데이터전송률을나타낸다. 그래프에 보이는 바와 같이 SDIO 의 성능은 구성 노드의 성능 뿐 아니라 서브블락의 크기, 레코드 크기에 따라서도 변화함을 알 수 있다. SDIO-HETERO 는 느린 노드(B) 와 그보다 네 배의 성능을 지닌 노드(A) 가 반반 섞여 있어 빠른 노드로만 이루어진 구성과 느린 노드 로만 이루어진 구성의 중간이거나 중간을 약간 상회하는 성능을 보임을 알 수 있다. SDIO-HETERO의 다른 구성에 대한 성능 비율은 레코드 크기가 작을 때 더 높음을 볼 수 있는데 이는 레코드의 크기가 클 때 서로 다른 크기의 서브블락의 경계를 넘어서는 경우가 많아지기 때문인 것으로 이해할 수 있다. 15

45 40 35 전송률(MB/s) 30 25 20 15 small-b hetero small-a large-a 10 5 0 16 40 64 레코드 크기(KB) 그림 7 쓰기 작업에 대한 전송률 16

6. 결론 클러스터 시스템은 규모가 커지고 유지보수가 진행될수록 동질 노드만으로 구성하는데 큰 비용을 필요로 하게 된다. 본 연구는 이러한 기존 클러스터 시스템을 완전히 대체하지 않고 새로운 구성품만을 추가함으로써 합리적인 비용에 성능을 높일 수 있는 가능성을 제시한다. 이 보고서에서는 이질적인 디스크에 블락을 적절히 분배할 수 있는 알고리즘을 제시한다. 또한 제시된 알고리즘을 구현하는데 관련된 사항을 다루었으며, 구현된 SDIO-HETERO의 성능을 실험을 통해 확인하고 있다. SDIO-HETERO 는 디스크의 가능한 이질성 중 성능을 중점적으로 처리하고 있다. 이에 따 라 모든 디스크의 용량을 전부 사용하지는 못하고 있다. 따라서 이렇게 남는 디스크 용량을 성능에 영향을 주지 않는 한에서 유용하게 사용하는 방법을 찾는 것이 차후 과제로서 남겨 져있다. 17

7. 참고문헌 [1] 황인철, 김동환, 김호진, 맹승렬, 조정완, 단일 디스크 입출력을 위한 커널 모듈 프로 토타입의 설계 및 구현, 한국정보과학회 2003 년도 추계학술발표논문집, 2003 [2] D. A. Patterson, G. A. Gibson and R. Katz, "A Case for Redundant Arrays of Inexpensive Disks", Proceedings of ACM SIGMOD '88, pp109-116, 1988 [3] T. Cortes and J. Labarta, "Extending Heterogeneity to RAID level 5", Proceedings of the General Track: 2001 USENIX Annual Technical Conference, pp119-132, 2001 [4] Y. E. Cho, M. Winslett, S. Kuo, J. Lee and Y. Chen, "Parallel I/O for Scientific Applications on Heterogeneous Clusters: a Resource-Utilization Approach", Proceedings of the 13th International Conference on Supercomputing, pp253-259, 1999 [5] J. R. Santos and R. Muntz, "Performance Analysis of the RIO Multimedia Storage System with Heterogeneous Disk Configurations", Proceedings of the 6th ACM International Conference on Multimedia, pp303-308, 1998 [6] A. Dan and D. Sitaram, "An Online Video Placement Policy Based on Bandwidth to Space Ratio (BSR)", Proceedings of the 1995 ACM SIGMOD International Conference on Management of Data, pp376-385, 1995 18