슬라이드 1

Similar documents
클라우드스토리지서비스 N 드라이브 NHN Business Platform 저장시스템개발팀 / 전성원 2011 NHN Corporation

항목

슬라이드 1

슬라이드 1

Microsoft PowerPoint - 알고리즘_1주차_2차시.pptx

Cloud Friendly System Architecture

Æí¶÷4-¼Ö·ç¼Çc03ÖÁ¾š

리뉴얼 xtremI 최종 softcopy

오브젝트 스토리지를 통한 검색의 신속 정확성 확보 HDS는 계속 증가하고 장기간 존속하는 고정 콘텐츠 관리를 위 해 실제 검증을 마친 수단으로서 오브젝트 스토리지 솔루션 에 주목하고 있다. 그 가장 기본적인 레벨로서 오브젝트 스토리지 기기는 오브젝트의 스토리지를 관리하

초보자를 위한 분산 캐시 활용 전략

Voice Portal using Oracle 9i AS Wireless

산업입지내지6차

PowerPoint 프레젠테이션

Web Application Hosting in the AWS Cloud Contents 개요 가용성과 확장성이 높은 웹 호스팅은 복잡하고 비용이 많이 드는 사업이 될 수 있습니다. 전통적인 웹 확장 아키텍처는 높은 수준의 안정성을 보장하기 위해 복잡한 솔루션으로 구현

<FEFF E002D B E E FC816B CBDFC1B558B202E6559E830EB C28D9>

vm-웨어-앞부속

SANsymphony-V

Ä¡¿ì³»ÁöÃÖÁ¾

목차 BUG offline replicator 에서유효하지않은로그를읽을경우비정상종료할수있다... 3 BUG 각 partition 이서로다른 tablespace 를가지고, column type 이 CLOB 이며, 해당 table 을 truncate

2 / 26

쿠폰형_상품소개서

기업은행현황-표지-5도

Microsoft PowerPoint - eSlim SV [080116]

歯MW-1000AP_Manual_Kor_HJS.PDF

Microsoft PowerPoint - eSlim SV [ ]

VNX 성능 및 경쟁사 제품 포지셔닝

vm-웨어-01장

CONTENTS CONTENTS CONTENT 1. SSD & HDD 비교 2. SSD 서버 & HDD 서버 비교 3. LSD SSD 서버 & HDD 서버 비교 4. LSD SSD 서버 & 글로벌 SSD 서버 비교 2


chungo_story_2013.pdf

*중1부

2

Çѱ¹ÀÇ ¼º°øº¥Ã³µµÅ¥

...._



전반부-pdf

<4D F736F F F696E74202D20312E20B0E6C1A6C0FCB8C15F3136B3E2C7CFB9DDB1E25F325FC6ED28C0BA292E >

_

12월월간보고서내지편집3

에너지포커스 2007년 가을호


01_당선자공약_서울

인권문예대회_작품집4-2




목차

A°ø¸ðÀü ³»Áö1-¼öÁ¤

±¹³»°æÁ¦ º¹»ç1

¿¡³ÊÁö ÀÚ¿ø-Âü°í ³»Áö.PDF

전반부-pdf

뉴스레터6호

Microsoft PowerPoint 하반기 크레딧 전망_V3.pptx

50차 본문 최종

양성내지b72뼈訪?303逞

³»Áöc03âš

fsb9¿ù³»ÁöÃÖÁ¾Ãâ

¾ç¼º-¾÷¹«Æí¶÷-³»¿ëÃà¼Ò4

전도대회자료집


< DBAB4B9ABC3BB5FBAB9B9ABB0FCB8AEB8C5B4BABEF32D33B1C72E706466>

<3344C7C1B8B0C6C320BFE4BEE02D E706466>

µ¶ÀÏÅëÀÏÁý1~2Æíq36£02Ð


자식농사웹완

표1.4출력

003-p.ps

중앙도서관소식지겨울내지33

표1~4

PowerPoint Presentation

<30312DC6EDC1FDC0A7BFF82E687770>

<C0CCBCBCBFB52DC1A4B4EBBFF82DBCAEBBE7B3EDB9AE2D D382E687770>

Backup Exec

2011 <C560><B274><C5BC><B9AC><D3EC><D2B8> <CD5C><C885>.pdf

PowerPoint 프레젠테이션

untitled

공개 SW 기술지원센터

클라우드컴퓨팅이란? WHAT IS CLOUD COMPUTING? 2

Microsoft PowerPoint - 알고리즘_5주차_1차시.pptx

[Brochure] KOR_LENA WAS_

SQL Developer Connect to TimesTen 유니원아이앤씨 DB 기술지원팀 2010 년 07 월 28 일 문서정보 프로젝트명 SQL Developer Connect to TimesTen 서브시스템명 버전 1.0 문서명 작성일 작성자

Microsoft PowerPoint - 6.pptx

슬라이드 1

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션

디지털데일리_스페셜리포트 1부.indd

solution map_....

PowerPoint Presentation

2005 IBM Corporation

본교재는수업용으로제작된게시물입니다. 영리목적으로사용할경우저작권법제 30 조항에의거법적처벌을받을수있습니다. [ 실습 ] 스위치장비초기화 1. NVRAM 에저장되어있는 'startup-config' 파일이있다면, 삭제를실시한다. SWx>enable SWx#erase sta

<4D F736F F F696E74202D C61645FB3EDB8AEC7D5BCBA20B9D720C5F8BBE7BFEBB9FD2E BC8A3C8AF20B8F0B5E55D>

TTA Journal No.157_서체변경.indd

SSD, TCO(Total Cost of Ownership) 관점 수요 확대 동인 확보 TCO(Total Cost of Ownership) 관점 수요 증가 동인 확대 3D NAND의 응용처는 향후 PC에서 엔터프라이즈로 확대될 것으로 판단된다. 엔터 프라이즈 시장에서는

BEA_WebLogic.hwp

국내 디지털콘텐츠산업의 Global화 전략

Oracle9i Real Application Clusters

Microsoft PowerPoint - 10Àå.ppt

Windows 8에서 BioStar 1 설치하기

Dell과 함께라면 가능합니다. 처음 도입하는 서버 또는 두 번째로 도입하는 서버이거나 네트워크를 확장시키거나 관리 기능을 강화하는 등의 모든 요구 사항을 Dell은 지원할 수 있습니다. Dell은 특성이 각기 다른 모든 조직과 회사마다 서로 다른 시점에 서로 다른 요

Transcription:

Contents 네이버의페타바이트데이터 서비스방안 저장시스템개발팀 김태웅부장 2010.11.23 1/27

Contents Ⅰ 스토리지요구사항스토리지요구사항 Ⅱ OwFS 개요 OwFS 개요 Ⅲ OwFS 의특장점 OwFS 의특장점 Ⅳ 데이터의안전한보존문제데이터의안전한보존문제 2/27

Ⅰ 스토리지요구사항 3/27

네이버 / 한게임현황 구분 지표 수치 네이버 회원수 3,400만명 1일 Unique Visitors 1,700만명 1일 Page Views 10억 한게임 회원수 3,000만명 최고동시접속수 29만명 1일 Unique Visitors 300만명 * 2010 년 7 월현재 4/27

대규모파일서비스 많은서비스들이파일기반의서비스 메일, 카페, 블로그의첨부파일 포토, 동영상파일 N드라이브 ( 개인용무료 10GB 저장공간 ) 5/27

스토리지에대한요구사항 고가용성 서비스중단없는유지보수 확장성 ( 성능 / 용량 ) 높은처리량 TB 당구축비용 낮은운영비용 6/27

동향 1: 자체스토리지솔루션 Low cost server + SATA disk 에기반한자체솔루션 7/27

동향 2: 메타데이터와데이터저장분리 Master File s chunk map File metadata lookup Active Standby GFS client Chunk location Chunk I/O 파일 고정된 chunk 단위로쪼개져저장됨 Chunk servers 8/27

NHN 의해결책 자체분산파일시스템의솔루션확보 SATA 디스크의 low cost 기반서버채용 메타데이터와데이터저장을분리 OwFS (Owner-based File System) 파일 upload/download 환경에적합한파일시스템 파일접근패턴 : WORM (Write-Once-Read-Many) 파일의개수가수십억개이상으로늘어남 개개의파일의크기는작음 ( 수 KB ~ 수십 MB이대부분 ) 단일서비스의저장공간이수십 Petabyte 이상으로늘어남 9/27

ⅠⅡ OwFS 개요 10/27

설계시고려사항 개별파일의저장 파일은분할해서저장하지않고전체를저장 파일은 3 개의복제본가짐 HDD/ 서버고장에대응 파일쓰기부담은늘어나지만, 읽기부하는분산가능 파일시스템의메타데이터 ( 파일의복제본정보 ) 개별파일단위로복제본정보를저장하지말고모아서관리 서로관련된파일들을모아놓은것이 Owner Owner는분산과복제의기본단위 OwFS (Owner-based File System) 에서파일의경로 (Owner이름, Pathname) 11/27

Owner 란? 사진 _2008 년 사진 _2007 년 문서 _ 매뉴얼 사진 _2008 년 내문서 사진 2007 년 2008 년 2009 년 문서 다운로드 매뉴얼 PT 자료...... 문서 _PT 자료 사진 _2009 년 사진 _2008 년 문서 _ 매뉴얼 사진 _2007 년 문서 _ 다운로드 문서 _ 매뉴얼 사진 _2007 년 문서 _ 다운로드 사진 _2009 년 문서 _PT 자료 문서 _ 다운로드 X 문서 _ 다운로드 사진 _2009 년 문서 _PT 자료 12/27......

OwFS 의구조및동작 Owner map 캐쉬 Owner 조회 Owner 의복제본정보 메타데이터서버 (MDS) Owner map Owner이름 복제본 홍길동 1,2,3 이몽룡 3,4,5 성춘향 2,5,6 변학도 1,4,6 DS1 DS2 DS3 파일 I/O 응용서버 DS4 DS5 DS6 데이터서버 (DS) 13/27

OwFS API Owner 연산 Owner 생성 / 삭제 (undelete 도가능 )/ 이름변경 / 리스트조회 파일연산 파일생성 / 덮어쓰기 /append 파일의중간부분변경은지원하지않음 파일읽기 파일삭제 (undelete도가능 ) 파일이름변경 파일속성읽기 파일존재여부확인 디렉토리연산 디렉토리생성 / 삭제 / 이름변경 / 파일리스트조회 14/27

파일쓰기동작 응용서버 1 Owner 홍길동 의저장위치는? 3 3 개서버에파일 A 를각각저장 2 (DS1, DS2, DS3) A A A DS1 DS2 DS3 메타데이터서버 (MDS) DS4 DS5 DS6 데이터서버 (DS) 15/27

파일읽기동작 응용서버 1 Owner 홍길동 의저장위치는? 2 (DS1, DS2, DS3) 3 파일 A 의복제본중하나를읽음 A DS1 DS2 DS3 메타데이터서버 (MDS) DS4 DS5 DS6 데이터서버 (DS) 16/27

ⅠⅢ OwFS 의특장점 17/27

고장에대한대응 Internet 네트워크스위치이중화 Core switch Distribution switch Access switch 3 벌의복제본을 fault domain 별로분리하여배치 18/27

고장유형과데이터동기화 고장유형 일시적고장 영구적고장 변경연산 ( 파일생성또는삭제 ) 일시적고장에서회복 복제본상태는 복구중 X 홍길동 동기화 홍길동 홍길동 19/27

서비스중단없는유지보수 Internet Core switch Access switch 펌웨어업그레이드또는불량포트교체 Distribution switch Access switch 스위치증설작업도온라인에가능 20/27

확장성 용량확장성 저장공간을늘리려면데이터서버를추가로설치 데이터서버가추가되면서버당저장용량배분작업수행 관리자에의해설정된임계점에도달하면자동으로용량배분작업이기동됨 용량배분작업은데이터서버에추가 I/O 부담을주기때문에부하수준을제어할수있는방법제공 Owner 에대한이름공간은그대로유지됨 성능확장성 Owner 공간의분배가공평하다면, 각데이터서버는비슷한수준의파일연산처리 서버를증설하면전체파일연산수와처리량이선형적으로증가 21/27

비용절감 OwFS 는스토리지운영상의다양한장점을가지면서 TCO (Total Cost of Ownership) 절감도가능 Commodity 서버의내장 SATA 디스크채용 표준화된서버와네트워크스위치구성관리 기존네트워크스토리지에비해 TB 당 TCO 절감 22/27

ⅠⅣ 데이터의안전한보존문제 23/27

HDD 의고장률 HDD 의 Datasheet MTTF (Mean Time To Failure) = 1M ~ 1.5M hours AFR (Annual Failure Rate) < 0.88% 그러나, 실제환경에서는 4% 이상의 AFR 을나타낼수있음 HDD 의고용량화로인해 RAID-5 구성에서디스크고장발생시데이터 rebuilding 시간이길어짐 2TB 디스크로구성된 RAID-5 볼륨은 rebuilding 하는데 3-4 일이걸릴수있음 디스크고장발생시데이터손실의위험이커짐 인터넷서비스에서 long tail 데이터의보존시 RAID-5 protection 은신뢰하기힘들다. 저장비용이낮으면서신뢰성을높일방법필요 2 개이상 m 개의고장을감내할수있는방안필요 24/27

데이터의저장방법의예 : IDA D: 데이터 (n x 1 행렬 ) A: (n+m) x n 행렬 Vandermonde 행렬 D = D1 D2... Dn 임의의 n 개의행을선택하여도역행렬이존재 아래의계산을통해얻은 n+m 개의 fragment 를저장 D1 F1 D2 = F2 A D = A...... Dn F n+m n+m 개의 fragment 중임의의 n 개의 fragment 만있으면데이터 D 를복원가능 Michael O. Rabin, Efficient Dispersal of Information for Security, Load Balancing, and Fault Tolerance, Journal of ACM, 1989. 25/27

26/27 IDA 방법에서데이터복구 예 ) n = 4, m = 2, A 는 6 x 4 Vandermonde 행렬 A 는 A 행렬에서 2 번째, 4 번째행을제거한 4 x 4 행렬 = = 6 2 1 4 3 2 1 F... F F D D D D D A A 2, F 4 F 고장난경우의복구방법 = 6 5 3 1 F F F F A' D A = D 6 5 3 1 1 F F F F ') ( 데이터는 A 의역행렬을이용하여복원

저장비용효율 가용성을위한저장효율 = (n+m)/n RAID-5 의경우는 parity 가 1 이므로 (n+1)/n n 이크면효율이좋으나신뢰성문제 복제본의경우는 m = (k-1) x n, k 는복제본수 가용성은좋으나비용이많이든다. n 과 m 값을적절하게선택하여가용성과비용을조정 1 < (n+m)/n < 2 27/27

Q & A 28/27

Thank you! 29/27