External Sorting

Similar documents
6.24-9년 6월

(72) 발명자 이동희 서울 동작구 여의대방로44길 10, 101동 802호 (대 방동, 대림아파트) 노삼혁 서울 중구 정동길 21-31, B동 404호 (정동, 정동상 림원) 이 발명을 지원한 국가연구개발사업 과제고유번호 부처명 교육과학기술부

Oracle9i Real Application Clusters

PowerPoint 프레젠테이션

리뉴얼 xtremI 최종 softcopy

결과보고서

Output file

°í¼®ÁÖ Ãâ·Â

<4D F736F F F696E74202D20BCD2C7C1C6AEBFFEBEEEC6AFB7D03038B3E22E BC8A3C8AF20B8F0B5E55D>

김기남_ATDC2016_160620_[키노트].key

DBPIA-NURIMEDIA

Oracle Database 10g: Self-Managing Database DB TSC

solution map_....

MS-SQL SERVER 대비 기능

목 차

PowerPoint Presentation

Page 2 of 6 Here are the rules for conjugating Whether (or not) and If when using a Descriptive Verb. The only difference here from Action Verbs is wh

PCServerMgmt7

FMX M JPG 15MB 320x240 30fps, 160Kbps 11MB View operation,, seek seek Random Access Average Read Sequential Read 12 FMX () 2

ecorp-프로젝트제안서작성실무(양식3)

Jerry Held

Simplify your Job Automatic Storage Management DB TSC

CONTENTS CONTENTS CONTENT 1. SSD & HDD 비교 2. SSD 서버 & HDD 서버 비교 3. LSD SSD 서버 & HDD 서버 비교 4. LSD SSD 서버 & 글로벌 SSD 서버 비교 2

목차 1. 제품 소개 특징 개요 Function table 기능 소개 Copy Compare Copy & Compare Erase

DBPIA-NURIMEDIA

#Ȳ¿ë¼®

Á¶´öÈñ_0304_final.hwp

2011´ëÇпø2µµ 24p_0628

<49534F C0CEC1F520BBE7C8C4BDC9BBE720C4C1BCB3C6C320B9D D20BDC3BDBAC5DB20B0EDB5B5C8AD20C1A6BEC8BFE4C3BBBCAD2E687770>

<31342D3034C0E5C7FDBFB52E687770>

step 1-1

Page 2 of 5 아니다 means to not be, and is therefore the opposite of 이다. While English simply turns words like to be or to exist negative by adding not,

04-다시_고속철도61~80p

Chap06(Interprocess Communication).PDF

PowerPoint 프레젠테이션

untitled

1. 서론 1-1 연구 배경과 목적 1-2 연구 방법과 범위 2. 클라우드 게임 서비스 2-1 클라우드 게임 서비스의 정의 2-2 클라우드 게임 서비스의 특징 2-3 클라우드 게임 서비스의 시장 현황 2-4 클라우드 게임 서비스 사례 연구 2-5 클라우드 게임 서비스에

11¹Ú´ö±Ô

비식별화 기술 활용 안내서-최종수정.indd

0125_ 워크샵 발표자료_완성.key

Microsoft PowerPoint - 알고리즘_2주차_1차시.pptx

I&IRC5 TG_08권

1217 WebTrafMon II

Voice Portal using Oracle 9i AS Wireless

hwp

62

Microsoft PowerPoint - eSlim SV [ ]

The Self-Managing Database : Automatic Health Monitoring and Alerting

Dell EMC Korea Partner Summit 2017

<4D F736F F F696E74202D2037C0E52DC4B3BDC3BFCDB8DEB8F0B8AE>

<B9AEC8ADC4DCC5D9C3F7BFACB1B82D35C8A32833B1B3292E687770>

05Àå

Polly_with_Serverless_HOL_hyouk

<C7C1B7A3C2F7C0CCC1EE20B4BABAF1C1EEB4CFBDBA20B7B1C4AA20BBE7B7CA5FBCADB9CEB1B35F28C3D6C1BE292E687770>

SSD의 기본 이해하기 Jon L. Jacobi PCWorld HDD와 SSD 내부 구조 데스크톱 PC나 노트북 컴퓨터의 성능을 가장 쉽게 효율적으로 향상시킬 수 있는 방법 중 하나는 SSD를 설치하는 것이다. 부팅, 윈도우 및 메뉴 실행 속도, 프로그램 및 데이터 로

, ( ) 1) *.. I. (batch). (production planning). (downstream stage) (stockout).... (endangered). (utilization). *

<30362E20C6EDC1FD2DB0EDBFB5B4EBB4D420BCF6C1A42E687770>

hwp

[ReadyToCameral]RUF¹öÆÛ(CSTA02-29).hwp

Microsoft PowerPoint - ch03ysk2012.ppt [호환 모드]

PowerPoint


istay

Microsoft Word - 산업분석리포트 doc

Microsoft PowerPoint - eSlim SV [080116]

¹Ìµå¹Ì3Â÷Àμâ

11이정민

Microsoft PowerPoint - Flash Memory Based Bottom Up Analysis for Smart Phone System _Final [호환 모드]

OP_Journalism

±èÇö¿í Ãâ·Â


Storage advances and Ne over fabric

untitled

레이아웃 1

본문01

휠세미나3 ver0.4

F1-1(수정).ppt

Deok9_Exploit Technique

歯1.PDF

Microsoft PowerPoint - 알고리즘_5주차_1차시.pptx

Model Investor MANDO Portal Site People Customer BIS Supplier C R M PLM ERP MES HRIS S C M KMS Web -Based

하나님의 선한 손의 도우심 이세상에서 가장 큰 축복은 하나님이 나와 함께 하시는 것입니다. 그 이 유는 하나님이 모든 축복의 근원이시기 때문입니다. 에스라서에 보면 하나님의 선한 손의 도우심이 함께 했던 사람의 이야기 가 나와 있는데 에스라 7장은 거듭해서 그 비결을

CD-RW_Advanced.PDF

야쿠르트2010 9월재출

untitled

2 佛敎學報 第 48 輯 서도 이 목적을 준수하였다. 즉 석문의범 에는 승가의 일상의례 보다는 각종의 재 의식에 역점을 두었다. 재의식은 승가와 재가가 함께 호흡하는 공동의 場이므로 포 교와 대중화에 무엇보다 중요한 역할을 수행할 수 있다는 믿음을 지니고 있었다. 둘째

03.Agile.key

목차 제 1 장 inexio Touch Driver소개 소개 및 주요 기능 제품사양... 4 제 2 장 설치 및 실행 설치 시 주의사항 설치 권고 사양 프로그램 설치 하드웨

에너지경제연구 제13권 제1호

* ~2..

bn2019_2

<목 차 > 제 1장 일반사항 4 I.사업의 개요 4 1.사업명 4 2.사업의 목적 4 3.입찰 방식 4 4.입찰 참가 자격 4 5.사업 및 계약 기간 5 6.추진 일정 6 7.사업 범위 및 내용 6 II.사업시행 주요 요건 8 1.사업시행 조건 8 2.계약보증 9 3

ÀÌÁÖÈñ.hwp

DBPIA-NURIMEDIA

Intra_DW_Ch4.PDF

vm-웨어-01장

2009년 국제법평론회 동계학술대회 일정

Microsoft Word _반도체-최종

14 경영관리연구 제6권 제1호 ( ) Ⅰ. 서론 2013년 1월 11일 미국의 유명한 경영전문 월간지 패스트 컴퍼니 가 2013년 글로벌 혁신 기업 50 을 발표했다. 가장 눈에 띄는 것은 2년 연속 혁신기업 1위를 차지했던 애플의 추락 이었다. 음성 인식

Transcription:

Recent Issues in Flash-based DBMSs Apr. 20, 2010 Sang-Won Lee http://icc.skku.ac.kr/~swlee 1

Table of Contents Flash Database Architecture FASTer FTL for OLTP workloads Flash as Extended Buffer Cache A Case for FlashSSD in Database Recovery 2

One FlashSSD beats Ten 15K rpm HDDs But 3

Flash Database Architectures 4

Page-Differential Logging Page-Differential Logging: An Efficient and DBMS- Independent Approach for Storing Data into Flash Memory, SIGMOD 2010 The difference b/w old and new version of a page is very small Sandforce-like approach? Assume page-mapping FTL? Differential = <physical page ID, creation time stamp, [offset, length,changed data ]+>. At-most one differential per page Physical changes vs. logical changes 5

IPL Basics, Beauty and Limitations Transactional extensions: submitted for publication Multi-version concurrency control (SI) and recovery IPL: larger flash page, less efficient 6

SCM Source: FAST 2009 tutorial by Dr. Winfried W. Wilcke 7

IPL + SCM: Opportunities Source: A Hybrid Solid-State Storage Architecture for the Performance, Energy Consumption, and Lifetime Improvement, HPCA 2010 8

Better Performance, Energy, Lifetime 9

Why SandForce, IPL, PDL works? In TPC-C, the average size of differentials is around 200B. 200B/4K = 5% Write amplication, performance, wearleveling 10

SCM Opportunities in DB Implications of Storage Class Memories (SCM) on Software Architectures, HPCA 2010 West Workshop, C. Mohan @ IBM Almaden PCM as disk, paging device, memory, extended memory SCM as log device Should log records be written directly to PCM Or, first to DRAM log buffers and then be forced to PCM (rather than disk) PCM replaces DRAM? Whole DB fits in PCM? No logging?.. SafeRAM @ VLDB 1988 11

SCM as Log Device SQL Buffer Log Buffer pi DB LOG 12

Future SW Architecture for NVRAM?? Need to learn from database?? E.g. applications, file system, or OS should be able to capture the (logical or physical) differentials (or delta) and then write only the differentials, not the new version itself. File as byte-stream vs. record-oriented page layout Can we model the changes in PPT or work or save only the changes? What about multi-versioning? rollback? It is time to rethink the paradigm of overwrite or single version 13

FASTer FTL for OLTP Workloads SNAPI 2010 Joint Work with Lim and Moon 14

Motivation FAST Originally designed for random writes With small log space, just high log block utilization and reduced log block thrashing Large scale SSD For better performance, it can employ larger log space FAST criticized in DFTL With 3%, performance and fluctuation Revisit FAST with OLTP workloads High Resp. Time Variation 15

Skewed Write Patterns in OLTP Write pattern of PC and embedded applications Small-scale range Spatial(i.e, sequential write)/temporal(e.g, meta-data) locality How about OLTP applications? Large-scale small random writes (few sequential writes) Write skew : temporal locality Data Set: 8GB TPC-C Mixed Workload 16

Skewed Write Patterns in OLTP Temporal locality in OLTP: write arrival interval per a page Hot / cold page 5% 17

FAST and Temporal Locality DFTL [Aayush Gupta, ASPLOS 09] FAST dose not provide any special mechanism to handle temporal locality in random streams. With 3% over-provisioning, FAST shows poor performance and high variation Serious Fluctuation 18

FAST and Temporal Locality Log window data invalidation performance & fluctuation of response time Flash Memory Original Data Blocks Log Blocks = Log window <Temporal locality of OLTP Write patterns in FAST> <Merge Cost Estimation in FAST> 19

FASTer FTL for OLTP Workloads FASTer FTL Second chance policy Isolation area No complex processing and meta info. Management overhead Performance improvement 20~40% than FAST Even wins Greedy in some(?) cases (pure-page mapping) More uniform response time 20

Second Chance Policy Give another chance to page in victim block, instead of immediate merge Just copy-back 21

Second Chance Policy(2) Pros: If a warm page is invalidated by the second chance, we can avoid costly merges. Cons: If the copied page is cold page, we wasted copy time and a precious write buffer resource (reduced effective log block utilization) Pros >> Cons Log Blocks = Log window 22

Second Chance Policy(3) Double the effective size of log window FASTer can skip numerous merges with doubled log window Exploit the temporal locality further (1) FAST Log Window (1) FAST Log Window (2) Doubled Log Window 23

Second Chance Policy Fluctuation goes down 24

Isolation Area Isolation area Write buffering for cold dirty pages Merge progressively in the background More uniform response time than FAST cold cold cold cold 25

Performance Evaluation FASTer w/ 10% > FAST w/ 20% log space W/ same log space, FASTer ~~ Greedy With less address mapping information and SRAM 26

Performance Evaluation(2) FASTer also mitigate the average response time and variations with less provisioning More uniform 27

Performance Evaluation(3) More skewed, better performance 28

Flash(SSD) as Extended Buffer Cache On-going work 29

Flash: Extended Disk vs. Extended Buffer Source: The Five-Minute Rule 20 Years Later, CACM 2009, Graefe Flash as extended disk approach: Flashing up the storage layer, VLDB 2009 30

Flash as Extended Buffer Cache LRU and 2Q Intel MLC SSD(80G, 250$): 30000 random reads, 3000 random 31

Flash as Extended Buffer Cache(2) Benefits: Preliminary results 32

A Case for Flash SSD in Database Recovery On-going work 33

Database Recovery Buffer Cache Data File Redo Log 4 steps Log scan: seq. scan + CPU Read into buffers to be redo/undo: random IOs Log apply: seq. scan + CPU Write the updated pages to disk: random Ios Then vs. now 34

Recovery Performance Single 15K HDD, 8 HDDs vs. SLC SSD 35

Bill Gates 36

Bill Gates TED SPEECH 2010 P: People S: Services / person E: Energy / service C: CO2 / unit energy P 는사람수다. 빈곤퇴치에성공할수록이숫자는늘어날것이다. 제 3 세계의보건건강문제가해결될것이고, 어린이들이질병으로죽어가는일이줄고성인이사소한질병으로목숨을잃는일이줄어들것이기때문이다. S 는한사람이제공받는의식주, 의료, 교육등의서비스총량이다. 빈곤퇴치에성공할수록 S 역시늘어날것이다. E 는서비스 1 단위생산에드는에너지다. 여기서부터는좋은소식이있다. 기술발전으로에너지를덜사용하면서도같은삶의질을유지하는방법이늘어나고있다. 석유를덜쓰는하이브리드자동차가대표적예다. 정작빌게이츠가하고싶었던말은 C 였다. 보다시피빈곤을퇴치할수록탄소배출은늘어날수밖에없다. E 에서조금절감해볼수있지만, 제한적이다. 근본적인해법은에너지생산과정에서탄소가배출되지않게만드는것일수밖에없다는것이빌게이츠의이야기다. 위의공식에서명백하게드러난다는것이다. 빌게이츠는 테라파워 라는새로운아이디어하나를제시한다. 폐우라늄을활용한원자력발전이다. 탄소배출이적으면서도싸게공급될수있는혁신적기술이다. 그러나이는하나의아이디어일뿐이라고스스로말한다. 다만그는, 인류의양대문제인빈곤과기후변화를동시에이겨내려면, 에너지생산에배출되는탄소를줄일수있는혁신이반드시필요하다고강조한다. 테라파워와비슷한아이디어가계속나와야한다는것이다. ( 출처 : Bill @ TED, www.ted.org, http://goodeconomy.hani.co.kr/blog/archives/788) 37

Storage Metrics in OLTP In OLTP databases 2009, 1 flash SSD >> 10 15K rpm HDDs 2010, 1 flash SSD >> 20 15K rpm HDDs Storage Metrics = f(performance(iops) X Cost X Energy x Endurance X People X????? ) 38