<4D F736F F F696E74202D2037C0E52DC4B3BDC3BFCDB8DEB8F0B8AE>

Similar documents
2 / 26

Microsoft PowerPoint - o8.pptx

6.24-9년 6월

리뉴얼 xtremI 최종 softcopy

Microsoft PowerPoint - eSlim SV [080116]

Microsoft PowerPoint - eSlim SV [ ]

Microsoft PowerPoint - Master-ChiWeon_Yoon.ppt

solution map_....

본문01

Page 2 of 6 Here are the rules for conjugating Whether (or not) and If when using a Descriptive Verb. The only difference here from Action Verbs is wh

Page 2 of 5 아니다 means to not be, and is therefore the opposite of 이다. While English simply turns words like to be or to exist negative by adding not,

ARM01


Microsoft PowerPoint - 알고리즘_1주차_2차시.pptx

public key private key Encryption Algorithm Decryption Algorithm 1

PowerPoint 프레젠테이션

(72) 발명자 이동희 서울 동작구 여의대방로44길 10, 101동 802호 (대 방동, 대림아파트) 노삼혁 서울 중구 정동길 21-31, B동 404호 (정동, 정동상 림원) 이 발명을 지원한 국가연구개발사업 과제고유번호 부처명 교육과학기술부

하나님의 선한 손의 도우심 이세상에서 가장 큰 축복은 하나님이 나와 함께 하시는 것입니다. 그 이 유는 하나님이 모든 축복의 근원이시기 때문입니다. 에스라서에 보면 하나님의 선한 손의 도우심이 함께 했던 사람의 이야기 가 나와 있는데 에스라 7장은 거듭해서 그 비결을

<3130C0E5>

Microsoft Word - 산업분석리포트 doc

APOGEE Insight_KR_Base_3P11

Microsoft PowerPoint - 알고리즘_2주차_1차시.pptx

Integ


<4D F736F F F696E74202D20BCD2C7C1C6AEBFFEBEEEC6AFB7D03038B3E22E BC8A3C8AF20B8F0B5E55D>

CONTENTS CONTENTS CONTENT 1. SSD & HDD 비교 2. SSD 서버 & HDD 서버 비교 3. LSD SSD 서버 & HDD 서버 비교 4. LSD SSD 서버 & 글로벌 SSD 서버 비교 2

슬라이드 제목 없음

<C1DF3320BCF6BEF7B0E8C8B9BCAD2E687770>

<B3EDB9AEC1FD5F3235C1FD2E687770>

초보자를 위한 분산 캐시 활용 전략

<BBEABEF7B5BFC7E22DA5B12E687770>

강의10

Chap06(Interprocess Communication).PDF

Á¶´öÈñ_0304_final.hwp


- 2 -

한국성인에서초기황반변성질환과 연관된위험요인연구

untitled

휠세미나3 ver0.4

결과보고서

[ReadyToCameral]RUF¹öÆÛ(CSTA02-29).hwp

09김정식.PDF

歯sql_tuning2

hwp

<C0CCBCBCBFB52DC1A4B4EBBFF82DBCAEBBE7B3EDB9AE2D D382E687770>

5/12¼Ò½ÄÁö

산업입지내지6차

untitled

Contents I. 칼라스 네트워크 플레이어란 1. Pc-Fi를 넘어서 발전한 차세대 음악 플레이어 칼라스 네트워크 플레이어의 장점 3. 시스템 기본 구성

Vol.257 C O N T E N T S M O N T H L Y P U B L I C F I N A N C E F O R U M

DBPIA-NURIMEDIA

_KF_Bulletin webcopy

2011´ëÇпø2µµ 24p_0628

GNU/Linux 1, GNU/Linux MS-DOS LOADLIN DOS-MBR LILO DOS-MBR LILO... 6

untitled

알람음을 출력하는 이동통신 단말기에 있어서, 실시간 알람음을 출력하는 음향 출력 수단; 디지털 멀티미디어 방송(DMB: Digital Multimedia Broadcasting, 이하 'DMB'라 칭함) 신호를 수신하면 오디오 형태로 변 환하여 DMB의 음향을 전달하는

PowerPoint 프레젠테이션

#Ȳ¿ë¼®

thesis-shk

untitled

Microsoft PowerPoint - 30.ppt [호환 모드]

, ( ) 1) *.. I. (batch). (production planning). (downstream stage) (stockout).... (endangered). (utilization). *

CD-RW_Advanced.PDF

MS-SQL SERVER 대비 기능

(SW3704) Gingerbread Source Build & Working Guide

06_ÀÌÀçÈÆ¿Ü0926


,.,..,....,, Abstract The importance of integrated design which tries to i

9

Oracle Database 10g: Self-Managing Database DB TSC

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할


step 1-1

Microsoft PowerPoint Q AMD DT channel training Nov.ppt

untitled

FMX M JPG 15MB 320x240 30fps, 160Kbps 11MB View operation,, seek seek Random Access Average Read Sequential Read 12 FMX () 2

PowerPoint Presentation

yes시안1007_최종_2_30

에너지경제연구 제13권 제1호

삼성955_965_09


Microsoft PowerPoint - ch03ysk2012.ppt [호환 모드]

1. GigE Camera Interface를 위한 최소 PC 사양 CPU : Intel Core 2 Duo, 2.4GHz이상 RAM : 2GB 이상 LANcard : Intel PRO/1000xT 이상 VGA : PCI x 16, VRAM DDR2 RAM 256MB

¹Ìµå¹Ì3Â÷Àμâ

4.18.국가직 9급_전산직_컴퓨터일반_손경희_ver.1.hwp

K7VT2_QIG_v3

untitled

Microsoft Word - IO_2009_메모리반도체.doc

300 구보학보 12집. 1),,.,,, TV,,.,,,,,,..,...,....,... (recall). 2) 1) 양웅, 김충현, 김태원, 광고표현 수사법에 따른 이해와 선호 효과: 브랜드 인지도와 의미고정의 영향을 중심으로, 광고학연구 18권 2호, 2007 여름

OP_Journalism

Journal of Educational Innovation Research 2019, Vol. 29, No. 1, pp DOI: (LiD) - - * Way to

Microsoft Word _반도체-최종

gisa_pil_070304_pdf.hwp

컴퓨터조직 ITEC201 컴퓨터학개론 경북대학교 IT 대학컴퓨터학부 2014 년봄학기 2014 N Baek 1

KM-380BL,BLB(100908)

pseries, Systems Group pseries 2003 Corporation (p) Systems Group POWER4/POWER4+ pseries! +! + + The Only Complete UNIX on Demand

(72) 발명자 서진교 경기 용인시 수지구 풍덕천2동 1167 진산마을 삼성5차아파트526동 1004호 조필제 경기 용인시 풍덕천동 유스빌 401호 - 2 -

歯MW-1000AP_Manual_Kor_HJS.PDF

... 수시연구 국가물류비산정및추이분석 Korean Macroeconomic Logistics Costs in 권혁구ㆍ서상범...

Transcription:

7장 : 캐시와메모리

메모리계층 사용자들은값싸고빠른메모리를크면클수록갖고싶어한다! - 나에게하드디스크 (300GB) 만큼의, 속도는 RAM 정도이고비휘발성메모리가있다면.. 그런데돈이없다. 2006년현재 RAM은 52 MB/5 만원 ( GB/0 만원 ) HD는 300GB/0 만원 (GB/330원) 캐시가격을정확히산정하기는어려우나 52KB/2 만원 (GB/4000 만원 ) 이된다. 캐시는 DRAM에비해몇십배빠르고, DRAM의액세스속도는몇십 ns 이며 HDD 보다수백배빠르다. 이러니, 캐시는 HDD 보다수천배이상빠르다. 컴퓨터메모리시스템설계의핵심은어떻게이다양한성능, 가격비를갖는메모리를조합해서, 가장적은돈을써서용량은 HDD 같이많게하고, 성능은캐시같이빠르게할수있는가이다. 2

메모리계층 CPU Level 가격 성능 Levels in the memory hierarchy Level 2 Level n 크기 3

Locality ( 지역성 ) : 메모리 메모리액세스는지역성을갖는다 메모리계층구조를설계할때메모리액세스가갖는 Locality 특성을이용 어떤데이터나인스트럭션을액세스하였다면시간적 locality: 곧다시그데이터를다시액세스할경우가많다공간적 locality: 부근에있는데이터나명령문을액세스할경우가많다 그런데, 프로그램이 Locality를갖는이유는무엇일까? Our initial focus: two levels (upper, lower) block: minimum unit of data hit: data requested is in the upper level miss: data requested is not in the upper level 4

캐시 : 데이터나 데이터나인스트럭션모두담을수있다. Two issues: 우리가원하는아이템 ( 데이터, 인스트럭션 ) 이캐시에있는지? 캐시에있으면어디에있는지? Our first example: block size is one word of data "direct mapped" For each item of data at the lower level, there is exactly one location in the cache where it might be. e.g., lots of items at the lower level share locations in the upper level 5

Direct Mapped Cache Mapping: address is modulo the number of blocks in the cache Cache 000 00 00 0 00 0 0 0000 000 000 00 000 00 00 0 Memory 6

Direct Mapped Cache For MIPS: 3 30 3 2 2 0 Byte offset Hit Tag 20 0 Data Index Index V alid Tag Data 0 2 02 022 023 20 32 What kind of locality are we taking advantage of? 7

Direct Mapped Cache Taking advantage of spatial locality: Address (showing bit positions) 3 6 5 4 32 0 Hit Tag 6 2 2 Byte offset Index Block offset Data 6 bits 28 bits V Tag Data 4K entries 6 32 32 32 32 Mux 32 8

찾는아이템이캐시에있는지, 없는지 : Hits vs. Misses Read hits this is what we want! Read misses stall the CPU, fetch block from memory, deliver to cache, restart Write hits: can replace data in cache and memory (write-through) write the data only into the cache (write-back the cache later) Write misses: read the entire block into the cache, then write the word 캐시미스가나면? - Read Miss : 일단중지하고, 아이템이있는블록을메모리에서캐시로가져오면서읽음. - Write Miss : 일단중지하고, 아이템이있는블록을메모리에서캐시로가져온다음해당아이템을캐시에쓴다 ( 갱신한다 ). 9

Hardware Issues Make reading multiple words easier by using banks of memory CPU CPU CPU Cache Multiplexor Cache Cache Bus Bus Bus Memory Memory bank 0 Memory bank Memory bank 2 Memory bank 3 Memory b. Wide memory organization c. Interleaved memory organization a. One-word-wide memory organization It can get a lot more complicated... 0

Performance Increasing the block size tends to decrease miss rate: 40% 35% 30% Miss rate 25% 20% 5% 0% 5% 0% 4 Use split caches because there is more spatial locality in code: 6 Block size (bytes) Program Block size in words Instruction miss rate Data miss rate Effective combined miss rate gcc 6.% 2.% 5.4% 4 2.0%.7%.9% spice.2%.3%.2% 4 0.3% 0.6% 0.4% 64 KB 8 KB 6 KB 64 KB 256 KB 256

캐시성능 Simplified model: execution time = (execution cycles + stall cycles) cycle time stall cycles = # of instructions miss ratio miss penalty 성능을향상하려면 : miss 율을줄여야하며 miss 했을시부담 (miss penalty) 을줄여야한다. What happens if we increase block size? 2

캐시를또다시몇단계로나누어캐시미스시부담을줄인다. Add a second level cache: often primary cache is on the same chip as the processor use SRAMs to add another cache above primary memory (DRAM) miss penalty goes down if data is in 2nd level cache Example: CPI of.0 on a 5 Ghz machine with a 5% miss rate, 00ns DRAM access Adding 2nd level cache with 5ns access time decreases miss rate to.5% Using multilevel caches: try and optimize the hit time on the st level cache try and optimize the miss rate on the 2nd level cache 요즈음 CPU는그내부에멀티레벨캐시를갖고있다. - 인텔프레스캇 : L 캐시 (6KB), L2 캐시 (2MB) - AMD AMD64 뉴캐슬 : L 캐시 (28KB), L2 캐시 (52MB) * 어떤것이더좋을까? 3

Virtual Memory ( 가상메모리 ) : 운용체제에서 운용체제에서중요 하드디스크와메모리사이에서어떻게하면하드디스크를메모리와같이사용할수있을까하는데에서나왔음. 즉캐시 -RAM 관계를 RAM-HDD에적용 Virtual addresses Address translation Physical addresses Disk addresses Advantages: illusion of having more physical memory program relocation protection 4

Pages: virtual memory blocks Page faults: the data is not in memory, retrieve it from disk huge miss penalty, thus pages should be fairly large (e.g., 4KB) reducing page faults is important (LRU is worth the price) can handle the faults in software instead of hardware using write-through is too expensive so we use writeback Virtual address 3 30 29 28 27 5 4 3 2 0 9 8 3 2 0 Virtual page number Page offset Translation 29 28 27 5 4 3 2 0 9 8 3 2 0 Physical page number Page offset Physical address 5

Page Tables Virtual page number Valid Page table Physical page or disk address Physical memory 0 0 0 Disk storage 6

Modern Systems Things are getting complicated! 7

앞으로는어떻게될것같은가? CPU 속도가계속빨라져메모리특히 HDD와격차커짐 00,000 0,000 Performance,000 CPU 00 0 Memory 그래서더욱벌어지는격차를갖는기술을어떻게조합하여최적의메모리구조를설계할것인가? 트랜드 : redesign DRAM chips to provide higher bandwidth or processing (DDR, DDR2, RAMBUS) restructure code to increase locality : 항상해왔던것 use prefetching (make cache visible to ISA) HDD 시대가마감되고 FLASH 메모리시대로? Year 값싸고성능좋은비휘발성의 Solid State 메모리가널리사용될것같음. 8