목차... 1 개요... Error! Bookmark not defined. 주요모바일사용사례용으로최적화... Error! Bookmark not defined. 실리콘프로세스와전력및주파수에미치는영향... Error! Bookmark not defined. 가변대칭형다

Similar documents
목차... 1 멀티코어 CPU 의 간략한 역사... Error! Bookmark not defined. 낮은 전력 소비, 와트당 높은 성능... Error! Bookmark not defined. 한층 빨라진 웹 페이지 로딩 타임.. Error! Bookmark not

API 매뉴얼

Copyrights and Trademarks Autodesk SketchBook Mobile (2.0.2) 2013 Autodesk, Inc. All Rights Reserved. Except as otherwise permitted by Autodesk, Inc.,

Product A4

API 매뉴얼

미디어 및 엔터테인먼트 업계를 위한 Adobe Experience Manager Mobile

Microsoft Word - 21_반도체.doc

마리오와 소닉 리우 올림픽™

H122_E.book

토익S-채용사례리플렛0404

DR-M140 사용 설명서

2월1일자.hwp

: Symantec Backup Exec System Recovery 8:

Microsoft PowerPoint - CHAP_03 - 복쇬본.pptx

Æí¶÷4-¼Ö·ç¼Çc03ÖÁ¾š

PowerChute Personal Edition v3.1.0 에이전트 사용 설명서

라우터

커버컨텐츠

슬라이드 1

B _02-M_Korean.indd

내용물 시작 3 구성품 4 MDA200 기본 사항 5 액세서리 6 헤드셋 연결 7 탁상 전화기: 연결 및 통화 8 탁상 전화기(표준) 8 탁상 전화기+ HL10 거치대와 전원 공급 장치(별도 구매) 10 탁상 전화기+ EHS 케이블 12 컴퓨터: 연결 및 통화 13 컴

Microsoft PowerPoint - Ch13

Ⅱ. Embedded GPU 모바일 프로세서의 발전방향은 저전력 고성능 컴퓨팅이다. 이 러한 목표를 달성하기 위해서 모바일 프로세서 기술은 멀티코 어 형태로 발전해 가고 있다. 예를 들어 NVIDIA의 최신 응용프 로세서인 Tegra3의 경우 쿼드코어 ARM Corte


PowerPoint 프레젠테이션

한아IT 브로셔-팜플렛최종

Hardware Manual TSP100

다음 사항을 꼭 확인하세요! 도움말 안내 - 본 도움말에는 iodd2511 조작방법 및 활용법이 적혀 있습니다. - 본 제품 사용 전에 안전을 위한 주의사항 을 반드시 숙지하십시오. - 문제가 발생하면 문제해결 을 참조하십시오. 중요한 Data 는 항상 백업 하십시오.

USB-EK001 매뉴얼

피해자식별PDF용 0502

PI ZH-CN

<464B4949B8AEC6F7C6AE2DC0AFBAF1C4F5C5CDBDBABBEABEF7C8AD28C3D6C1BE5FBCD5BFACB1B8BFF8BCF6C1A4292E687770>

PowerPoint Presentation

<BDBAB8B6C6AEC6F95FBDC3C0E55FC8AEB4EB5FC0CCC1D6BFCF5F E687770>

#KLZ-371(PB)

비디오 / 그래픽 아답터 네트워크 만약에 ArcGolbe를 사용하는 경우, 추가적인 디스크 공간 필요. ArcGlobe는 캐시파일을 생성하여 사용 24 비트 그래픽 가속기 Oepn GL 2.0 이상을 지원하는 비디오카드 최소 64 MB 이고 256 MB 이상을 메모리

커버콘텐츠


- 2 -

ePapyrus PDF Document

3월2일자.hwp

4장 논리 게이트

Camel_C

ITMagazine 월.indd

<4D F736F F D20B0B6B3EBC6AE33C3E2BDC3C8C45FC3D6C1BE5F2D2E646F63>

슬라이드 1

2 라이선스 라이선스 돌비 래버러토리스의 허가를 얻어 제조한 제품입니다. 돌비 및 더블 D 심볼은 래버러토리스의 상표입니다. DivX 비디오에 관하여 DivX 는 Rovi Corporation 의 자회사 DivX, LLC가 개발한 디지털 비디오 포맷입니다. 본 제품은

AD K

ePapyrus PDF Document

인디쓔피-IOM핸돜벁닄큐1014pdf, page Preflight ( IOM핸돜벁닄큐__1014 )

실험 5

DVI-CL01 매뉴얼

P2WW HNZ0

Microsoft Word - Lab.7

고밀도스토리지 시스템상태복원 고급진단기능 고성능마더보드 확장성능 주요기능 Cisco Physical Security Multiservices Platform의주요기능은다음과같습니다. 이중프로세서 / 듀얼코어 Xeon 프로세서지원 리던던시옵션을통해 900W 고효율전력공급

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Sep.; 30(9),

Microsoft Word - DELL_PowerEdge_TM_ R710 서버 성능분석보고서.doc

Microsoft PowerPoint - 권장 사양

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Mar.; 28(3),

CyberLink YouCam

28 저전력복합스위칭기반의 0.16mm 2 12b 30MS/s 0.18um CMOS SAR ADC 신희욱외 Ⅰ. 서론 Ⅱ. 제안하는 SAR ADC 구조및회로설계 1. 제안하는 SAR ADC의전체구조

11¹Ú´ö±Ô

<B1D7B7A1C7C8C4ABB5E5BBE7BEE72E786C7378>

<C7D1B1B9C1A4BAB8BBEABEF7BFACC7D5C8B82D535720C7C3B7A7C6FB20C7D8B9FD20536F4320C0B6C7D5C0B8B7CE2DB3BBC1F62E687770>

Microsoft Word - 산업분석리포트 doc



PowerPoint 프레젠테이션

이도경, 최덕재 Dokyeong Lee, Deokjai Choi 1. 서론

목차 006/ 008/ 009/ 011/ 012/ 013/ 014/ Part 1_ 컴퓨터가 제대로 작동하지 않을 때 문제00_ 윈도우7 복구(초기화) 방법 안내 문제01_ 컴퓨터의 전원 버튼을 눌러도 아무 반응이 없어요. 문제02_ 전원을 누르면 팬(쿨러)이 돌아가는

No

정진관( ), 메모리반도체 Overweight 전방업체의 적극적 설비투자 수혜는 예전과 다르다 지난 5월에는 삼성전자의 올해 26조원 투자계획으로 수혜가 기대되는 관련기업의 주가가 떠들석하였다. 반도체 11조, LCD

Microsoft PowerPoint - 30.ppt [호환 모드]

[발표자료]기업용모바일 활성화를 위한 제언(박종봉)

vm-웨어-앞부속

Microsoft PowerPoint - ch07.ppt

< C6AFC1FD28B1C7C7F5C1DF292E687770>

목 차 요약문 I Ⅰ. 연구개요 1 Ⅱ. 특허검색 DB 및시스템조사 5


멀티미디어 콘텐츠 접속을 위한 사용자인증 시스템_교열(박세환, ).hwp

<4D F736F F D20C5EBC7D5C7D8BCAEBDC3BDBAC5DB5F D2BC0C720424D54B0E1B0FABAB8B0EDBCAD2E646F63>

Microsoft Word - 정병권

wtu05_ÃÖÁ¾

Visual Studio online Limited preview 간략하게살펴보기

Microsoft Word - 문서2

catalogue

ISP and CodeVisionAVR C Compiler.hwp

1_12-53(김동희)_.hwp

2016

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Oct.; 27(10),

Basic CMYK

#KM-340BL

고객 카드

서현수

Microsoft Word - 최신IT동향.doc

데이터베이스-4부0816

2002 Game White paper 2002 Game White paper

Nikon KeyMission 360. KeyMission 360 ( 1.5) SnapBridge 360/170 ( 1.1). SnapBridge 360/170., SnapBridge 360/170 OS.. KeyMission 360/ SnapBridge 360/170

이 드리는 혜택 완벽 을 위한 발환경 : Team Foundation Server 200 & CAL 제공 최저의 비용으로 구현을 위해 Visual Studio Team Foundation Server 200 서버 라이센스와 CAL이 에 포함되어 있습니다 을 모든 팀원이

2 목차 3 안전을 위한 주의 사항 3 제품 설치 시 주의사항 4 전원 및 AC 어댑터 관련 주의사항 6 제품 이동 시 주의사항 6 제품 사용 시 주의사항 7 화면 잔상 시 주의사항 7 제품 청소 시 주의사항 9 라이선스 18 사용자 설정 18 메인 메뉴 활성 19 사

Transcription:

Whitepaper 가변 SMP - 저전력, 고성능용멀티코어 CPU 아키텍처 1

목차... 1 개요... Error! Bookmark not defined. 주요모바일사용사례용으로최적화... Error! Bookmark not defined. 실리콘프로세스와전력및주파수에미치는영향... Error! Bookmark not defined. 가변대칭형다중처리 (Variable Symmetric Multiprocessing)... 6 저전력컴패니언코어... Error! Bookmark not defined. 투명운영체계 (OS Transparent) 구축... Error! Bookmark not defined. 작업량기반의 CPU 코어의동적활성화와비활성화... Error! Bookmark not defined. vsmp 아키텍처의구조적장점... Error! Bookmark not defined. 구조적도전과제와솔루션... Error! Bookmark not defined. vsmp 의전력혜택... Error! Bookmark not defined. 듀얼코어대비쿼드쿼어의전력혜택... Error! Bookmark not defined. 결론... Error! Bookmark not defined. 문서변경내력... 16 2

개요 엔비디아는 2011 년 2 월새로운모바일애플리케이션, 새로운경험, 한층강력해진멀티테스팅, 고품질게이밍과더욱빨라진웹브라우징등을가능하게해줄세계최초의쿼드코어모바일프로세서인프로젝트칼엘 (Project Kal-El) 모바일프로세서를소개하고데모를시연하였다. 프로젝트칼엘은 CPU 코어를낮은주파수에서동작하여배터리수명을연장시키는한편듀얼코어또는싱글코어프로세서에비해더많은작업을수행할수있다. 다른업계리더들역시쿼드코어가올바른방향이라는데동의하고있으며, 이에따라자체적인모바일쿼드코어프로세서제품군을발표하고있다. 많은사용사례에서 CPU 코어수의증가는성능향상과전력감소로이어지며, 그외추가기술은이러한역량을한층더진전시킬수있을것이다. 엔비디아의프로젝트칼엘프로세서는새로운개념의가변대칭형멀티프로세싱 (Variable Symmetric Multiprocessing, 이하 vsmp) 기술을적용하였다. 이전까지공개되지않았던 vsmp 는활성대기모드, 음악재생, 동영상재생등의작업을낮은주파수에서수행하는특별한저전력실리콘프로세스를사용하여구축된제 5 의 CPU 코어인컴패니언 (companion) 코어를포함한다. 표준실리콘프로세스를이용하여구축된네개의메인 쿼드 코어는더높은주파수에도달하는동시에많은작업수행시듀얼코어솔루션보다전력소모가적다. 다섯개의 CPU 코어는모두동일한 ARM 코어텍스 (Cortex) A9 CPU 이며, 각각작업부하에따라 ( 적극적인파워게이팅을통해 ) 활성화되거나비활성화된다. 컴패니언코어는현비동기 SMP 아키텍처와달리운영체계에투명한데 (OS transparent), 이는즉, OS 와애플리케이션이컴패니언코어를인식하지는않되, 자동적으로이코어를활용한다는것을의미한다. 이러한전략은소프트웨어작업부하와신규코딩요구량을상당부분절감해준다. 주요모바일사용사례용으로최적화 모바일사용사례연구결과대부분모바일기기의경우활성대기상태에있는시간이 80% 에이르며, 인텐시브모바일애플리케이션처리시간은 20% 에불과한것으로나타났다. 활성대기상태로놓여있는가방속또는책상위의자신의모바일기기를생각해보자. 또는사용자가디바이스와적극적으로상호작용하지않을때프로세서는백그라운드작업이나사용자인터렉션이필요하지않은저성능애플리케이션을구동한다. 그반면, 웹브라우징, 이메일체크, 게임, 멀티미디어애플리케이션구동, 미디어재생등을위해기기를사용할때기기는보다높은주파수대역폭에서구동하는한개이상의 CPU 코어를필요로하는성능집중모드에들어가게된다. 기기가활성대기상태에있을때도이메일동기화, 소셜미디어동기화, 라이브배경화면, 액티브위젯등수많은작업이백그라운드에서실행되고있다는점을명심하도록하자. 이러한작업들은아주낮은주파수에서구동하는한개의 CPU 코어로처리될수있다. 일반적으로 3

사용자들은백그라운드작업이처리되고배터리수명이크게소모되지만않는다면그작업이얼마나빨리처리되는지에는큰관심을두지않는다. 활성대기상태에있을때모바일프로세서의활성대기전력소비를최소화하여배터리수명을현격하게향상할수있다. 그림 1 기기가활성대기상태일때주로실행되는백그라운드작업실리콘프로세스와전력및주파수에미치는영향실리콘디바이스의전력소비는누설전력 (leakage power) 과동적전력 (dynamic power) 의총합과같다. 누설전력은주로실리콘프로세스기술에의해결정되며동적전력은실리콘프로세스기술과동작전압및주파수에의해결정된다. 실리콘기기의동적전력은동작주파수에비례하며, 더중요하게는동작전압의제곱에비례한다. 총전력 = 누설전력 + 동작전력동작전력 α 주파수 x 전압 ^2 4

실리콘기기가피크주파수또는피크주파수근사치에서동작될때, 기기의총소비전력은동적전력소비가장악하며, 기기가유휴상태이거나유휴에가까운상태일경우누설전력이총소비전력의상당부분을차지한다. 고속프로세스기술의트랜지스터는높은누설전력을소비하며정상적인전압수준에서매우빠른스위칭타임을갖고있다. 따라서, 고속프로세스기술에탑재된 CPU 코어는 ( 그림 2 의 CPU A) 유휴또는활성대기상태에서높은누설전력을소비하지만, 동작전압의현격한증가필요없이보다높은주파수대역에서구동할수있는역량을갖고있다. 저전력프로세스기술의트랜지스터는낮은누설전력을갖고있지만정상적인전압수준에서저속의스위칭타임을갖고있으며 ( 높은주파수작동을위해 ) 보다빠르게스위치를실행하기위해서는정상적인전압범위보다높을필요가있다. 저전력프로세스기술에구축된 CPU 코어 ( 그림 2 의 CPU B) 는매운낮은누설전력을소비하지만매우높은주파수에서작동하기위해서는정상범위보다높은전압수준을필요로한다. 따라서, 과도한양의동적전력을소비하기때문에상당한전력및열문제를발생시킬수있다. 다음의단순화된서술이위의개념을효과적으로요약하고있다. 고속프로세스 = 고주파수오퍼레이션에최적화, 단, 높은누설저전력프로세스 = 낮은누설로낮은주파수에서작동 5

POWER CPU B CPU A CPU on low power process - has lower leakage power but consumes more power at higher performance ranges CPU on Fast Process- has higher leakage power in active standby PERFORMANCE 그림 2 모바일 CPU 전력성능곡성성능집중모바일사용사례와배터리수명연장에대한수요급증을충족하기위해, CPU 코어의활성대기및동적전력소비를최소화하는것은매우어려워지고있다. ( 위에규정된 ) 실리콘프로세스를아키텍처적인최적화와결합함으로써단일 SoC (System-on-a-Chip) 는고성능및저전력소비에모두최적화될수있을것이다. 가변대칭형다중처리 (Variable Symmetric Multiprocessing) 엔비디아의프로젝트칼엘은특허받은가변대칭형다중처리 (vsmp) 기술을적용한세계최초의모바일 SoC 디바이스이다. vsmp 기술은활성대기상태의전력소모를최소화하는동시에온디맨드최대쿼드코어성능을제공한다. 칼엘은네개의메인 Cortex A9 고성능 CPU 코어외에활성대기상태의전력소모를최소화하고부하가적은프로세싱작업을처리하는데최적화된 컴패니언 CPU 라는이름의제 5 의저전력, 저누출 Cortex A9 CPU 코어를적용하였다. 프로젝트칼엘은애플리케이션과운영체계의필요조건을기반으로메인코어와컴패니언코어사이의작업분배를지능적으로관리하는다른특허받은 vsmp 기술을포함하고있다. 이 6

관리는엔비디아의동적전압및주파수스케일링 (Dynamic Voltage and Frequency Scaling: DVFS) 과 CPU Hot-Plug 관리소프트웨어가처리하며다른특별한 OS 변경이필요없다. 저전력컴패니언코어컴패니언코어는저전력프로세스기술에설계되었지만, 메인 Cortex A9 CPU 코어와동일한내부아키텍처를갖고있다. 저성능범위 ( 와주파수 ) 의저전력프로세스에구축되었기때문에고속프로세스기술에구축된메인 CPU 코어보다전력소모가적다. 칼엘의전력성능측정에따르면 500 MHz 이하의동작주파수에서메인코어대비컴패니언코어가와트당보다높은성능을제공하는것으로나타났다. 따라서, 컴패니언코어의최대동작주파수는 500MHz 로한정되었다. 표 1 은칼엘에서컴패니언코어와네개의메인코어를비교, 대조한것이다. 전력최적화컴패니언 CPU 코어 성능최적화메인 CPU 코어 아키텍처 Cortex A9 Cortex A9 프로세스기술저전력 Low Power (LP) 일반 / 고속 General/Fast (G). 동작주파수범위 0 MHz ~ 500 MHz 0 MHz ~ Max GHz 표 1 컴패니언및메인 CPU 특징컴패니언코어는주로모바일기기가활성대기상태에있거나이메일싱크, 트위터업데이트, 페이스북업데이트등백그라운드작업을실행할때사용된다. 또한오디오스트리밍, 오프라인오디오, 온라인또는오프라인동영상재생등 CPU 프로세싱역량을많이필요로하지않은애플리케이션에사용된다. 오디오및동영상재생은동영상인코딩과더불어하드웨어기반인코더와디코더로거의처리된다는점에주목할필요가있다. 컴패니언코어와달리메인 CPU 코어는고성능제공을위해매우높은주파수에서작동할필요가있다. 따라서낮은동작전압범위에서매우높은동작주파수까지스케일업을가능하게해주는고속프로세스기술에탑재되었다. 그렇기때문에메인코어는동적전력사용량의현격한증가없이고성능을제공할수있다. 7

그림 3 칼엘의저전력컴패니언 CPU 성능최적화메인코어와전력최적화컴패니언코어를결합한 vsmp 기술은활성대기상태뿐아니라게이밍, 웹브라우징, 플래시미디어, 화상회의등성능이매우중요한모바일애플리케이션의온디맨드 (on-demand) 피크쿼드코어성능에서초저전력소비를가능하게한다. vsmp 기술은그림 B 에제시된것럼전력최적화 CPU B 와성능최적화 CPU A 의전력-성능혜택을성공적으로결합하여그림 4 와같은전력-성능곡선을제공한다. 8

POWER Companion Core = OFF Main Cores = ON Max Quad Core Performance Companion Core = ON Main Cores = OFF PERFORMANCE 그림 4 vsmp 기술로구동하는컴패니언코어 + 쿼드메인코어의전력 - 성능커브 투명운영체계 (OS Transparent) 구축안드로이드 3.x ( 허니콤 ) 운영체계는멀티프로세싱을위한서포트기능이내장되어있고, 복수의 CPU 코어성능을활용할수있는역량을갖고있다. 그러나 OS 는모든가용 CPU 코어가동일한수준의성능을같고있다고가정하며이가정하에가용코어의작업을편성한다. 따라서, 컴패니언코어와메인코어관리를 OS 에완전히투명하게만들기위해서칼엘은컴패니언코어와메인쿼드 CPU 코어에대해하드웨어기반과저수준의소프트웨어기반관리를모두실행한다. 특허받은하드웨어및소프트웨어 CPU 관리로직은지속적으로 CPU 작업량을모니터하여자동적으로그리고역동적으로컴패니언코어와메인 CPU 코어를활성화또는비활성화한다. 컴패니언코어와메인코어를켰다끄는결정은순전히현재 CPU 작업량과그에따라 OS 커널에내장된 CPU 주파수컨트롤서브시스템의 CPU 동작주파수추천에의거한다. 이기술은기타다른애플리케이션이나 OS 수정을요하지않는다. 작업량기반의 CPU 코어의동적활성화와비활성화컴패니언코어가비활성화되고모바일프로세서가프로세싱을위해메이코어를사용할경우 CPU 가버너 (CPU Governor) 와 CPU 관리로직은지속적으로 CPU 작업량과각메인코어의활용도를지속적으로모니터하여메인코어네개를역동적으로활성화하고나비활성화한다. 9

예를들어, 이메일, 기본게임, 텍스트문자등의애플리케이션은보통 4 개메인코어중한개의처리역량만을필요로한다. 반면에플래시웹브라우징, 과중한멀티테스킹등보다부하가큰애플리케이션의경우 CPU 매니저는두개의 CPU 코어를활성화시킬수있다. 그러나콘솔급게임, 미디어편집및제작등최상의피크성능을요구하는애플리케이션의니즈를충족하기위해서는네개의 CPU 코어를모두활성화시킬수있다. 백그라운작업, 오디오, 동영상,, 이메일싱크, 소셜 미디어싱크등 이메일, 2D 게임, 기본 브라우징, 지도등단일 코어성능 플래시지원브라우징, 멀티태스킹, 화상채팅등을 위한듀얼코어성능 콘솔급게임, 고속 브라우징, 미디어 포르세싱용쿼드코어성능 그림 5 작업부하에따른 CPU 코어관리 10

vsmp 아키텍처의구조적장점 가변 SMP 기술은비동기클럭킹과같은다른솔루션과비교해봤을때몇가지구조적장점을 갖고있다. 캐시일관성 : vsmp 기술은컴패니언코어와메인코어의활성화를동시에지원하지않기때문에서로다른주파수에서구동되는코어사이에캐시를동기화할때불이익이적용되지않는다. 컴패니언코어와메인코어는동일한 L2 캐시를공유하며, 캐시는컴패니어코어와메인코어에서동일한수의나노초로데이터를재전송하도록프로그램되어있다. ( 메인코어는더높은주파수에서구동되기때문에기본적으로더많은 메인코어주기 대비더적은 컴패니언코어주기 가필요하다.) OS 효율성 :. 안드로이드 OS 는모든가용 CPU 코어가비슷한성능역량을갖고있는가정하고, 이를기반으로각코어의작업량을편성한다. 복수의 CPU 코어가서로다른비동기식주파수에서구동하게되면각코어는서로다른성능역량을갖는결과를가져오며 OS 스케줄링비효율성으로이어질수있다. 반대로 vsmp 기술은최적화된 OS 스케쥴링을위해모든액티브코어를비슷한동기식동작주파수로항상유지한다. vsmp 가컴패니언코어에서 1 개이상의메인 CPU 코어로전환할에도, CPU 관리로직은최종사용자가인식하지못하도록매끄러운전환을보장하며, OS 스케쥴링페널티를야기하지않는다. 전력최적화 : CPU 아키텍처기반비동기식클럭킹의각코어는일반적으로동작주파수에따라각코어의전압을조정하기위해서로다른전원판 ( 전압레인또는전압판 ) 을갖고있다. 이는전압판전역에걸쳐신호및전선소음의증가를가져올수있으며, 성능에부정적인영향을미칠수있다. 각전압판이독자적인전압조정기를필요로할수있기때문에, 이들아키텍처는 CPU 코어수가증가될경우확장이용이하지않을수있다. 전압조정기추가는 BOM ( 자재명세서 ) 비용과전력소비를증가시킨다. 만일동일한전압레일이전체코어에사용된다면각코어는가장빠른코어가요그하는전압으로구동되기때문에전력감소를위한전압자습 ( voltage squared ) 효과의혜택을상실하게될것이다. vsmp 기술이캐시동기화와비동기식주파수에서구동한는코어전반의스케쥴링페널티를받지않기때문에, 비동기식클럭킹기술을사용하는아키텍처보다고성능을제공할수있다. 구조적도전과제와솔루션 vsmp 아키텍처의몇가지도전과제를해결하기위한독창적인솔루션이개발되었다. 스위치타임 : vsmp 는컴패니언코어와메이코어사이의스위칭과정이더딘애플리케이션로드타임과사용자경험에있어눈에띄는지연을가져오지않도록보장해야한다. 이러한상황에대응하기위해서엔비디아는고속스위칭효율성을가능하게하기위해최첨단회로및로직을구현하였다. 내부시뮬레이션결과칩내부의코어스위칭시간과 ( 활성화된코어의 ) 전압레일안정화시간을포함한총 11

스위칭타임이 2 밀리세컨드 (ms) 이하인것으로나타났으며, 이는최종사용자가 인식하지못할정도의지연시간이다. 코어스래싱 (Core Thrashing): vsmp 는작업부하가코어간스위치를작동시키는데사용되는임계값 (threshold value) 근처에서변동될때컴패니언코어와메인코어간에왔다갔다하는전환이자주이루어지지않도록방지해야한다. 이는성능저하를가져오고전력절감효과를무효화하기때문이다. 이문제를극복하기위해 CPU 관리알고리즘에작업부하를지속적으로모니터하고조정하는충분한인텔리전스와프로그램가능한히스테리시스제어장치를탑재하여코어간스래싱을방지하였다. 가변 SMP 의전력혜택 vsmp 기술은컴패니언코어를사용하여활성대기상태에서누설전력소비를최소화하고네개의메인코어를이용하여피크동작주파수에서동적전력소비를최소화하여현격한전력절감효과를제공한다. 사용사례에따라 vsmp 기술은가능한최저전력으로원하는성능을제공하기위해 CPU 코어를역동적으로활성화또는비활성화한다. 아래도표는모든사용사례에서절전효과를보여준프로젝트칼엘을나타내고있다. 도표는 TSMC 40nm 제조기술에서테그라 2 와프로젝트칼엘사용을측정하였다. 100% Power Savings on Kal-El due to vsmp Tegra 2 Project Kal-El 80% 60% 40% 28% 14% lower 61% lower 34% lower 20% LP0 MP3 Playback HD video playback Gaming 그림 2 vsmp 기술로인한프로젝트칼엘의절전효과 1 1 전력은다른시스템변수에정상화된후애플리케이션프로세서전력과 DRAM 전력의총합을측정하였다. LPO 는각테그라기기의최저전력상택이다. 12

듀얼코어대비쿼드코어의전력혜택 vsmp 기술과더불어코어수가많은것이적은것보다전력관리에우수하다는점을명심할필요가있다. 예를들어쿼드코어 CPU 는듀얼코어 CPU 보다모든성능점에서낮은전력을사용한다. 그이유는네개코어가낮은주파수에서구동될수있기때문인데즉, 낮은전압에서듀얼코어 CPU 와동일한양의작업을처리한다는것을의미한다. 전력이전압의제곱에비례하기때문에, 총 CPU 전력이매우적다해도동일한양의작업을수행할수있다. 표 2 는단일또는멀티코어 CPU 성능측정의인기모바일벤치마크인코어마크 (Coremark ) 벤치마크를구동했을때프로젝트칼엘대비경쟁듀얼코어프로세서의전력소비와성능수준을측정한것이다. 아래표에서동일한수준- 즉, 각프로세서가약 5k 의코어마크 작업 를완수-의성능으로제한하였을때프로젝트칼엘의 CPU 가경쟁솔루션대비 2-3 배적은양의전력을소비한다는점에주목하자. 또한칼엘이더높은주파수에서구동되어코어마크작업양의 2 배이상을완수했을때도듀얼코어솔루션에비해낮은전력을소비한다. 모바일프로세서 측정전력 (mw) 2 코어마크성능 프로젝트칼엘 ( 각코어 480 MHz 로구동 ) 579 5589 OMAP4 ( 각코어 1 GHz 로구동 ) 1501 5673 QC8660 ( 각코어 1.2 GHz 로구동 ) 1453 5690 프로젝트칼엘 ( 각코어 1 GHz 로구동 ) 1261 11667 표 2 프로젝트칼엘과경쟁프로세서의측정된전력및성능네개의 CPU 코어를모두 1 GHz 에서구동할때도칼엘이경쟁듀얼코어프로세서보다전력을적게사용한다는점에주목하자. 칼엘은성능최적화된 CPU 코어에고속프로세스기술을이용하기때문에, 네개의코어는경쟁프로세서보다낮은동작전압범위를사용하여높은주파수에서구동할수있다. 동적전력소비가동작전압제곱에비례하기때문에칼엘은보다높은주파수에서동작할때에도상당한절전효과를제공할수있는것이다. 2 CPU-only 전력에도달하기위해코어마크 ( 전체테스트의평균 ) 로구동된총시스템파워에서 OS- 유휴시시스템전력을빼는방식으로 CPU 전력이측정되었다. 칼엘은 OS 유휴시섀도모드로구동되는데주목하자. 칼엘참조설계와경쟁사생산기기에서측정하였다. 13

그림 7 경쟁듀얼코어프로세서와동일한성능제공시칼엘의전력소비 그림 8 최대쿼드코어성능제공시칼엘의전력소비 14

결론 모바일애플리케이션에대한성능요건이증가함에따라 SoC 벤더는향상된성능제공과더불어전력소비를모바일예산내에서유지하기위해서멀티코어프로세서아키텍처를채택하고있다. 프로젝트칼엘이적용한가변대칭형다중처리 (vsmp) 기술은활성대기상태에서전력소비를최소화하는새로운기준의전력절감효과를제공할뿐아니라모바일기기가요하는열소모예산내로동적전력소비를유지하는동시에쿼드코어성능효과를제공하고있다. 백그라운드작업에컴패니언 CPU 코어를사용하고성능집중작업에메인코어를사용함으로써프로젝트칼엘은모든성능수준에서경쟁모바일프로세서보다현격하게낮은전력을소모한다. 쿼드코어 CPU 와가변 SMP 기술은모바일기기가성능한계를뛰어넘었을뿐아니라, 애플리케이션및게임개발자가가장인기있는사용사례에서배터리수명을연장하면서새로운모바일경험을제공할수있도록지원하고있다. 모바일기기에서쿼드코어 CPU 의혜택에대한정보는 모바일기기에서쿼드코어의혜택 (The Benefits of Quad Core CPUs in Mobile Devices) 이라는백서를참조하기바란다. 15

문서변경내력 16

Notice ALL INFORMATION PROVIDED IN THIS WHITE PAPER, INCLUDING COMMENTARY, OPINION, NVIDIA DESIGN SPECIFICATIONS, REFERENCE BOARDS, FILES, DRAWINGS, DIAGNOSTICS, LISTS, AND OTHER DOCUMENTS (TOGETHER AND SEPARATELY, MATERIALS ) ARE BEING PROVIDED AS IS. NVIDIA MAKES NO WARRANTIES, EXPRESSED, IMPLIED, STATUTORY, OR OTHERWISE WITH RESPECT TO MATERIALS, AND EXPRESSLY DISCLAIMS ALL IMPLIED WARRANTIES OF NONINFRINGEMENT, MERCHANTABILITY, AND FITNESS FOR A PARTICULAR PURPOSE. Information furnished is believed to be accurate and reliable. However, NVIDIA Corporation assumes no responsibility for the consequences of use of such information or for any infringement of patents or other rights of third parties that may result from its use. No license is granted by implication or otherwise under any patent or patent rights of NVIDIA Corporation. Specifications mentioned in this publication are subject to change without notice. This publication supersedes and replaces all information previously supplied. NVIDIA Corporation products are not authorized for use as critical components in life support devices or systems without express written approval of NVIDIA Corporation. Trademarks NVIDIA, the NVIDIA logo, Tegra, CUDA, FERMI and GeForce are trademarks or registered trademarks of NVIDIA Corporation in the United States and other countries. Other company and product names may be trademarks of the respective companies with which they are associated. Copyright 2011 NVIDIA Corporation. All rights reserved. 17