RNTier CDP 그래픽처리성능 분석보고서 클루닉스 본자료는 클루닉스에서공학용워크스테이션에서요구하는최적의그래픽처리장치의선별및원격통합설계시스템구현에필요한 Remote Graphic 처리능력에대한자사제품인 RNTier CDP의성능분석보고서입니다. 클루닉스의협의없이발췌및배포를금합니다. BMT 환경 : RNTier CDP(Centralized Design Platform) BMT SW : GLX Benchmark, SPECviewperf, Unigine Benchmark, LSprepost, Abaqus, Ensight, PAMCRASH, ANSYS, CFX) BMT 주관 : 클루닉스기술부 BMT 일자 : 2010년 12월 08일 ~2010년 12월 16일 BMT 진행 : 클루닉스기술부 / 수석컨설턴트서진우
목차 1. BMT 요약... 3 2. BMT 환경정보... 5 3. BMT 주요시나리오... 6 4. BMT 항목별결과... 12 첨부자료 RNTier CDP 란 Nvidia Geforce 와 Nvidia Quadro 구조적차이 2/19 페이지
1. BMT 요약 본 BMT는공학디자인설계플랫폼통합구현에핵심요소인원격그래픽처리성능에대한자사제품 RNTier CDP(Centralized Design Platform 이하 CDP) 의그래픽처리성능분석및공학용워크스테이션에서요구하는최적의그래픽처리장치 (GPU Device) 를선별하기위한 Benchmark TEST 입니다. 본 BMT는일반적인 3D 그래픽처리장치중가장대표적으로사용되는 NVIDIA 사의 Quadro 계열제품과 Geforce 계열제품의그래픽성능을다양한종류의 3D 분석 SW를통해분석하여, 공학용그래픽처리에적합한장치를선별한후, CAE(Computer Aided Engineering) 분야의 CAD, Modeling SW를통해, LOCAL 워크스테이션환경에서의그래픽처리성능과 RNTier CDP를이용한네트워크접속환경에서의그래픽처리성능 (FPS : Frame Per Second) 을비교분석하였습니다. 공학용최적그래픽장치선별테스트결과 Multimedia,3D Game 그래픽성능 공학 SW 그래픽성능 Speedup of FPS 5 4 3 2 1 0 glxgears glxspheres GAME1 BMT SW GAME2 GAME3 GTX260 FX580 Speedup of FPS 5 4 3 2 1 0 CATIA ENSIGHT LIGHTWAVE MAYA PRO-E SW2 BMT SW TCVIS UGS GTX260 FX580 유사한 SPEC과가격을보유한 Quadro FX 580과 Geforce GTX260 제품에대해다양한측면의그래픽처리성능을비교한결과, 멀티미디어와 3D Game 에서는GTX 260이 Quadro FX580에비해 2~4배정도의성능이우수한것이확인되었습니다. 하지만 OpenGL 환경의 3D 설계디자인 SW를이용한성능측정에서는 Quadro FX580이 GTX260에비해 2~4배정도의성능이우수하였습니다. RNTier CDP 의원격그래픽처리성능측정결과 RNTier CDP를통해원격네트워크접속환경에서 CAE설계, 모델링S/W (LSPREPOST, ABAQUS CAE, ENSIGHT, PMACRASH, ANSYS, CFX5POST) 작업을수행한결과, LOCAL 환경에서의그래픽처리성능 (FPS) 의 88~100% 에달하는성능을확인하였습니다. 3/19 페이지
- CAE 설계, 모델링샘플가시화화면 ( 일부 ) BMT-1 : LSPREPOST BMT-2 : LSPREPOST BMT-3 : ABAQUS CAE BMT-4 : ENSIGHT - RNTier CDP 의원격그래픽처리성능결과 RNTierCDP 원격그래픽성능결과 80 70 60 FPS(Frame per second) 50 40 30 20 10 LOCAL_PC RNTierCDP RemotePC 0 BMT-1 BMT-2 BMT-3 BMT-4 BMT 항목 RNTier CDP의원격그래픽처리성능은기존대표적인원격데스크탑방식인 RDP와비교했을때 10배이상의성능을발휘하며, LOCAL 장비에서직접적으로처리했을때와비교해도, 육안으로는판별이힘든수준의높은그래픽처리성능과품질을확인할수있었습니다. 4/19 페이지
2. BMT 환경정보 - H/W 구성정보 세부사양 자원수 Cpu Intel(R) Core(TM) i7 CPU 870 @ 2.93GHz 4core Memory DIMM Synchronous 667 MHz 4GByte 2개 (8Gbyte) Hard disk SATA2 1TByte 1개 Network Gigabit Ethernet 1port GPU[1] Nvidia Quadro FX580 1개 GPU[2] NVidia Geforce GTX 260 1개 본워크스테이션 LOCAL 환경에서의직접그래픽작업을수행한후, 원격지의일반노트북에서동일한워크스테이션에 RNTier CDP 네트워크접속을통해동일한작업을수행하였습니다. 그리고 Graphic 카드종류별성능테스트를위해동일한장비에서 Nvidia Quadro FX580 카드와 Nvidia Geforce GTX260 카드를교대로장착하여동일한성능테스트를수행하였습니다. - S/W 구성정보 S/W 명 S/W 버전 운영체제 Redhat Eenterprise Server(x86_64) V5 update5 통합솔루션 RNTier CDP 2.1 3D 표준 BMT S/W GLXTOOL (glxgears, glxspheres) 3D 게임 BMT S/W UNIGINE OpenGL BMT GPU표준 BMT S/W SPECviewpef11 실무CAD,CAE S/W LSPREPOST, ABAQUS CAE, ENSIGHT, PAMCRASH, ANSY, CFX 본 BMT에사용된성능측정방식은 OpenGL 3D 그래픽환경에서의그래픽성능을측정하는표준 BMT SW를이용한측정방법과, 실무 CAE 환경에서실제 CAD, 모델링에사용되는예제를이용하여, 3D 형상그래픽처리 ( 후처리 ) 시 FPS( 초당처리프레임수 ) 를측정하는방법으로진행되었습니다. 5/19 페이지
3. BMT 주요시나리오 본 BMT 통해파악하고자하는정보는 (1) NIVIDA Geforce 와 Quadro Chipset 제품중 CAD, CAE 형상그래픽처리에최적화된제품을선별하고, (2) 실무에서사용하는실제 3D 형상모델을이용하여 RNTier CDP의원격그래픽처리기능의성능을파악하는것입니다. BMT1 : 공학용최적그래픽장치선별테스트시나리오 1. 동일한사양의 CPU, Memory, DISK 구성의워크스테이션에 NVIDIA GTX 260 그래픽카드와 NVIDIA Quadro FX 580 그래픽각각장착한다. 참고 : NVIDIA GTX 260과 NVIDIA Quadro FX 580은유사한세부 SPEC과가격을보유한그래픽카드임 2. GTX260과 FX580이설치된워크스테이션에서아래의표준 3D 그래픽 BMT 프로그램을차례로실행한후, 각프로그램의그래픽처리시 FPS( 초당처리프레임수 ) 를측정한다. BMT SW 명그래픽용도 BMT 형상화면 A. Glxgears 표준 OpenGL BMT B. Glxspheres 표준 OpenGL BMT 6/19 페이지
C. UNI_Tropics 3D 게임화면처리 D. UNI_Sanctuary 3D 게임화면처리 E. UNI_heaven 3D 게임화면처리 F. SPECview(CATIA) 3D 모델링형상제작 7/19 페이지
G. SPECview(ENSIGHT) 3D 모델링형상처리 H. SPECview(Lightwave) 3D 모델링형상제작 I. SPECview(Maya) 3D 모델링형상제작 J. SPECview(PRO-E) 3D 모델링형상제작 8/19 페이지
K.SPECview(SolidWorks) 3D 모델링형상제작 L. SPECview(TCVIS) 3D 모델링형상제작 M. SPECview(UGS_NX) 3D 모델링형상제작 단일 BMT 프로그램을통해 3D 그래픽처리의모든영역을테스트하긴힘듭니다. 각그래픽산업분야별로그래픽장치에서제공하는기능중특정영역의성능이우선적으로필요한경우가대부분임으로, 본테스트에서는 3D 형상을단순 Viewing 하는측면 ( 게임, 동영상멀티미디어 ) 에서, 제작생성시사용되는다양한기능적측면 (CAD, CAM, CAE, Rendering, etc) 까지복합적인테스트를진행하였습니다. 9/19 페이지
BMT2 : RNTier CDP 의원격그래픽처리성능테스트시나리오 1. Quadro FX 580 그래픽카드를장착한상기워크스테이션에 CAD, CAE 분야의다양한실무해석모델링결과파일을이용하여, LOCAL 환경에서직접적으로그래픽후처리형상제어테스트를수행하며, 해당작업시 FPS( 초당처리프레임수 ) 를측정함. 참고 : BMT 1 을통해 CAD, CAE와같이 3D 형상을제작하는업무분야에서는 Geforce 계열의그래픽카드보단, Quadro 계열의그래픽카드의성능이 2~4배정도우수한것을확인함으로본 BMT에서는 Quadro FX 580 그래픽카드를통해테스트를수행함. 2. 원격지의일반노트북을통해상기워크스테이션에 RNTier CDP 네트워크접속을수행한후, 동일한그래픽후처리작업을수행하며, FPS를측정함. 3. 원격지의일반노트북을통해기존의대표적인원격데스크탑접속방식인 RDP 환경으로상기워크스테이션에접속후, 동일한그래픽후처리작업을수행한다. 그때 FPS를측정함. BMT SW 명 BMT 설명 BMT 형상화면 A. LSPREPOST [1] LSDYNA 해석결과후처리 neon car carsh model (224MByte) B. LSPREPOST [2] LSDYNA 해석결과후처리 carvan crash model (2.7GByte) C. ABAQUS CAE/Viewer ABAQUS 해석결과후처리 explicit car crash model (400MByte) 10/19 페이지
D. ENSIGHT ENSIGHT 후처리결과 Shuttle Traces model (11MByte) E. ENSIGHT [2] LSDYNA 결과후처리 carvan crash model (2.7GByte) F. PAMVIEW PAMCRASH결과후처리 Car Front model (514MByte) G. ANSYS ANSYS 결과후처리 Heat Flow Model (509MByte) H. CFX CFX 결과후처리 Wind Turbine model (1.2GByte) 11/19 페이지
4. BMT 항목별결과 BMT 1 : 공학용최적그래픽장치선별테스트결과 본테스트는 CAD, CAE, Rendering 분야와같이실제 3D 그래픽 Contents를제작하거나, 형상소스를직접적으로제어하는업무분야에적합한그래픽보드를선별하는테스트입니다. 본테스트를위해 NVIDIA 사의대표적인그래픽보드제품계열인 Geforce(GTX 260) 제품과 Quadro (FX580) 제품의성능을비교하였습니다. 성능비교기준은 FPS (Frame per second) 로초당처리되는그래픽화면수를비교하는것으로진행하였습니다. 아래는각 BMT 항목별결과데이터입니다. BMT SW명 측정용도 FPS 결과 GTX 260 FX 580 A. Glxgears 표준 OpenGL BMT 18800 10770 B. Glxspheres 표준 OpenGL BMT 1300 550 C. UNI_Tropics 3D 게임화면처리 89 20.7 D. UNI_Sanctuary 3D 게임화면처리 114 40.5 E. UNI_heaven 3D 게임화면처리 58 15.1 F. SPECview(CATIA) 3D 모델링형상제작 9.04 16.48 G. SPECview(ENSIGHT) 3D 모델링형상처리 11.30 10.48 H. SPECview(Lightwave) 3D 모델링형상제작 12.88 30.16 I. SPECview(Maya) 3D 모델링형상제작 8.00 29.11 J. SPECview(PRO-E) 3D 모델링형상제작 2.90 8.64 K.SPECview(SolidWorks) 3D 모델링형상제작 11.36 23.79 L. SPECview(TCVIS) 3D 모델링형상제작 3.59 10.93 M. SPECview(UGS_NX) 3D 모델링형상제작 6.55 12.07 본테스트결과를통해일반적인이미제작된 3D 영상이나컨텐츠를보거나, 단순제어하는용도에서는 Geforce 계열의그래픽보드제품이 Quadro 계열의제품보다 2~5배정도의성능이우수한것을확인할수있습니다. 하지만 CAD, CAE, Rendering 분야처럼 OpenGL의다양한그래픽라이브러리를통해 3D 컨텐츠를제작하거나, 내부적인복잡한제어를요구하는 SW에서는 Quadro 제품이 2~5배정도의성능이높게측정되는것을확인할수있습니다. 12/19 페이지
Multimedia, 3D Game 그래픽성능결과그래프 5 Multimedia,3D Game 그래픽성능 Speedup of FPS 4 3 2 1 0 A.glxgears B.glxspheres C.GAME1 D.GAME2 E.GAME3 BMT SW GTX260 FX580 CAD, CAE, Rendering 공학 SW 그래픽성능결과그래프 5 공학 SW 그래픽성능 Speedup of FPS 4 3 2 1 0 CATIA ENSIGHT LIGHTWAVE MAYA PRO-E SW2 TCVIS UGS BMT SW GTX 260 FX580 본테스트결과를통해게임, 에니메이션, 영화감상과같은일반적인그래픽처리환경에서는 Geforce 계열의제품을선정하고, CAD, CAE, Rendering 같은공학용그래픽처리환경에서는 Quadro 계열의제품을선정하는것이유사가격대비최적의성능을확보할수있다는것을확인하였습니다. 13/19 페이지
BMT2 : RNTier CDP 의원격그래픽처리성능테스트결과 본테스트는근래 IT 인프라기술의이슈인클라우드서비스환경및중앙통합전산환경구현에가장큰병목요소인 3D 그래픽화면의원격전송기능에대한성능테스트를수행하고, 고성능의 3D 그래픽처리가필요한그래픽워크스테이션환경에서도이같은기술의적용타당성을검증하는테스트입니다. 아래결과는 CAD, CAE 실무분야에서실제사용되는형상모델링결과를가지고, 후처리가시화작업을워크스테이션직접작업환경 (LOCAL) 과 RNTier CDP 원격통합환경 (REMOTE) 에서각각수행하고, 그성능차이를비교분석결과입니다. BMT SW명 A. LSPREPOST [1] B. LSPREPOST [2] C. ABAQUS CAE/Viewer D. ENSIGHT [1] E. ENSIGHT [2] F. PAMVIEW G. ANSYS H. CFX 모델설명 LSDYNA 결과후처리 neon car carsh model (224MByte) LSDYNA 결과후처리 carvan crash model (2.7GByte) ABAQUS 결과후처리 explicit car crash model (400MByte) ENSIGHT 결과후처리 Shuttle Traces model (11MByte) LSDYNA 결과후처리 carvan crash model (2.7GByte) PAMCRASH결과후처리 Car Front model (514MByte) ANSYS 결과후처리 Heat Flow Model (509MByte) CFX 결과후처리 Wind Turbine model (1.2GByte) FPS 결과 LOCAL RNTierCDP 효율 50 49 98% 11 10 91% 22 21 95% 80 80 100% 25 25 100% 26 26 100% 32 28 88% 75 67 89% 14/19 페이지
RNTier CDP 의원격그래픽처리성능결과그래프 RNTierCDP 원격그래픽성능결과 80 70 60 FPS(Frame per second) 50 40 30 20 10 LOCAL_PC RNTierCDP RDP 0 lspre[1] lspre[2] abaqus enliten ensight pam ansys cfx BMT SW 본테스트결과 RNTier CDP의원격설계통합기능을이용하여, 다양한 CAE SW의후처리작업을수행한경우, LOCAL 그래픽환경과비교하여, 88~100% 그래픽성능을보장하는것을확인할수있었습니다. RNTier CDP를통한원격그래픽작업환경에서다양한 CAD, CAE SW로그래픽업무처리시, 사람이시각적으로실시간과동일하다고판단하는 20fps( 초당 20개의그래픽화면처리 ) 이상의성능을모두발휘하였고, 일부대규모모델의후처리작업 (B. LSPREPOST[2] Carvan crash model) 의경우, LOCAL 워크스테이션직접작업시 (11fps) 와비교했을때 90%(10fps) 이상의성능유사성을발휘함으로, 몸으로체감이어려운수준의원격그래픽처리성능이보장되는것을확인하였습니다. 기존의경우네트워크상의그래픽성능저하로인해, 그래픽처리작업분야의컴퓨팅환경은통합적용이불가능했으나, 클루닉스사의 RNTier CDP 기능을이용하면, 그래픽워크스테이션컴퓨팅업무환경도중앙통합이가능하다는것을확인할수있습니다. 워크스테이션환경의통합은워크스테이션장비의도입이용절감, 워크스테이션컴퓨팅환경 HW, SW의유지보수비용절감과같은직접적인투자비용절감효과는물론, CAD, CAE 설계데이터와결과데이터의완벽한중앙통합으로, 개별전산환경에서의원론적인보안문제해결및전연구분야의기존연구결과재사용으로, 연구개발의생산성향상과같은간접적효과를동시에기대할수있을것입니다, 15/19 페이지
첨부자료 - RNTier CDP 란 상세제안자료참고.. - Nvidia Geforce 와 Nvidia Quadro 구조적차이 1. 개요 - 범용 (PC) VGA 인 Geforce Series 와전문가용 (Workstation) VGA Quadro Series 의차이점을비교, 분석 2. 비교모델 - Geforce Series: CUDA 와 PhysX 가지원되는 G9x 계열 GPU 탑재모델을기준으로한다 - Quadro Series: 위와동일한기능이지원되는 FX 계열모델을기준으로한다. 3. 차이점 1) 각 Series 의특징 - Geforce 기본적으로 Geforce Series 는범용 GPU 로써 DirectX 와 OpenGL, CUDA, PhysX 등의여러기능이지원되며특히게임과같은실시간렌더링처리에중점을두어퍼포먼스를높힌제품이다. 위의기능과동시에 H.264, WMV, HD 영상가속기능이포함되어있다. 가격이비교적저렴하며여러제품군이나누어져있어선택의폭이넓다. - Quadro 주로 Workstation 에장착되는 GPU 로써 3D 에선 OpenGL 에특화된성능을가지고있음. 물론 CUDA 나 PhysX 도지원하며 Geforce 에비해쉐이더처리능력에있어서매우월등한성능을보인다. NVS( 다중분할화면지원 ), FX(3D 렌더링 ), Plex(CUDA, Multi GPU Computing) 로제품군이나누어진다. 각종동영상기능은 Geforce 와유사하다. 16/19 페이지
적게는 30 만원부터최고 1,000 만원이넘는높은가격의고가장비에속한다. 2) 세부스팩 Geforce 260GTX Quadro FX580 Outward GPU Core 192 32 Memory 512 GDDR3 512 GDDR3 Memory Interface 488Bit 128Bit Memory Bandwidth 111GB/Sec 25.6GB/Sec Connector DVI-I (3D Stereo Support) DVI-I (3D Stereo Support) Quad Buffer Support OpenGL 2.1 3 Shader Model 4.0 DirectX 10.0 10.0 Interface PCI-Express 2.0 16x PCI-Express 2.0 16x Cost 20 만원대 20 만원대 3) 파이프라인아키텍쳐 Model Architecture Geforce Series (Standard Architecture) 17/19 페이지
Quadro Series (Unified Architecture) - 위의표와같이 Quadro Series 는통합된파이프라인구조로써버텍스버퍼를유동적으로사용한다. - 즉, 버텍스, 와이어위주의뷰포트와쉐이딩과하이라이트까지보는뷰포트각각을유동적으로사용하여빠르고손실이최대한적도록버퍼를활용한다. - OpenGL 의측면에서버퍼의활용은 Quadro 에서더더욱빛을발휘하는데, 이는 Quad-Buffer Stereo 를지원하기때문이다.( 일반 VGA 는 Tripple-Buffer 까지만지원함 ) One-Sided Lighting Two-Sided Lighting - 위와같은아키텍쳐로서얻는이득은다음과같다. - Anti-aliased Points 및 Lines 의처리능력향상 - Two-Sided Lighting 가능 - Windows 의 GUI 사용중뷰포트와툴박스, 팝업과겹칠경우뷰포트의오브젝트가깨지는현상을방지 (OpenGL XOR) 18/19 페이지
<OpenGL Logic Operation - Quadro 에서는붉은칸의명령어를지원 > 4) 3D 텍스쳐처리 지원이력은같으나퍼포먼스측면에서큰차이를보인다. Quadro Series 의경우대형텍스쳐와같은경우앞에서설명한 Quad-Buffer Stereo 와 UMA(Unified Memory Architecture) 의지원으로 3D 작업시뷰포트에서빠른속도로움직일수있다. < 고해상도텍스쳐작업시월등한작업효율을가져다준다 > 4. 결론 - Quadro Series 는 UMA 를구현하여효율적인 3D 모델링작업환경을제공하며, OpenGL 에최적화되어있다. Quad-Buffer Stereo 를지원하여빠른 3D 렌더링을구현한다. Geforce Series 에서는불가능한 3D 모델링을지원한다. 19/19 페이지