IBM 이 POWER9 프로세서보다 AI 플랫폼에집중한이유 IBM 은지난 2017 년 12 월 POWER9 칩을직접내세우는대신, AI 애플리케이션을겨냥한단일플랫폼인 IBM Power System AC922 를출시하면서 POWER9 프로세스를시장에함께선보였다. 이러한 IBM POWER9 출시전략 은적절한선택이었을까? IBM POWER9 프로세서 ( 왼쪽 : 패키지커버, 가운데 : 칩, 오른쪽 : 패키지하단 ) POWER9 을통한코그너티브컴퓨팅업그레이드 IBM 은 2016 년에 IBM Power System S822LC for High Performance Computing(HPC), "Minsky" 를발표했다. S822LC 는고성능딥러닝플랫폼이지만, POWER8 의버퍼메모리요구사항과전력소비로인해클라우드에 광범위하게채택되기에는비용구조가너무높았다. 그후, IBM 은코그너티브컴퓨팅플랫폼의비용을절감하고성능을높이기위해플랫폼의거의모든 기능을업그레이드하여새로운 POWER9 에기반한 AC922 "Newell" 을개발했다. 출처 :
IBM의 POWER8과 POWER9 AI 플랫폼 비교 현재 공냉식 4GPU 버전인 AC922를 사용할 수 있으며, 수냉식 6GPU 버전은 2018년 2사분기부터 지원될 예정이다. IBM은 11월 개최된 SC17(슈퍼컴퓨팅) 컨퍼런스에서 이 두 버전을 모두 선보였다. 코그너티브 컴퓨팅을 위한 IBM Power System AC922 설계: 공냉식(왼쪽)과 수냉식(오른쪽) 사진의 프로세서 및 GPU에 표시된 라벨의 의미는 다음과 같다. A. 공냉식 방열판이 있는 POWER9 프로세서 B. 수냉식 냉각판이 있는 POWER9 프로세서 C. 공냉식 방열판이 있는 NVIDIA V100 NVLink 모듈 D. 빈 NVLink 소켓 E. 수냉식 냉각판이 있는 NVIDIA V100 NVLink 모듈 IBM은 다른 NVLink 시스템 설계에서 볼 수 없었던 혁신을 AC922 설계에 적용했다. AC922 설계에서는 4개의 GPU로 6개의 GPU보다 50%나 더 빠른 속도로 NVLink를 운영한다. 4GPU 구성과 6GPU 구성을 단순하게 숫자만으로 비교할 수 없다는 의미다. 각 유형의 성능 확장 방식이 다르므로 서로 다른 워크로드에서
뛰어난 성능을 얻을 수 있다(적은 GPU 노드로 상호 연결이 빠름 vs. 많은 GPU 노드로 상호 연결이 느림). 또한 NVLink는 더 이상 GPU만이 아니라 IBM의 OpenCAPI 이니셔티브를 위한 것이다. SC17의 OpenCAPI 컨소시엄 부스에서는 NVLink-OpenCAPI 컨버전 보드를 선보였는데 OpenCAPI 케이블(SlimSAS 물리적 포맷 사용)을 OpenCAPI가 내장된 FPGA 카드에 연결하였다. OpenCAPI 케이블 연결은 AC922 마더보드 설계를 포함하여 POWER9이 장착되는 시스템의 설계를 위한 새로운 고속 가속 옵션을 제공한다. AC922 마더보드에는 3개의 PCIe Gen4 x16 슬롯과 1개의 x8 슬롯이 포함되어 있다. NVLink-OpenCAPI 컨버터(왼쪽) 및 OpenCAPI가 연결된 Alpha Data ADM-PCIE-9V3 FPGA 카드(오른쪽) IBM의 POWER에 기반한 AI 비즈니스 모델 IBM은 3년 전 x86 서버 비즈니스를 중단했으며, IBM POWER 프로세서 기반한 서버는 서버 유닛 출하량의 5%에 불과하다는 사실을 기억해야 한다. IBM은 POWER 프로세서를 OEM으로 판매하지도 않는다. 그럼에도 불구하고 IBM은 여전히 전 세계 서버 시장에서 점유율 3위를 차지하고 있으며, 유닉스 서버 시장에서는 시장 점유율 1위를 차지하고 있다. 또한 IBM은 x86 서버 비즈니스를 Lenovo에 매각하는 동시에 코그너티브 컴퓨팅(인공 지능, AI), 머신 러닝 (ML) 및 딥 러닝(DL)에 투자를 확대했다. 코그너티브 컴퓨팅 이니셔티브의 일환으로 IBM은 NVIDIA와 긴밀하게 제휴하여 Intel이나 AMD가 얻지 못한 NVIDIA의 NVLink 고속 상호 연결 패브릭과 관련된 지적 자산에 대한 액세스 권한도 얻었다.
POWER 프로그램에대한 IBM 의투자와노력은지속적으로이어져왔으며, 필자가 2016 년 2 사분기에처음보 았던 IBM POWER 프로세서로드맵을 IBM 은여전히기준으로사용되고있다는사실은많은점을시사한다. IBM 의 POWER 프로세서로드맵 POWER9 및 OpenPOWER 에코시스템 IBM은 POWER8부터시작된 POWER 프로세서시리즈를위한서드파티하드웨어및소프트웨어에코시스템형성을위해 OpenPOWER 재단을설립했다. POWER9 기반의 AC922 시스템은매우다양한컴퓨팅, 네트워크및스토리지가속화옵션을호스팅할수있어에코시스템을통한 IBM의대규모비즈니스가시작되는지점이될것이다. 필자는전에 Google이코드명 "Zaius" 라는 POWER9 기반의시스템설계를위해 Rackspace Hosting과협업한사실을기술한적이있다. 아래사진에서이중소켓, 프로세서전용 Zaius 마더보드디자인을잘살펴보면 2개의프로세서방열판바로왼쪽에 2개의 OpenCAPI 3 커넥터가보인다. 이 OpenCAPI 포트는마더보드왼쪽의 PCIe Gen4 슬롯을통해전원이공급되는액셀러레이터보드에직접케이블로연결할수있다. PCIe Gen4도빠르지만 OpenCAPI 3는훨씬더빠르다.
T IRIAS Research Google과 Rackspace가 설계한 IBM POWER9 기반 Zauis 시스템 디자인(왼쪽) 및 OpenCAPI 커넥터를 확대한 사진(오른쪽) SC17의 OpenCAPI 컨소시엄 부스에서는 OpenCAPI 포트가 내장된 여러 개의 FPGA 카드가 전시되었다. OpenCAPI 게이트웨이 카드(왼쪽) 및 OpenCAPI가 내장된 Mellanox Innova-2 FPGA 카드(오른쪽) 또한 SC17에서 Molex는 OpenCAPI가 연결된 FPGA 스토리지 액셀러레이터 카드 스택을 선보였다. 각 카드마다 8개의 NVMe 카드를 장착할 수 있다. NVMe 카드 하나의 용량이 최대 2TB이므로 스토리지 액셀러레이터 카드 하나당 최대 16TB의 데이터를 저장할 수 있다. 완전히 채워진 카드 4개에는 최대 64TB의 데이터를 저장할 수 있으며, 2U 섀시에 장착된 Zaius 마더보드, 고대역폭, OpenCAPI의 낮은 레이턴시 액세스가 함께 지원된다. 2U 섀시로서는 아주 빠른 스토리지이다.
Molex FPGA 스토리지 액셀러레이터 아키텍처 위 사진: A. Molex FPGA 스토리지 액셀러레이터 카드 B. 스토리지 액셀러레이터 백플레인 카드에 연결된 OpenCAPI 포트 C. 스토리지 액셀러레이터 백플레인 카드 D. 4개의 스토리지 액셀러레이터 카드 스택이 드러나 있는 전체 너비 섀시 뒷면 E. OpenCAPI(SlimSAS) 커넥터 근접 사진
요약 IBM 이 AC922 시스템을통해 POWER9 프로세서를기업고객이나 CSP 고객에게제공하고있다면, 이미 POWER9 프로세서를 Google 이나 Rackspace Hosting 같은몇몇대규모 CSP 에직접판매하는것으로볼수 있다. 이는이러한 CSP 고객이실환경에서의 POWER9 프로세서사용에대한평가를본격적으로시작하였음을 의미한다. 또한 OpenPOWER 의나머지에코시스템도 IBM 의 CSP 고객에의해평가되고있음을의미한다. 따라서현재로서는 AC922 플랫폼이 IBM 브랜드플랫폼으로출시된유일한제품이지만, 이를시작으로 시장에서 POWER9 의채택이이어질것으로보인다. 2018 년에 OpenPOWER 에코시스템에어떤변화가일어날지, 특히그로드맵의 "Partener Chip" 부분이 어떻게변화할지귀추가주목된다. 서드파티 OpenPOWER 프로세서가시장에진입하는때가되면상당히 성숙한에코시스템이마련되어있을것이다. -- 저자와 의직원은여기에언급된기업과관련하여어떠한지분도보유하고있지않습니다. 는반도체에서시스템 / 센서, 클라우드까지전자에코시스템전반의기업을연구하고이러한 기업에컨설팅을제공합니다. 저자 : Paul Teich,