NVIDIA Vera Rubin 플랫폼

NVIDIA Vera Rubin 플랫폼

차세대 AI의 시대를 열다

개요

에이전틱 AI 시대를 선도하다

NVIDIA Vera Rubin 플랫폼은 에이전틱 AI 및 고도의 추론 시대를 위해 구축되었으며, 복잡한 다단계 문제 해결과 대규모 롱 컨텍스트 워크플로우를 완벽하게 처리할 수 있도록 설계되었습니다. NVIDIA Vera Rubin 플랫폼은 통신 및 메모리 병목 현상을 제거해 추론 성능을 극대화함으로써, Blackwell 대비 와트당 토큰 처리량은 높이고 토큰당 비용은 낮추었습니다.

NVIDIA, Rubin으로 차세대 AI 시대의 포문을 열다

최첨단 플랫폼인 Rubin은 5대 기술 혁신을 통해 추론 및 에이전틱 AI 모델의 토큰당 비용을 낮춤으로써, 차세대 AI의 대중화를 앞당깁니다.

NVIDIA Vera Rubin, 차세대 AI 프론티어 개척

NVIDIA Vera Rubin 플랫폼은 세계 최대 규모의 AI 팩토리를 확장하기 위해 현재 7개의 새로운 칩을 본격 생산 중이며, AI의 차세대 최첨단 기술을 개척하고 있습니다.

독보적인 기술 혁신 살펴보기

트랜스포머 엔진

Rubin GPU에는 하드웨어 가속 적응형 압축 기능을 갖춘 새로운 트랜스포머 엔진이 탑재되어, 정확도를 유지하면서 NVFP4 성능을 향상시키며, 최대 50페타FLOPS 수준의 NVFP4 추론을 가능하게 합니다. NVIDIA Blackwell과 완전한 호환성을 갖춘 트랜스포머 엔진은 매끄러운 업그레이드를 보장하여, 기존에 최적화된 코드가 Rubin 플랫폼으로 손쉽게 이전되도록 합니다.

3세대 컨피덴셜 컴퓨팅

3세대 NVIDIA 컨피덴셜 컴퓨팅은 NVIDIA Vera Rubin NVL72를 통해 보안 기능을 풀랙 스케일로 확장합니다. 이 플랫폼은 36개의 NVIDIA Vera CPU, 72개의 NVIDIA Rubin GPU, 그리고 이를 원활하게 연결하는 NVIDIA NVLink™ 패브릭 전반에 걸쳐 통합된 신뢰 실행 환경을 조성합니다. 이 플랫폼은 CPU, GPU, NVLink 도메인 전반에 걸쳐 데이터 보안을 유지합니다. 규정 준수에 대한 암호학적 증명을 제공하는 어테스테이션 서비스를 통해, 대규모 확장성과 타협 없는 보호 기술을 결합하여 세계 최대 규모의 독점 모델, 학습 데이터 및 추론 워크로드를 보호합니다.

6세대 NVLink 및 NVLink Switch

6세대 NVLink는 72개의 NVIDIA Rubin GPU를 단일 성능 도메인으로 통합하는 NVIDIA의 고속 GPU 상호 연결 패브릭의 획기적인 성능 향상을 제공합니다. NVIDIA Blackwell의 성능을 두 배로 향상시킨 Rubin은 GPU당 3.6TB/s의 대역폭과 260TB/s의 저지연 연결성을 제공하여 더 빠른 통신을 가능하게 합니다. 집단 통신 시 네트워크 혼잡을 최대 50%까지 줄여주는 NVIDIA® SHARP™(계층적 집계 및 축소 프로토콜)과 결합된 이 차세대 인터커넥트는, 세계 최대 규모 모델의 학습 및 추론을 대규모 환경에서도 성능 저하 없이 가속화합니다.

2세대 RAS(신뢰성, 가용성, 서비스 가능성) 엔진

NVIDIA Vera Rubin 플랫폼은 첨단 안정성 기능을 갖춘 랙 스케일 복원력을 제공합니다. NVIDIA Rubin GPUs는 가동 중단 없이 사전 예방적 유지 관리와 실시간 상태 점검을 위한 전용 2세대 RAS 엔진을 갖추고 있으며, NVIDIA Vera CPU는 소형 아웃라인 압축 부착 메모리 모듈(SOCAMM) LPDDR5X 및 CPU 코어용 인시스템 테스트 기능을 통해 한층 강화된 서비스 편의성을 제공합니다. 이 랙은 모듈형 무케이블 트레이 설계를 도입하여 NVIDIA Blackwell 대비 18배 빠른 조립 및 유지보수가 가능하며, 지능형 회복 탄력성과 소프트웨어 정의 NVLink 라우팅을 결합해 중단 없는 운영을 보장하고 관리 오버헤드를 최소화합니다.

NVIDIA Vera CPU

NVIDIA Vera CPU는 가속 시스템 전반의 데이터 이동과 에이전틱 추론을 위해 설계되었으며, 컨피덴셜 컴퓨팅을 완벽하게 지원합니다. NVIDIA GPU와 원활하게 연동되거나, 분석, 클라우드, 오케스트레이션, 스토리지 및 고성능 컴퓨팅(HPC) 워크로드에 대해 독립적으로 작동합니다. Vera는 NVIDIA가 설계한 88개의 코어, 최대 1.2TB/s의 LPDDR5X 메모리 대역폭, NVIDIA Scalable Coherency Fabric을 결합하여, 완벽한 Arm® 호환성을 바탕으로 데이터 및 메모리 집약적인 워크로드에 예측 가능하고 에너지 효율적인 성능을 제공합니다. NVIDIA NVLink®-C2C 연결을 통해 CPU와 GPU 간의 고대역폭 코히어런트 메모리 액세스를 지원하며, 이를 통해 시스템 활용도와 효율성을 극대화합니다.

NVIDIA Vera Rubin 제품 살펴보기

NVIDIA Vera Rubin NVL72

NVIDIA Vera Rubin NVL72는 72개의 NVIDIA Rubin GPU, 36개의 NVIDIA Vera CPU, NVIDIA ConnectX®‑9 SuperNIC™ 카드, NVIDIA BlueField®‑4 DPU를 통합하며, 데이터 센터에서 NVIDIA LPX 랙과 함께 배치되어 빠르고 지연 시간이 낮은 추론을 제공합니다. 6세대 NVLink와 NVLink 스위치를 통해 랙 단위 플랫폼에서 지능을 확장하고, NVIDIA Quantum‑X800 InfiniBand와 NVIDIA Spectrum‑X™ 이더넷을 통해 수평 확장을 구현하여, 대규모 AI 산업 혁명을 구동합니다.

NVIDIA Groq 3 LPX

NVIDIA Groq 3 LPX는 에이전틱 AI의 대규모 컨텍스트와 지연 시간이 짧은 요구 사항을 위해 설계된 AI 추론 가속기입니다. 극한의 공동 설계를 통해 LPX는 NVIDIA Rubin GPU와 결합되어, 속도와 규모 사이의 트레이드오프를 없애 줍니다. 랙당 128GB SRAM, 초당 40페타바이트의 메모리 대역폭, 초당 640테라바이트의 스케일업 대역폭을 갖춘 Groq 3 LPX는 Vera Rubin 플랫폼에서의 추론 성능을 극대화합니다.

NVIDIA DGX Vera Rubin NVL72

NVIDIA DGX Vera Rubin NVL72는 NVIDIA Vera Rubin 플랫폼을 기반으로 구축된 즉시 배포할 수 있는 턴키 AI 인프라 솔루션을 기업에 제공합니다. 이 솔루션은 대규모 배포를 통해 가장 복잡한 AI 모델을 가속화할 수 있도록 특별히 제작되었습니다.

NVIDIA HGX Rubin NVL8

NVIDIA HGX™ Rubin NVL8은 8개의 NVIDIA Rubin GPU와 6세대 고속 NVLink 인터커넥트를 통합하여 데이터 센터를 가속 컴퓨팅 및 생성형 AI의 새로운 시대로 이끌어 나갑니다.

NVIDIA DGX Rubin NVL8

NVIDIA DGX™ Rubin NVL8은 8개의 NVIDIA Rubin GPU와 6세대 NVLink로 구동되는 수냉식 AI 시스템입니다. 모든 AI 워크로드의 학습, 추론 및 사후 학습 성능을 극대화하도록 설계되었습니다.

NVIDIA Vera Rubin 플랫폼 살펴보기

본 기술 심층 분석 보고서를 통해 NVIDIA Vera Rubin이 칩 단위가 아닌 데이터 센터 전체를 하나의 컴퓨팅 단위로 다루는 방식을 확인해 보시기 바랍니다. 이를 통해 대규모 지능형 서비스를 효율적이고 안전하며 예측 가능한 방식으로 구현하는 새로운 토대를 마련할 수 있습니다.