Transforme seu data center em uma fábrica de IA de alto desempenho com as Arquiteturas de Referência Empresarial da NVIDIA.
Visão Geral
As arquiteturas de referência empresarial da NVIDIA (RAs empresariais) permitem que as empresas projetem, implantem e escalem fábricas de IA de alto desempenho usando infraestrutura validada e repetível. Esses designs combinam computação certificada, rede de alta velocidade leste-oeste e norte-sul, ferramentas de observabilidade e software para garantir desempenho escalável, desde clusters de quatro nós até ambientes em escala empresarial.
Arquiteturas de Referência Empresarial
Um pacote abrangente de instruções para configurar clusters no data center agora está disponível.
Casos de Uso
Acelere cargas de trabalho de IA baseada em agentes, IA física, computação de alto desempenho (HPC) e simulação de IA com as arquiteturas de referência empresarial comprovadas da NVIDIA e os sistemas certificados pela NVIDIA de parceiros globais. As principais configurações de clusters de infraestrutura para implantar fábricas de IA empresarial são descritas abaixo.
A configuração do NVIDIA RTX PRO™ IA Factory foi projetada para um amplo espectro de workloads empresariais, incluindo IA generativa e baseada em agentes, análise de dados, computação visual e simulação de engenharia. As implantações são otimizadas em torno de pontos de design de 16 e 32 nós, fornecendo um equilíbrio ideal de desempenho, escalabilidade e eficiência de implantação. Projetados para aceleração universal de workloads em IA empresarial, simulação e computação visual, os servidores NVIDIA RTX PRO são otimizados para ambientes PCIe, tornando-os ideais para data centers com restrições de espaço, energia e resfriamento. Criados especificamente para cargas de trabalho de IA modernas, oferecem desempenho eficiente para IA baseada em agentes e inferência de grandes modelos de linguagem (LLM).
A configuração de alto desempenho do NVIDIA HGX AI Factory foi criada especificamente para treinamento e inferência de IA de vários nós em escala, aproveitando os sistemas NVIDIA HGX. Disponível em pontos de design de 32, 64 e 128 nós e compatível com a rede NVIDIA Spectrum-X, a arquitetura apresenta um design flexível e otimizado para trilhos que permite a integração eficiente em diversos layouts de rack, oferecendo desempenho de alta taxa de transferência e baixa latência. Fornece desempenho inovador para usuários avançados de IA executando as workloads mais exigentes, permite o treinamento e o ajuste de modelos em larga escala e acelera significativamente a inferência. Com precisão de última geração e interconexões ultrarrápidas, a solução alcança uma taxa de transferência de tokens até 15 vezes maior.
A configuração do NVIDIA NVL72 IA Factory foi projetada para treinar e implantar modelos de trilhões de parâmetros, oferecendo poder de computação em exaescala em um único rack. Criado para alta taxa de transferência de modelos, inferência de vários usuários e inferência em tempo real em escala, ele permite a próxima geração de inovação orientada por IA. Os pontos de design de implantação se concentram em configurações de quatro e oito racks. Criada em uma rede flexível e otimizada para trilhos, a arquitetura se adapta a diversos layouts de rack e designs de sistemas, oferecendo desempenho de alta largura de banda e baixa latência. A plataforma oferece saída excepcional de fábricas de IA com eficiência energética líder do setor e é impulsionada pelo NVIDIA NVLink™ de quinta geração, núcleos tensores FP4 e inovações térmicas avançadas.
Benefícios
Desbloqueie a infraestrutura de IA escalável e de alto desempenho com configurações comprovadas e prontas para parceiros.
Atenda às demandas intensivas de inferência de IA, ajuste fino e treinamento com arquiteturas que garantem a utilização total da GPU e a consistência de desempenho em clusters de vários nós.
Expanda sua infraestrutura com facilidade e garanta a implantação escalável e simplificada para até 128 nós. Crie a base para soluções completas com o design validado do NVIDIA Enterprise AI Factory, que aproveita nosso ecossistema de software.
Simplifique os processos de implantação e os designs eficientes, reduza a complexidade e o custo total de propriedade (TCO), enquanto reduz o tempo de geração de valor.
Siga padrões de design específicos e padronizados para alcançar uma operação consistente de uma instalação para outra, reduza a necessidade de suporte frequente e permita tempos de resolução mais rápidos.
Parceiros
Estamos orgulhosos de colaborar com os principais parceiros à medida que eles trazem Arquiteturas de Referência Empresarial e soluções de fábricas de IA ao mercado. Os designs endossados desses parceiros foram aprovados em nosso Design Review Board, oferecendo orientação que ganha nosso endosso em uma ou mais das seguintes categorias: infraestrutura, lógica de rede e software.
A arquitetura de referência de sistema operacional de IA Sovereignda da Palantir é baseada nos RAs NVIDIA Enterprise, testados e qualificados para executar o pacote completo de software da Palantir na infraestrutura de IA da NVIDIA com nossos parceiros de sistema globais. Essa arquitetura de IA soberana é crítica para clientes com workflows sensíveis à latência, requisitos de soberania de dados e alta distribuição geográfica. A arquitetura fornece às empresas controle total sobre seus dados, modelos de IA e aplicações.
Recursos
A NVIDIA criou uma fábrica de IA unificada para escalar workflows de IA Generativa e baseados em agentes em toda a empresa, garantindo segurança, desempenho e consistência. A plataforma é compatível com centenas de agentes de IA que aceleram a inovação, simplificam a engenharia de software e hardware e otimizam as operações da cadeia de suprimentos, reduzindo os tempos de planejamento em mais de 95% e alcançando décadas de trabalho de engenharia em apenas um ano.