NVIDIA H100: Recursos, vantagens e usos

Tabela de Conteúdos

A NVIDIA H100 é uma GPU de alto desempenho, desenvolvida especificamente para aplicações de IA, Deep Learning e HPC. A GPU H100 é baseada na inovadora arquitetura Hopper e opera com poderosos núcleos Tensor de quarta geração, que oferecem um desempenho acima da média. Graças à sua enorme capacidade de processamento, a H100 da NVIDIA é ideal para o treinamento de redes neurais complexas, workloads intensivos em dados na nuvem e simulações HPC complexas.

O que diferencia o desempenho da NVIDIA H100?

A NVIDIA H100 oferece um nível de desempenho excepcional, baseado na nova arquitetura Hopper. Esta combina a tecnologia Tensor-Core com um Transformer-Engine, para fornecer mais poder de computação e acelerar significativamente o treinamento de modelos de IA. A GPU H100 é oferecida pela NVIDIA em duas variantes: H100 SXM e H100 NVL.

As duas versões diferenciam-se tanto no seu formato quanto em desempenho, largura de banda de memória e conectividade. A H100 SXM é especialmente projetada para uso em servidores de alta densidade e em ambientes hyperscale. Por outro lado, a H100 NVL foi desenvolvida para slots PCIe, facilitando assim a integração da GPU em estruturas de servidores existentes. A tabela a seguir oferece uma visão detalhada das características de desempenho das duas variantes NVIDIA H100:

Característica de desempenho	NVIDIA H100 SXM	NVIDIA H100 NVL
FP64	34 TFLOPS	30 TFLOPS
FP64-Tensor-Core	67 TFLOPS	60 TFLOPS
FP32	67 TFLOPS	60 TFLOPS
TF32 Tensor Core	989 TFLOPS	835 TFLOPS
BFLOAT16 Tensor Core	1.979 TFLOPS	1.671 TFLOPS
FP16 Tensor Core	1.979 TFLOPS	1.671 TFLOPS
FP8 Tensor Core	3.958 TFLOPS	3.341 TFLOPS
INT8 Tensor Core	3.958 TOPS	3.341 TOPS
Memória da GPU	80 GB	94 GB
Largura de banda de memória da GPU	3,35 TB/s	3,9 TB/s
Decoder	7 NVDEC, 7 JPEG	7 NVDEC, 7 JPEG
Potência de Projeto Térmico (TDP)	700 W (configurável)	350-400 W (configurável)
Multi-Instance-GPU (MIG)	Até 7 MIGs com 10 GB cada	Até 7 MIGs com 12 GB cada
Fator de forma	SXM	PCIe com dois slots e resfriamento a ar
Interface	NVIDIA NVLink 900 GB/s, PCIe Gen5: 120 GB/s	NVIDIA NVLink: 600 GB/s, PCIe Gen5 128 GB/s
Opções de servidor	Parceiros NVIDIA HGX H100 e sistemas certificados NVIDIA com 4 ou 8 GPUs, NVIDIA DGX H100 com 8 GPUs	Parceiros e sistemas certificados NVIDIA com até 8 GPUs
NVIDIA AI Enterprise	Add-on	Incluído

Nota

TFLOPS (Tera Floating Point Operations per Second) é uma unidade de medida que descreve a velocidade de processamento de computadores (ponto flutuante). Um TFLOPS equivale a um trilhão de cálculos por segundo. O mesmo se aplica a unidade TOPS (Tera Operations Per Second), com a diferença de que estas são representadas por operações de números inteiros.

Quais são as vantagens e desvantagens da NVIDIA H100?

A NVIDIA H100 é uma das GPUs mais poderosas do mercado e vem equipada com várias tecnologias e funcionalidades avançadas. As principais vantagens da GPU H100 são:

Desempenho computacional muito alto: A H100 oferece um desempenho impressionante em FP8 e FP16 com Tensor Cores, tornando-a ideal para workloads complexos e intensivos em dados, como Large Language Models (LLMs). A combinação dos núcleos Tensor de quarta geração com a Transformer Engine pode aumentar significativamente a eficiência das operações de IA.
NVLink e NVSwitch: A NVIDIA H100 suporta NVLink de quarta geração, permitindo que várias GPUs de servidor se conectem com uma largura de banda bidirecional de 900 GB/s. Graças ao NVSwitch, também é possível escalar clusters de forma flexível.
Multi-Instance-GPU (MIG): O processador gráfico pode ser particionado em até sete instâncias de GPU independentes, permitindo a execução simultânea de várias cargas de trabalho com recursos dedicados. Dessa forma, a flexibilidade e a eficiência em ambientes de computação compartilhados são aprimoradas.
Confidential Computing: Graças à função de segurança integrada, a confidencialidade e a integridade dos dados são protegidas ao longo de toda a carga de trabalho.
Suporte para Memória HBM3 e PCIe Gen5: Dependendo da variante, a NVIDIA H100 oferece até 94 GB de memória HBM3 e uma largura de banda de até 3,9 TB/s, snedo uma das soluções de memória mais poderosas para cargas de trabalho intensivas em dados. Em combinação com PCIe Gen5, ela permite uma transferência de dados extremamente rápida.

No entanto, esse alto desempenho da NVIDIA H100 também representa uma desvantagem: o preço elevado. Dependendo da versão, as GPUs custam entre 30.000 e 40.000 euros. Portanto, as instâncias H100 também são relativamente caras em nuvem. Outra desvantagem é a disponibilidade limitada. Devido à alta demanda, há frequentes escassez de suprimentos e longos tempos de espera.

Para quais áreas de aplicação a GPU NVIDIA H100 é adequada?

A GPU NVIDIA H100 foi desenvolvida especificamente para cargas de trabalho intensivas em computação e é especialmente adequada para aplicações exigentes de IA e HPC. A visão geral a seguir destaca os principais campos de aplicação da GPU H100:

Treinamento de grandes modelos de IA: Graças ao seu alto poder de processamento, a GPU acelera significativamente o treinamento de modelos complexos de redes neurais e Large Language Models como GPT ou LLaMA.
Inferência de IA em tempo real: A H100 pode executar modelos de IA já treinados em velocidades máximas, o que se mostra vantajoso em áreas como processamento de linguagem e reconhecimento de imagens.
Nuvens e data centers: Os processadores gráficos formam a base de muitos servidores GPU, fornecendo a capacidade de processamento necessária para cargas de trabalho complexas.
High-performance computing (HPC): Cálculos científicos e simulações se beneficiam do alto desempenho FP64 dos processadores gráficos H100.
IA generativa: O H100 da NVIDIA é excelente para a geração de texto, imagem e vídeo com modelos de IA. A GPU permite um processamento rápido e eficiente de grandes conjuntos de dados, necessários para a IA generativa.
Análise de dados: As GPUs Hopper ajudam empresas de diferentes setores, como logística e finanças, com previsões e projeções precisas a partir de grandes volumes de dados.

Existem alternativas para a GPU NVIDIA H100?

Embora a NVIDIA H100 esteja entre as GPUs mais poderosas para IA e HPC, dependendo do caso de uso e do orçamento, podem ser oferecidas soluções alternativas, por exemplo, devido a uma maior eficiência de custo. Algumas das alternativas possíveis incluem:

NVIDIA A100: O modelo anterior também oferece um desempenho sólido para treinamento de IA, inferência e HPC, mas é mais econômico.
NVIDIA A30: O A30 combina alto desempenho com um preço acessível.
NVIDIA H200: A H200 é uma versão ligeiramente aprimorada da NVIDIA H100, que, por exemplo, possui uma largura de banda de memória ainda maior.
Intel Gaudi 3: O acelerador de IA oferece alta performance para inferência de IA.

Nota

Os processadores gráficos mais utilizados atualmente são apresentados, em detalhes, neste nosso artigo comparativo entre servidores GPU.

Este artigo foi útil?

GPU Server: O que é servidor GPU?

GPU Servers desempenham papeis centrais em diversos tipos de aplicações: sua capacidade de aproveitar o enorme poder de processamento das placas gráficas é útil em diferentes campos, como, por exemplo, em machine learning. Mas o que exatamente é um GPU Server, quais são suas…

Enciclopédia
Servidor GPU

Leia mais

Ranjit Karmakarshutterstock

O que é Hopper GPU?

Com Hopper GPUs, a NVIDIA estabelece novos padrões de aceleração de workloads complexos. Para oferecer desempenho máximo a aplicações de IA e HPC, a mais recente geração de GPUs foi equipada com inovações revolucionárias. Explicamos o que torna Hopper GPUs tão poderosas, para…

Enciclopédia
Servidor GPU

Leia mais

sdecoretShutterstock

Comparação entre servidores GPU

Servidores GPU são adequados a diferentes aplicações, por isso a escolha da GPU certa para o seu servidor depende muito das suas necessidades específicas. Comparamos os GPU servers mais recentes da NVIDIA, como H100 e A30, com Intel Gaudi 2 e Gaudi 3. Apresentamos características…

Comparativo
Servidor GPU

Leia mais

jijomathaidesignersshutterstock

Tudo sobre a arquitetura de GPU NVIDIA Blackwell

NVIDIA Blackwell é uma nova arquitetura de GPU que contém melhorias significativas de desempenho e eficiência. A microarquitetura Blackwell é especialmente promissora para aplicações de inteligência artificial e centros de dados, mas também dá novas possibilidades para jogadores…

Enciclopédia
Servidor GPU

Leia mais