NVIDIA H100: características, vantagens e áreas de aplicação

Tabela de Conteúdos

A NVIDIA H100 é uma GPU de alto desempenho, projetada especificamente para aplicações de IA, aprendizagem profunda e HPC. A GPU H100 baseia-se na inovadora arquitetura Hopper e conta com potentes núcleos Tensor de quarta geração, que oferecem um desempenho excecional. Graças à sua grande capacidade de cálculo, a NVIDIA H100 é ideal para treinar redes neurais complexas, cargas de trabalho na nuvem em que são geridos grandes volumes de dados e simulações exigentes de HPC.

Características da NVIDIA H100

A NVIDIA H100 oferece um nível de desempenho excecional baseado na inovadora arquitetura Hopper, que combina a tecnologia Tensor Core com um motor Transformer para aumentar a capacidade de cálculo e acelerar significativamente o treino de modelos de IA. A GPU H100 está disponível em duas versões: H100 SXM e H100 NVL.

As duas versões diferem em formato, desempenho, largura de banda de memória e conectividade. O H100 SXM foi projetado principalmente para servidores de alta densidade e ambientes hiperescaláveis. Por outro lado, o H100 NVL é otimizado para slots PCIe, o que facilita a sua integração em infraestruturas de servidores existentes. A tabela a seguir oferece uma análise detalhada das características de ambas as versões do NVIDIA H100:

Característica	NVIDIA H100 SXM	NVIDIA H100 NVL
FP64	34 TFLOPS	30 TFLOPS
Núcleo Tensor FP64	67 TFLOPS	60 TFLOPS
FP32	67 TFLOPS	60 TFLOPS
Núcleo Tensor TF32	989 TFLOPS	835 TFLOPS
Núcleo Tensor BFLOAT16	1979 TFLOPS	1671 TFLOPS
Núcleo Tensor FP16	1979 TFLOPS	1671 TFLOPS
Núcleo Tensor FP8	3958 TFLOPS	3341 TFLOPS
Núcleo Tensor INT8	3958 TOPS	3341 TOPS
Memória da GPU	80 GB	94 GB
Largura de banda da memória da GPU	3,35 TB/s	3,9 TB/s
Decodificador	7 NVDEC, 7 JPEG	7 NVDEC, 7 JPEG
Potência máxima de design térmico (TDP)	700 W (configurável)	350-400 W (configurável)
GPU de múltiplas instâncias (MIG)	Até 7 MIG com 10 GB cada	Até 7 MIG com 12 GB cada
Formato	SXM	PCIe de duas ranhuras com refrigeração a ar
Interface	NVIDIA NVLink 900 GB/s, PCIe Gen5: 120 GB/s	NVIDIA NVLink: 600 GB/s, PCIe Gen5 128 GB/s
Opções de servidor	Parceiros NVIDIA HGX H100 e sistemas certificados pela NVIDIA com 4 ou 8 GPUs, NVIDIA DGX H100 com 8 GPUs	Parceiros e sistemas certificados pela NVIDIA com até 8 GPUs
NVIDIA AI Enterprise	Complemento opcional	Incluído

Nota

TFLOPS (TeraFloatingPoint OperationsperSecond) é uma unidade que mede a velocidade de processamento de um computador em cálculos de ponto flutuante. Um TFLOP equivale a um trilhão de operações por segundo. De forma semelhante, a unidade TOPS (TeraOperationsperSecond) também mede o desempenho computacional, mas neste caso refere-se a operações com números inteiros em vez de cálculos em ponto flutuante.

Vantagens e desvantagens da NVIDIA H100

A NVIDIA H100 é uma das GPUs mais potentes do mercado e conta com múltiplas tecnologias e funções avançadas. Estas são algumas das suas principais vantagens:

Desempenho de cálculo excepcional: o H100 oferece um desempenho excepcional em operações com núcleos Tensor FP8 e FP16, tornando-o uma opção ideal para cargas de trabalho complexas e com grande volume de dados, como Modelos de Linguagem Extensos (LLM). Além disso, a combinação desses núcleos Tensor de quarta geração com o motor Transformer melhora significativamente a eficiência em operações de IA.
NVLink e NVSwitch: o NVIDIA H100 é compatível com NVLink de quarta geração, permitindo interligar várias GPUs dentro de um servidor com uma largura de banda bidirecional de 900 GB/s. Além disso, o NVSwitch facilita a escalabilidade de clusters.
GPU de múltiplas instâncias (MIG): o processador gráfico pode ser dividido em até sete instâncias independentes de GPU, permitindo a execução simultânea de várias cargas de trabalho com recursos dedicados. Isso otimiza a flexibilidade e a eficiência da GPU em ambientes de computação partilhados.
Computação confidencial: incorpora funções de segurança para proteger a confidencialidade e a integridade dos dados ao longo de todo o processamento das cargas de trabalho.
Memória HBM3 e compatibilidade com PCIe Gen5: com até 94 GB de memória HBM3 e uma largura de banda de até 3,9 TB/s, a NVIDIA H100 oferece uma das soluções de armazenamento mais avançadas para cargas de trabalho com grandes volumes de dados. Quando combinada com PCIe Gen5, permite transferências rápidas de dados.

No entanto, este alto desempenho da NVIDIA H100 tem o seu contraponto: um preço elevado. Dependendo do modelo, estas GPUs podem custar entre 30 000 e 40 000 euros (entre 35 000 e 45 000 dólares), o que também encarece significativamente a sua utilização em ambientes de nuvem em comparação com outras alternativas. A isso se soma outra desvantagem: a sua disponibilidade limitada. Devido à alta demanda, costumam ocorrer problemas de estoque e longos tempos de espera.

Em que áreas é utilizada a GPU NVIDIA H100?

A GPU NVIDIA H100 foi projetada especificamente para cargas de trabalho de computação intensiva e se destaca em aplicações exigentes de inteligência artificial (IA) e computação de alto desempenho (HPC). A tabela a seguir resume suas principais áreas de uso.

Treinamento de modelos de IA em grande escala: graças ao seu grande poder de processamento, esta GPU acelera significativamente o treinamento de redes neurais complexas e Modelos de Linguagem Extensos (LLM), como GPT ou LLaMA.
Inferência de IA em tempo real: a H100 executa modelos de IA já treinados em altas velocidades, o que é uma vantagem em áreas como processamento de linguagem e reconhecimento de imagens.
Ambientes de nuvem e centros de dados: estes processadores gráficos são a base de vários servidores GPU, fornecendo a potência necessária para cargas de trabalho complexas.
Computação de alto desempenho (HPC): os cálculos científicos e as simulações beneficiam do alto desempenho FP64 dos processadores gráficos H100.
IA generativa: a NVIDIA H100 é uma ferramenta perfeita para gerar texto, imagens e vídeos com modelos de IA. O seu design permite processar grandes volumes de dados de forma rápida e eficiente, algo fundamental para a IA generativa.
Análise de dados: com as GPUs Hopper, empresas de setores como logística ou finanças podem extrair previsões e prognósticos precisos a partir de grandes quantidades de dados.

Quais são as alternativas à GPU H100?

Embora a NVIDIA H100 seja uma das GPUs mais potentes para IA e HPC, dependendo do orçamento ou das necessidades, pode haver soluções alternativas mais adequadas, especialmente no que diz respeito à rentabilidade. Algumas delas são:

NVIDIA A100: embora seja o modelo anterior, continua a oferecer um desempenho sólido para treino em IA, inferência, bem como para HPC, com um custo mais acessível.
NVIDIA A30: o A30 combina alto desempenho com um preço competitivo.
NVIDIA H200: uma versão otimizada da NVIDIA H100, com melhorias como maior largura de banda de memória.
Intel Gaudi 3: um acelerador de IA projetado para oferecer grande desempenho em tarefas de inferência de IA.

Nota

No nosso guia“Comparativa de GPU para servidores”, falamos mais detalhadamente sobre os processadores gráficos mais populares atualmente.

O que é uma GPU Hopper?

A NVIDIA estabeleceu um novo padrão na aceleração de cargas de trabalho complexas com as suas GPUs Hopper. A última geração de GPUs incorpora inovações revolucionárias para oferecer o máximo desempenho em aplicações de IA e computação de alto desempenho (HPC). Descubra o que…

Comparação das melhores GPUs para servidores

Os servidores com GPU são ideais para inúmeras aplicações. A escolha da GPU adequada para o seu servidor depende em grande parte das suas necessidades específicas. Neste artigo, comparamos as mais recentes GPUs NVIDIA H100 e A30 com Intel Gaudi 2 e Gaudi 3, com uma análise…

Resumo da microarquitetura NVIDIA Blackwell

A NVIDIA Blackwell é uma nova arquitetura de GPU que oferece melhorias em desempenho e eficiência. A microarquitetura Blackwell é promissora para aplicações de inteligência artificial e centros de dados, mas também abre novas possibilidades para gamers e desenvolvedores. Neste…

NVIDIA H100: ca­rac­te­rís­ti­cas, vantagens e áreas de aplicação

Ca­rac­te­rís­ti­cas da NVIDIA H100

Vantagens e des­van­ta­gens da NVIDIA H100

Em que áreas é utilizada a GPU NVIDIA H100?

Quais são as al­ter­na­ti­vas à GPU H100?

NVIDIA H100: características, vantagens e áreas de aplicação

Características da NVIDIA H100

Vantagens e desvantagens da NVIDIA H100

Quais são as alternativas à GPU H100?