O que é uma GPU Hopper?

Tabela de Conteúdos

As GPUs com arquitetura Hopper, mais conhecidas como Hopper GPU, são a última geração de GPUs de alto desempenho da NVIDIA, projetadas especificamente para inteligência artificial (IA) e computação de alto desempenho (HPC), permitindo a escalabilidade de uma ampla variedade de cargas de trabalho. Elas são baseadas em uma arquitetura inovadora com poderosos núcleos Tensor e combinam várias tecnologias avançadas para alcançar a máxima eficiência. As Hopper GPU da NVIDIA são ideais para tarefas como inferência de IA, treino de aprendizagem profunda e inteligência artificial generativa.

A arquitetura das GPUs Hopper da NVIDIA

O termo “Hopper GPU” vem da arquitetura Hopper, uma microarquitetura de GPU que constitui a base desses processadores gráficos de alto desempenho. É otimizada para cargas de trabalho de inteligência artificial (IA) e aplicações de computação de alto desempenho (HPC). As Hopper GPU são fabricadas pela TSMC com tecnologia de 4 nanómetros e contam com 80 mil milhões de transístores, o que as coloca entre as placas gráficas mais avançadas do mercado.

Com a arquitetura Hopper, a NVIDIA combina a última geração de núcleos Tensor com cinco inovações principais: Transformer Engine, NVLink/NVSwitch/NVLink Switch, computação confidencial, GPU de múltiplas instâncias (MIG) de segunda geração e instruções DPX. Graças a essas tecnologias, as GPUs Hopper alcançam até 30 vezes mais velocidade em tarefas de inferência de IA em comparação com a geração anterior (de acordo com testes baseados no chatbot Megatron 530B da NVIDIA, o maior modelo de linguagem generativa do mundo).

As funções inovadoras das GPUs Hopper

As GPUs Hopper incorporam várias funcionalidades avançadas que melhoram o desempenho, a eficiência e a escalabilidade. A seguir, apresentamos as principais inovações:

Transformer Engine: esta tecnologia permite treinar modelos de inteligência artificial até nove vezes mais rápido. Em tarefas de inferência com modelos de linguagem, as GPUs Hopper alcançam uma aceleração de até 30 vezes em comparação com a geração anterior.
NVLink Switch System: a quarta geração do NVLink fornece uma largura de banda bidirecional de 900 GB/s entre GPUs, enquanto o NVSwitch melhora a escalabilidade dos clusters H200. Isso permite processar modelos de IA com trilhões de parâmetros de forma eficiente.
Computação confidencial: a arquitetura Hopper garante a segurança dos dados, modelos de IA e algoritmos, mesmo durante o seu processamento.
GPU de múltiplas instâncias (MIG) 2.0: a segunda geração desta tecnologia permite dividir uma GPU Hopper em até sete instâncias isoladas, permitindo que vários utilizadores executem cargas de trabalho simultaneamente sem interferências.
Instruções DPX: estas instruções otimizam o processamento de algoritmos programados dinamicamente e atingem uma velocidade até sete vezes maior do que com as GPUs de arquitetura Ampere.

Para que servem as GPUs Hopper?

As GPUs da NVIDIA baseadas na arquitetura Hopper são projetadas para cargas de trabalho de alto desempenho em diversas áreas. As suas principais aplicações incluem:

Inferência de IA: estas GPUs estão entre as soluções líderes para a implementação de modelos de inferência de inteligência artificial. São ideais para sistemas de recomendação em comércio eletrónico, diagnóstico médico ou previsões em tempo real para condução autónoma, pois podem processar grandes volumes de dados de forma rápida e eficiente.
Inteligência artificial generativa: as GPUs Hopper fornecem o poder de computação necessário para treinar e executar ferramentas de IA generativa. Graças ao processamento em paralelo, elas facilitam cálculos mais eficientes na geração de texto, imagens e vídeos.
Treino de aprendizagem profunda: o seu alto desempenho computacional torna-as ideais para treinar grandes redes neurais. A arquitetura Hopper reduz significativamente os tempos de treino de modelos de IA.
IA conversacional: graças à sua otimização para o processamento de linguagem natural (NLP), as GPUs Hopper são ideais para sistemas de conversação baseados em IA, como assistentes virtuais e chatbots de IA. Aceleram o processamento de modelos avançados e garantem interações fluidas que podem ser integradas em processos empresariais, como o atendimento ao cliente.
Análise de dados e big data: estas GPUs podem lidar com enormes volumes de dados a grande velocidade e acelerar cálculos complexos através do processamento paralelo em massa. Isto permite às empresas analisar dados massivos ou big data mais rapidamente para fazer previsões e tomar decisões estratégicas.
Ciência e investigação: por serem projetadas para aplicações de computação de alto desempenho (HPC), as GPUs Hopper são perfeitas para simulações e cálculos complexos. São utilizadas em campos como astrofísica, modelagem climática e química computacional.

Modelos atuais da NVIDIA

A NVIDIA lançou no mercado duas GPUs baseadas na arquitetura Hopper: a NVIDIA H100 e a NVIDIA H200. Por outro lado, a NVIDIA A30 continua a utilizar a arquitetura Ampere. A H200, no entanto, não é um modelo completamente novo, mas sim uma evolução da H100. A seguir, comparamos as suas principais diferenças:

Memória e largura de banda: a NVIDIA H100 possui 80 GB de memória HBM3, enquanto a H200 incorpora 141 GB de memória HBM3e. Além disso, a H200 oferece uma largura de banda maior de 4,8 TB/s em comparação com os 2 TB/s da H100.
Desempenho em inferência de IA: a NVIDIA H200 duplica o desempenho em inferência para modelos como o LLaMA 2-70B, permitindo maior velocidade de processamento e escalabilidade mais eficiente.
Aplicações HPC e cálculos científicos: a H100 já oferece um desempenho excepcional em cálculos complexos, mas a H200 supera-a com uma velocidade de inferência até duas vezes mais rápida e um desempenho em HPC 20% superior.