Hopper GPU’s ver­te­gen­woor­di­gen de nieuwste generatie krachtige grafische pro­ces­sors van NVIDIA, speciaal ontworpen voor AI en high-per­for­man­ce computing (HPC). Ze be­schik­ken over een ge­a­van­ceer­de ar­chi­tec­tuur met ge­a­van­ceer­de Tensor Cores en in­te­gre­ren meerdere in­no­va­tie­ve tech­no­lo­gie­ën voor maximale ef­fi­ci­ën­tie. Hopper GPU’s zijn ideaal voor een breed scala aan workloads en on­der­steu­nen AI-in­fe­ren­tie, deep learning-training, ge­ne­ra­tie­ve AI en meer.

Wat is het ar­chi­tec­tu­ra­le ontwerp van NVIDIA’s Hopper GPU’s?

De naam ‘Hopper GPU’ is afgeleid van de Hopper-ar­chi­tec­tuur, de GPU-mi­cro­ar­chi­tec­tuur die de basis vormt voor krachtige grafische pro­ces­sors en is ge­op­ti­ma­li­seerd voor AI-workloads en HPC-toe­pas­sin­gen. Hopper GPU’s worden door TSMC ge­pro­du­ceerd met behulp van het 4-na­no­me­ter­pro­ces en hebben meer dan 80 miljard tran­sis­tors, waardoor ze tot de meest ge­a­van­ceer­de grafische kaarten op de markt behoren.

Met de Hopper-ar­chi­tec­tuur com­bi­neert NVIDIA de nieuwste generatie Tensor Cores met vijf baan­bre­ken­de in­no­va­ties: trans­for­mer engine, NVLink/NVSwitch/NVLink-scha­ke­laar­sys­te­men, ver­trou­we­lij­ke computing, tweede generatie multi-instance GPU’s (MIG’s) en DPX-in­struc­ties. Dankzij deze tech­no­lo­gie­ën kunnen Hopper GPU’s tot 30 keer snellere AI-in­fe­ren­tie bereiken ten opzichte van de vorige generatie (gebaseerd op NVIDIA’s Megatron 530B-chatbot, ’s werelds meest uit­ge­brei­de ge­ne­ra­tie­ve taalmodel).

Wat zijn de in­no­va­tie­ve kenmerken van Hopper GPU’s?

Hopper GPU’s hebben ver­schil­len­de nieuwe functies die de pres­ta­ties, ef­fi­ci­ën­tie en schaal­baar­heid helpen ver­be­te­ren. Hieronder pre­sen­te­ren we de be­lang­rijk­ste in­no­va­ties:

  • Trans­for­mer-engine: met behulp van de trans­for­mer-engine kunnen Hopper GPU’s AI-modellen tot negen keer sneller trainen. Voor in­fe­ren­tie­ta­ken op het gebied van taal­mo­del­len bereiken de GPU’s een ver­snel­ling die tot 30 keer hoger ligt dan die van de vorige generatie.
  • NVLink-scha­ke­laar­sys­teem: De vierde generatie NVLink levert een bi­di­rec­ti­o­ne­le GPU-band­breed­te van 900 GB/s, terwijl NVSwitch zorgt voor een betere schaal­baar­heid van H200-clusters. Dit zorgt ervoor dat AI-modellen met tril­joe­nen pa­ra­me­ters efficiënt kunnen worden verwerkt.
  • Ver­trou­we­lij­ke computing: de Hopper-ar­chi­tec­tuur zorgt ervoor dat uw gegevens, AI-modellen en al­go­rit­men ook tijdens de ver­wer­king worden beschermd.
  • Multi-instance GPU (MIG) 2.0: De tweede generatie MIG-tech­no­lo­gie maakt het mogelijk om een enkele Hopper GPU op te splitsen in maximaal zeven ge­ï­so­leer­de in­stan­ties. Hierdoor kunnen meerdere mensen te­ge­lij­ker­tijd ver­schil­len­de workloads verwerken zonder elkaar te hinderen.
  • DPX-in­struc­ties: Met DPX-in­struc­ties kunnen dynamisch ge­pro­gram­meer­de al­go­rit­men tot zeven keer sneller worden berekend dan met GPU’s van de Ampere-ar­chi­tec­tuur.

Voor welke ge­bruiks­si­tu­a­ties zijn Hopper GPU’s geschikt?

NVIDIA GPU’s op basis van de Hopper-ar­chi­tec­tuur zijn ontworpen voor een breed scala aan krachtige workloads. De be­lang­rijk­ste toe­pas­sings­ge­bie­den voor Hopper GPU’s zijn: ¬

  • In­fe­ren­tie­ta­ken: De GPU’s behoren tot de toon­aan­ge­ven­de op­los­sin­gen voor het pro­duc­tie­ve gebruik van AI-in­fe­ren­tie. Of het nu gaat om aan­be­ve­lings­sys­te­men in e-commerce, medische dia­gnos­tiek of realtime voor­spel­lin­gen voor autonoom rijden, Hopper GPU’s kunnen enorme hoe­veel­he­den gegevens snel en efficiënt verwerken.
  • Ge­ne­ra­tie­ve AI: De high-end GPU’s bieden de benodigde re­ken­kracht om tools met ge­ne­ra­tie­ve AI te trainen en uit te voeren. Pa­ral­lel­le ver­wer­king maakt ef­fi­ci­ën­te­re be­re­ke­nin­gen mogelijk voor creatieve taken zoals het genereren van tekst, af­beel­din­gen en video’s.
  • Deep learning-training: Met hun hoge re­ken­kracht zijn Hopper GPU’s ideaal voor het trainen van grote neurale netwerken. De Hopper-ar­chi­tec­tuur verkort de trai­nings­tij­den van AI-modellen aan­zien­lijk.
  • Con­ver­sa­ti­o­nal AI: Hopper GPU’s zijn ge­op­ti­ma­li­seerd voor na­tuur­lij­ke taal­ver­wer­king (NLP) en zijn ideaal voor AI-aan­ge­dre­ven taal­sys­te­men, zoals virtuele as­sis­ten­ten en AI-chatbots. Ze ver­snel­len de ver­wer­king van grote AI-modellen en zorgen voor res­pon­sie­ve in­ter­ac­tie die naadloos kan worden ge­ïn­te­greerd in be­drijfs­pro­ces­sen, zoals on­der­steu­ning.
  • Data-analyse en big data: Hopper GPU’s verwerken enorme hoe­veel­he­den data met hoge snelheid en ver­snel­len complexe be­re­ke­nin­gen door middel van massale pa­ral­lel­le ver­wer­king. Hierdoor kunnen bedrijven big data sneller evalueren om voor­spel­lin­gen te doen en de juiste maat­re­ge­len te nemen.
  • We­ten­schap en onderzoek: Omdat de GPU’s zijn ontworpen voor HPC-toe­pas­sin­gen, zijn ze ideaal voor zeer complexe si­mu­la­ties en be­re­ke­nin­gen. Hopper GPU’s worden bij­voor­beeld gebruikt in de as­tro­fy­si­ca, kli­maat­mo­del­le­ring en com­puta­ti­o­ne­le chemie.

Huidige modellen van NVIDIA

Met de release van de NVIDIA H100 en de NVIDIA H200 heeft het Ame­ri­kaan­se bedrijf twee Hopper GPU’s op de markt gebracht. De NVIDIA A30 is daar­en­te­gen nog steeds gebaseerd op de vorige Ampere-ar­chi­tec­tuur. Technisch gezien is de H200 geen volledig nieuw model, maar eerder een ver­be­ter­de versie van de H100. Het volgende overzicht belicht de be­lang­rijk­ste ver­schil­len tussen deze twee GPU’s:

  • Geheugen en band­breed­te: Terwijl de NVIDIA H100 is uitgerust met een 80 GB HBM3-geheugen, heeft de H200 GPU een HBM3e-geheugen met een ca­pa­ci­teit van 141 GB. De H200 loopt ook duidelijk voorop wat betreft ge­heu­gen­band­breed­te met 4,8 TB/s, ver­ge­le­ken met 2 TB/s voor de H100.
  • Pres­ta­ties voor AI-in­fe­ren­tie: Ter ver­ge­lij­king: de NVIDIA H200 biedt twee keer zoveel in­fe­ren­tie­pres­ta­ties voor modellen zoals LLaMA 2-70 B. Dit maakt niet alleen een snellere ver­wer­king mogelijk, maar ook een ef­fi­ci­ën­te schaal­baar­heid.
  • HPC-toe­pas­sin­gen en we­ten­schap­pe­lijk com­pu­ter­ge­bruik: De H100 biedt al eer­ste­klas pres­ta­ties voor complexe be­re­ke­nin­gen, die de H200 nog overtreft. De in­fe­ren­tie­snel­heid is tot twee keer zo hoog, de HPC-pres­ta­ties ongeveer 20 procent hoger.
Ga naar hoofdmenu