De Intel Gaudi 3 is een krachtige AI-ver­snel­ler die speciaal is ontworpen voor veel­ei­sen­de AI-workloads. Gaudi 3 is ver­vaar­digd met behulp van het 5-na­no­me­ter­pro­ces, heeft 64 tensor-kernen en biedt twee keer zoveel FP8-pres­ta­ties en vier keer zoveel AI-re­ken­kracht als zijn voor­gan­ger. Dit maakt Intel’s Gaudi 3 ideaal voor in­fe­ren­tie­ta­ken en het trainen van grote AI-modellen.

Wat zijn de pres­ta­tie­ken­mer­ken van Intel Gaudi 3?

Met Gaudi 3 zet Intel nieuwe normen op het gebied van pres­ta­ties en energie-ef­fi­ci­ën­tie. De AI-ver­snel­ler is gebaseerd op de ar­chi­tec­tuur van Gaudi 2, maar biedt aan­zien­lijk meer re­ken­kracht, een hogere ge­heu­gen­band­breed­te en een betere energie-ef­fi­ci­ën­tie. Het volgende overzicht vat de be­lang­rijk­ste pres­ta­tie­ken­mer­ken van Intel Gaudi 3 samen:

  • FP8-re­ken­kracht: De Gaudi 3 bereikt een FP8-re­ken­kracht van 1,835 PFLOPS. Zijn voor­gan­ger haalde iets meer dan 0,8 PFLOPS, wat betekent dat de pres­ta­ties voor FP8-be­re­ke­nin­gen meer dan ver­dub­beld zijn.
  • BF16-re­ken­kracht: Bij BF16-be­re­ke­nin­gen bereikt de Intel Gaudi 3 ook 1,835 PFLOPS, wat neerkomt op een ver­vier­vou­di­ging van de re­ken­kracht ten opzichte van de Gaudi 2.
  • Net­werk­band­breed­te: De bi­di­rec­ti­o­ne­le net­werk­band­breed­te is ver­dub­beld tot 1200 gigabit per seconde, waardoor snellere com­mu­ni­ca­tie tussen knoop­pun­ten in AI-clus­ter­sys­te­men mogelijk is.
  • HBM-ca­pa­ci­teit en band­breed­te: met zijn HBM-geheugen van 128 gigabyte biedt de Gaudi 3 50 procent meer ge­heu­gen­band­breed­te dan de vorige generatie. De HBM-band­breed­te van 3,7 terabyte per seconde komt overeen met een toename van 33 procent.
Opmerking

PFLOPS (PetaFloatingPoint Ope­ra­ti­onsperSecond) is een eenheid voor het be­schrij­ven van de ver­wer­kings­snel­heid van computers. De door IBM ont­wik­kel­de su­per­com­pu­ter ‘Roa­drun­ner’ was in 2008 de eerste die de PFLOP-barrière doorbrak.

De Intel Gaudi 3 heeft twee re­ken­chips (speciale re­ken­units) die 64 ten­sor­pro­cess­or­ker­nen en 8 MME’s (ma­trix­ver­me­nig­vul­di­gingsen­gi­nes voor pa­ral­lel­le ver­wer­king) bevatten. De 24 RDMA NIC-poorten, elk met 200 gigabit per seconde, zorgen voor snelle com­mu­ni­ca­tie via ge­stan­daar­di­seer­de ether­net­net­wer­ken.

Wat zijn de voor- en nadelen van Intel Gaudi 3?

Het gebruik van een AI-ver­snel­ler van de Gaudi 3-generatie biedt ver­schil­len­de voordelen. De be­lang­rijk­ste daarvan zijn:

  • Hoge re­ken­kracht: Met 1.835 PFLOPS aan FP8- en BF16-pres­ta­ties biedt Intel’s Gaudi 3 geweldige pres­ta­ties die ver­ge­lijk­baar zijn met het niveau van de veel duurdere NVIDIA H100. Volgens een pers­be­richt van Intel presteert de eigen AI-ver­snel­ler op sommige gebieden zelfs beter dan het vlag­gen­schip van NVIDIA.
  • Hoge energie-ef­fi­ci­ën­tie: De Gaudi 3 AI-ver­snel­lers worden ver­vaar­digd met behulp van het 5-na­no­me­ter­pro­ces (door TSMC), wat een hogere ver­mo­gens­dicht­heid mogelijk maakt. Dit ver­min­dert het stroom­ver­bruik en verlaagt de be­drijfs­kos­ten in da­ta­cen­ters.
  • Kos­ten­ef­fec­tie­ve AI-schaal­baar­heid: met Intel Gaudi 3 kunnen systemen flexibel verticaal en ho­ri­zon­taal worden geschaald, wat vooral voordelig is voor complexe im­ple­men­ta­ties.
  • On­der­steu­ning voor open stan­daar­den: Aangezien Gaudi 3 open stan­daar­den on­der­steunt, kunnen de AI-ac­ce­le­ra­tors flexibel worden ge­ïn­te­greerd in bestaande IT-in­fra­struc­tu­ren. Dit maakt bedrijven on­af­han­ke­lij­ker in hun keuze van AI-platforms.

De AI-ver­snel­lers hebben echter ook op­val­len­de nadelen. Hoewel de Intel Gaudi 3 eer­ste­klas pres­ta­ties levert, bieden de high-end chips van NVIDIA over het algemeen nog betere pres­ta­ties. Waarom is dit be­lang­rijk? Omdat bedrijven die actief zijn op het gebied van AI tot nu toe de neiging hadden om te kiezen voor de krach­tig­ste oplossing in plaats van de meest kos­ten­ef­fi­ci­ën­te. Als gevolg daarvan is de Intel Gaudi 3 minder gangbaar dan AI-ver­snel­lers van NVIDIA, waarvan het eco­sys­teem pro­fi­teert van brede on­der­steu­ning door AI-ont­wik­ke­lings­teams.

Voor welke toe­pas­sings­ge­bie­den is Intel Gaudi 3 het meest geschikt?

Intel Gaudi 3 is speciaal ont­wik­keld voor re­ken­in­ten­sie­ve AI-workloads en is bijzonder geschikt voor in­fe­ren­tie­ta­ken die een hoge pa­ral­lel­le ver­wer­king en ge­heu­gen­band­breed­te vereisen. Typische workloads zijn onder meer tekst­ge­ne­ra­tie met grote taal­mo­del­len (LLM’s), beeld­ge­ne­ra­tie en spraak­syn­the­se. Dankzij de hoge in­fe­ren­tie­snel­heid en ge­op­ti­ma­li­seer­de FP8-ar­chi­tec­tuur maakt Gaudi 3 krachtige en ener­gie­zui­ni­ge ver­wer­king van ge­ne­ra­tie­ve AI-modellen mogelijk. Er zijn echter ook andere toe­pas­sings­ge­bie­den. Deze omvatten:

  • Ba­sis­trai­ning van grote AI-modellen: Gaudi 3 maakt het mogelijk om grote datasets efficiënt te verwerken. De AI-ver­snel­lers zijn daarom ideaal voor het vanaf nul trainen van AI-modellen, zoals neurale netwerken voor machine learning of trans­for­ma­tie­mo­del­len zoals GPT en LLaMA.
  • Beeld­ver­wer­king en com­pu­ter­vi­sie: dankzij zijn hoge re­ken­kracht kan de Intel Gaudi 3 complexe beeld­ge­ge­vens in realtime verwerken. Dit maakt de AI-ver­snel­ler ook geschikt voor toe­pas­sin­gen zoals be­vei­li­gings­be­wa­king of in­du­stri­ë­le au­to­ma­ti­se­ring.
  • GPU-servers en AI-clusters in da­ta­cen­ters: De Intel Gaudi 3 kan worden gebruikt voor GPU-servers om de re­ken­kracht te leveren die nodig is voor AI-training en in­fe­ren­tie­ta­ken.

Wat zijn de mogelijke al­ter­na­tie­ven voor Intel Gaudi 3?

Er zijn ver­schil­len­de AI-ver­snel­lers die als al­ter­na­tief voor Intel Gaudi 3 kunnen worden beschouwd. Een van de bekendste al­ter­na­tie­ve opties en con­cur­re­ren­de producten is de NVIDIA H100. Terwijl de Intel-ver­snel­ler ideaal is voor in­fe­ren­tie­toe­pas­sin­gen, biedt de H100 hoog­waar­di­ge pres­ta­ties voor AI- en da­ta­we­ten­schap­pe­lij­ke use cases. Een ander veel gekozen al­ter­na­tief voor Gaudi 3 is de NVIDIA A30, die hoge pres­ta­ties com­bi­neert met een be­taal­ba­re prijs.

Opmerking

In onze gids waarin server-GPU’s met elkaar worden ver­ge­le­ken, pre­sen­te­ren we de beste grafische pro­ces­sors voor gebruik in da­ta­cen­ters en krachtige servers.

Ga naar hoofdmenu