NVIDIA H100 ir augstas klases GPU, kas iz­strā­dāts īpaši AI, dziļās apmācības un HPC lie­to­jum­prog­ram­mām. H100 GPU ir balstīts uz inovatīvo Hopper ar­hi­tek­tū­ru un izmanto jaudīgos ceturtās paaudzes Tensor Cores, lai no­dro­ši­nā­tu izcilu veikt­spē­ju. Pa­tei­co­ties mil­zī­ga­jai skait­ļo­ša­nas jaudai, NVIDIA H100 ir ideāli piemērots sarežģītu neironu tīklu apmācībai, datu in­ten­sī­vām mā­koņ­da­to­ša­nas darba slodzēm un sa­rež­ģī­tām HPC si­mu­lā­ci­jām.

Kādas ir NVIDIA H100 funkcijas?

NVIDIA H100 piedāvā izcilu veikt­spē­ju, kas balstīta uz jauno Hopper ar­hi­tek­tū­ru. Tā apvieno Tensor Core teh­no­lo­ģi­ju ar transfor­ma­to­ru dzinēju, lai no­dro­ši­nā­tu lielāku skait­ļo­ša­nas jaudu un ie­vē­ro­ja­mi pa­āt­ri­nā­tu AI modeļu apmācību. NVIDIA piedāvā H100 GPU divos variantos: H100 SXM un H100 NVL.

Abas versijas atšķiras gan pēc formas, gan pēc veikt­spē­jas, atmiņas joslas platuma un sa­vie­no­ja­mī­bas. H100 SXM ir gal­ve­no­kārt paredzēts lie­to­ša­nai augstas blīvuma serveros un hi­perska­las vidēs. Savukārt H100 NVL ir paredzēts PCIe slotiem, kas atvieglo GPU in­teg­rā­ci­ju esošajās serveru struk­tū­rās. Turp­mā­ka­jā tabulā sniegts de­ta­li­zēts pārskats par abu NVIDIA H100 variantu veikt­spē­jas īpašībām:

Veikt­spē­jas funkcija NVIDIA H100 SXM NVIDIA H100 NVL
FP64 34 TFLOPS 30 TFLOPS
FP64 Tensor Core 67 TFLOPS 60 TFLOPS
FP32 67 TFLOPS 60 TFLOPS
TF32 Tensor Core 989 TFLOPS 835 TFLOPS
BFLOAT16 Tensor Core 1979 TFLOPS 1671 TFLOPS
FP16 Tensor Core 1979 TFLOPS 1671 TFLOPS
FP8 Tensor Core 3958 TFLOPS 3341 TFLOPS
INT8 Tensor Core 3958 TOPS 3341 TOPS
GPU atmiņa 80 GB 94 GB
GPU atmiņas joslas platums 3,35 TB/s 3,9 TB/s
De­ko­dē­tājs 7 NVDEC, 7 JPEG 7 NVDEC, 7 JPEG
Maksimālā termiskā jauda (TDP) 700 W (kon­fi­gu­rē­jams) 350–400 W (kon­fi­gu­rē­jams)
Dau­dzin­stancu GPU (MIG) Līdz 7 MIG ar 10 GB katram Līdz 7 MIG ar 12 GB katram
Formāts SXM PCIe ar divām ligzdām un gaisa dzesēšanu
In­ter­feiss NVIDIA NVLink 900 GB/s, PCIe Gen5: 120 GB/s NVIDIA NVLink: 600 GB/s, PCIe Gen5 128 GB/s
Servera opcijas NVIDIA HGX H100 partneri un NVIDIA ser­ti­fi­cē­tas sistēmas ar 4 vai 8 GPU, NVIDIA DGX H100 ar 8 GPU Partneri un NVIDIA ser­ti­fi­cē­tas sistēmas ar līdz pat 8 GPU
NVIDIA AI uzņēmums Pa­pil­di­nā­jums Iekļauts
Note

TFLOPS (TeraFloatingPoint Ope­ra­tionsPerSecond) ir vienība, kas apraksta datoru apstrādes ātrumu (peldošais punkts). Viens TFLOPS atbilst vienam triljonam aprēķinu sekundē. Tas pats attiecas uz vienību TOPS (TeraOpe­ra­tionsPerSecond) – ar atšķirību, ka šeit tiek attēlotas veselo skaitļu ope­rā­ci­jas.

Kādas ir NVIDIA H100 priekš­ro­cī­bas un trūkumi?

NVIDIA H100 ir viens no jau­dī­gā­ka­jiem GPU tirgū, kas aprīkots ar daudzām modernām teh­no­lo­ģi­jām un funkcijām. H100 GPU galvenās priekš­ro­cī­bas ir šādas:

  • Ļoti augsta skait­ļo­ša­nas jauda: H100 piedāvā milzīgu FP8 un FP16 Tensor Core veikt­spē­ju, padarot to ideāli piemērotu sa­rež­ģī­tām, datu in­ten­sī­vām darba slodzēm, piemēram, lieliem valodas modeļiem (LLM). Ceturtās paaudzes Tensor Core un transfor­ma­to­ru dzinēja kom­bi­nā­ci­ja var ie­vē­ro­ja­mi pa­lie­li­nāt AI darbību efek­ti­vi­tā­ti.
  • NVLink un NVSwitch: NVIDIA H100 atbalsta ceturtās paaudzes NVLink, kas ļauj savienot vairākus serveru GPU ar div­vir­zie­nu joslas platumu 900 GB/s. Pa­tei­co­ties NVSwitch, ir iespējams arī elastīgi mērogot at­bil­sto­šos klasterus.
  • Dau­dzin­stancu GPU (MIG): GPU var sadalīt līdz pat septiņām ne­at­ka­rī­gām GPU instancēm, kas ļauj vien­lai­kus izpildīt vairākas darba slodzes ar at­vē­lē­tiem resursiem. Tas uzlabo elastību un efek­ti­vi­tā­ti kop­lie­to­ja­mās aprēķinu vidēs.
  • Kon­fi­den­ciā­la datu apstrāde: pa­tei­co­ties in­teg­rē­ta­jai drošības funkcijai, datu kon­fi­den­cia­li­tā­te un in­teg­ri­tā­te tiek aiz­sar­gā­ta visā darba slodzes laikā.
  • HBM3 atmiņa un PCIe Gen5 atbalsts: ar līdz pat 94 GB HBM3 atmiņas un joslas platumu līdz 3,9 TB/s NVIDIA H100 piedāvā vienu no jau­dī­gā­ka­jiem atmiņas ri­si­nā­ju­miem datu in­ten­sī­vām darba slodzēm. Kom­bi­nā­ci­jā ar PCIe Gen5 tas nodrošina ļoti ātru datu pārraidi.

Tomēr tas izrādās būt ne­lab­vē­līgs faktors, jo NVIDIA H100 augstā veikt­spē­ja at­spo­gu­ļo­jas arī cenā. Atkarībā no versijas, GPU izmaksas ir no 25 000 līdz 35 000 mārciņām. Tāpēc H100 instancēm ir sa­lī­dzi­no­ši augsta cena arī mākoņvidē. Vēl viens trūkums ir ie­ro­be­žo­tā pie­eja­mī­ba. Lielā pie­pra­sī­ju­ma dēļ pastāvīgi rodas piegādes šķēršļi un gari gai­dī­ša­nas laiki.

Kādām lie­to­jum­prog­ram­mām NVIDIA H100 GPU ir vis­pie­mē­ro­tā­kais?

NVIDIA GPU H100 ir īpaši iz­strā­dāts aprēķinu in­ten­sī­vām darba slodzēm un ir īpaši piemērots prasīgām AI un HPC lie­to­jum­prog­ram­mām. Turp­mā­ka­jā pārskatā ir parādītas galvenās H100 GPU lietojuma jomas:

  • Lielu AI modeļu apmācība: pa­tei­co­ties augstajai skait­ļo­ša­nas jaudai, GPU ie­vē­ro­ja­mi paātrina sarežģītu neironu tīklu un lielu valodas modeļu, piemēram, GPT vai LLaMA, modeļu apmācību.
  • Reāllaika AI se­ci­nā­ju­mi: H100 var darbināt iepriekš apmācītus AI modeļus ar maksimālu ātrumu, kas ir priekš­ro­cī­ba tādās jomās kā runas apstrāde un attēlu at­pa­zī­ša­na.
  • Mā­koņ­da­to­ša­nas un datu centri: GPU veido daudzu GPU serveru pamatu, no­dro­ši­not sa­rež­ģī­tiem darba uz­de­vu­miem ne­pie­cie­ša­mo skait­ļo­ša­nas jaudu.
  • Augstas veikt­spē­jas skait­ļo­ša­na (HPC): zi­nāt­nis­kie aprēķini un si­mu­lā­ci­jas gūst labumu no H100 grafikas procesoru augstās FP64 veikt­spē­jas.
  • Ģe­ne­ra­tī­vā AI: NVIDIA H100 ir ideāli piemērots teksta, attēlu un video ģe­ne­rē­ša­nai ar AI modeļiem. GPU nodrošina ātru un efektīvu lielu datu kopu apstrādi, kas ne­pie­cie­ša­ma ģe­ne­ra­tī­va­jai AI.
  • Datu analīze: Hopper GPU palīdz dažādu nozaru uz­ņē­mu­miem, piemēram, lo­ģis­ti­kas un finanšu nozarē, izdarīt precīzas prognozes un pa­re­dzē­ju­mus, iz­man­to­jot lielus datu apjomus.

Kādas ir ie­spē­ja­mās al­ter­na­tī­vas H100 GPU?

Lai gan NVIDIA H100 ir viens no jau­dī­gā­ka­jiem GPU ri­si­nā­ju­miem mākslīgā intelekta un augstas veikt­spē­jas skait­ļo­ša­nas jomā, atkarībā no lie­to­ša­nas gadījuma un budžeta var būt pieejami arī al­ter­na­tī­vi ri­si­nā­ju­mi. Piemēram, augstākas izmaksu efek­ti­vi­tā­tes dēļ. Ie­spē­ja­mie al­ter­na­tī­vie ri­si­nā­ju­mi cita starpā ietver:

  • NVIDIA A100: Priekš­gā­jē­ja modelis arī nodrošina stabilu veikt­spē­ju mākslīgā intelekta apmācībai, se­ci­nā­ju­miem un HPC, bet tas ir lētāks.
  • NVIDIA A30: A30 apvieno augstu veikt­spē­ju ar pieejamu cenu.
  • NVIDIA H200: H200 ir nedaudz uzlabota NVIDIA H100 versija, kurai ir vēl lielāka atmiņas joslas platums.
  • Intel Gaudi 3: AI pa­āt­ri­nā­tājs nodrošina augstu veikt­spē­ju AI se­ci­nā­ju­miem.
Note

Mūsu rakstā, kurā sa­lī­dzi­nām serveru GPU, sīkāk aprakstām pašlaik visbiežāk iz­man­to­tos grafikas pro­ce­so­rus.

Go to Main Menu