NVIDIA H100 je vrhunski grafični procesor, zasnovan posebej za umetno in­te­li­gen­co, globoko učenje in HPC apli­ka­ci­je. Grafični procesor H100 temelji na ino­va­tiv­ni ar­hi­tek­tu­ri Hopper in uporablja zmogljive Tensor Cores četrte ge­ne­ra­ci­je, ki za­go­ta­vlja­jo izjemno zmo­glji­vost. Zaradi svoje ogromne računske zmo­glji­vo­sti je NVIDIA H100 idealen za uspo­sa­blja­nje kom­ple­ksnih ne­vron­skih mrež, obdelavo po­dat­kov­no in­ten­ziv­nih obre­me­ni­tev v oblaku in zapletene HPC si­mu­la­ci­je.

Kakšne so zna­čil­no­sti NVIDIA H100?

NVIDIA H100 ponuja izjemno raven zmo­glji­vo­sti, ki temelji na novi ar­hi­tek­tu­ri Hopper. Ta združuje teh­no­lo­gi­jo Tensor Core s trans­for­ma­tor­skim motorjem, da zagotovi večjo ra­ču­nal­ni­ško moč in znatno pospeši uspo­sa­blja­nje modelov umetne in­te­li­gen­ce. NVIDIA ponuja GPU H100 v dveh raz­li­či­cah, in sicer H100 SXM in H100 NVL.

Obe različici se raz­li­ku­je­ta po obliki, zmo­glji­vo­sti, pasovni širini po­mnil­ni­ka in po­ve­zlji­vo­sti. H100 SXM je namenjen predvsem za uporabo v stre­žni­kih z visoko gostoto in hi­per­ška­la­cij­skih okoljih. H100 NVL pa je bil zasnovan za PCIe-reže, kar olajša in­te­gra­ci­jo GPU v obstoječe stre­žni­ške strukture. V naslednji tabeli je podroben pregled zmo­glji­vo­stnih zna­čil­no­sti obeh različic NVIDIA H100:

Zna­čil­no­sti zmo­glji­vo­sti NVIDIA H100 SXM NVIDIA H100 NVL
FP64 34 TFLOPS 30 TFLOPS
FP64 Tensor Core 67 TFLOPS 60 TFLOPS
FP32 67 TFLOPS 60 TFLOPS
TF32 Tensor Core 989 TFLOPS 835 TFLOPS
BFLOAT16 Tensor Core 1.979 TFLOPS 1.671 TFLOPS
FP16 Tensor Core 1.979 TFLOPS 1.671 TFLOPS
FP8 Tensor Core 3.958 TFLOPS 3.341 TFLOPS
INT8 Tensor Core 3.958 TOPS 3.341 TOPS
GPU pomnilnik 80 GB 94 GB
Pasovna širina po­mnil­ni­ka GPU 3,35 TB/s 3,9 TB/s
Dekoder 7 NVDEC, 7 JPEG 7 NVDEC, 7 JPEG
Največja toplotna moč (TDP) 700 W (kon­fi­gu­ra­tiv­na) 350–400 W (kon­fi­gu­ri­ra­no)
Ve­čin­stanč­ni GPU (MIG) Do 7 MIG z 10 GB vsak Do 7 MIG-ov s po 12 GB
Oblika SXM PCIe z dvema režama in zračnim hlajenjem
Vmesnik NVIDIA NVLink 900 GB/s, PCIe Gen5: 120 GB/s NVIDIA NVLink: 600 GB/s, PCIe Gen5 128 GB/s
Možnosti strežnika Partnerji NVIDIA HGX H100 in sistemi z NVIDIA cer­ti­fi­ka­tom s 4 ali 8 GPU-ji, NVIDIA DGX H100 z 8 GPU-ji Partnerji in sistemi, cer­ti­fi­ci­ra­ni s strani NVIDIA, z do 8 gra­fič­ni­mi pro­ce­sor­ji
NVIDIA AI za podjetja Dodatek Vključeno
Note

TFLOPS (TeraFloatingPoint Ope­ra­ti­onsPerSecond) je enota za opi­so­va­nje hitrosti obdelave ra­ču­nal­ni­kov (plavajoča vejica). En TFLOPS ustreza eni bilijoni izračunov na sekundo. Enako velja za enoto TOPS (TeraOpe­ra­ti­onsPerSecond) – z razliko, da so tu pred­sta­vlje­ne ce­lo­šte­vil­ske operacije.

Kakšne so prednosti in slabosti NVIDIA H100?

NVIDIA H100 je eden naj­moč­nej­ših grafičnih pro­ce­sor­jev na trgu in je opremljen s šte­vil­ni­mi na­pre­dni­mi teh­no­lo­gi­ja­mi in funk­ci­ja­mi. Naj­po­memb­nej­še prednosti gra­fič­ne­ga pro­ce­sor­ja H100 so:

  • Zelo visoka računska moč: H100 ponuja izjemno zmo­glji­vost FP8 in FP16 Tensor Core, zaradi česar je idealen za kom­ple­ksne, po­dat­kov­no in­ten­ziv­ne delovne obre­me­ni­tve, kot so veliki jezikovni modeli (LLM). Kom­bi­na­ci­ja četrte ge­ne­ra­ci­je Tensor Core in trans­for­ma­tor­ske­ga motorja lahko znatno poveča učin­ko­vi­tost AI operacij.
  • NVLink in NVSwitch: NVIDIA H100 podpira četrto ge­ne­ra­ci­jo NVLink, ki omogoča po­ve­zo­va­nje več stre­žni­ških GPU-jev med seboj z dvosmerno pasovno širino 900 GB/s. Za­hva­lju­joč NVSwitch je mogoče tudi pri­la­go­dlji­vo skalirati ustrezne grozde.
  • Multi-instance GPU (MIG): GPU je mogoče razdeliti na do sedem ne­od­vi­snih GPU primerov, kar omogoča hkratno izvajanje več delovnih obre­me­ni­tev z namenski viri. To izboljša pri­la­go­dlji­vost in učin­ko­vi­tost v skupnih ra­ču­nal­ni­ških okoljih.
  • Zaupno ra­ču­nal­ni­štvo: Za­hva­lju­joč in­te­gri­ra­ni varnostni funkciji sta zaupnost in ce­lo­vi­tost podatkov zaščitena skozi celotno delovno obre­me­ni­tev.
  • Podpora za pomnilnik HBM3 in PCIe Gen5: Z do 94 GB po­mnil­ni­ka HBM3 in pasovno širino do 3,9 TB/s NVIDIA H100 ponuja eno naj­moč­nej­ših po­mnil­ni­ških rešitev za delovne obre­me­ni­tve z in­ten­ziv­no rabo podatkov. V kom­bi­na­ci­ji s PCIe Gen5 omogoča zelo hiter prenos podatkov.

Vendar se to izkaže za po­manj­klji­vost, saj se visoka zmo­glji­vost NVIDIA H100 odraža tudi v ceni. Glede na različico stanejo grafične kartice med 25.000 in 35.000 funtov. Instance H100 so zato tudi v oblačnih okoljih so­raz­mer­no drage. Druga po­manj­klji­vost je omejena raz­po­lo­žlji­vost. Zaradi velikega pov­pra­še­va­nja vedno prihaja do zastojev v dobavi in dolgih čakalnih dob.

Za katere apli­ka­ci­je je grafična kartica NVIDIA H100 najbolj primerna?

Grafična kartica NVIDIA GPU H100 je bila posebej razvita za računsko in­ten­ziv­ne delovne obre­me­ni­tve in je še posebej primerna za zahtevne apli­ka­ci­je AI in HPC. V na­sle­dnjem pregledu so prikazana ključna področja uporabe grafične kartice H100 GPU:

  • Uspo­sa­blja­nje velikih modelov umetne in­te­li­gen­ce: Zaradi svoje visoke računske moči GPU znatno pospeši uspo­sa­blja­nje modelov kom­ple­ksnih ne­vron­skih mrež in velikih je­zi­kov­nih modelov, kot sta GPT ali LLaMA.
  • AI sklepanje v realnem času: H100 lahko izvaja vnaprej uspo­so­blje­ne AI modele pri najvišjih hitrostih, kar je prednost na področjih, kot so obdelava govora in pre­po­zna­va­nje slik.
  • Oblak in po­dat­kov­ni centri: GPU-ji so osnova mnogih GPU-stre­žni­kov, saj za­go­ta­vlja­jo ra­ču­nal­ni­ško moč, potrebno za kom­ple­ksne delovne obre­me­ni­tve.
  • Visoko zmogljivo ra­ču­nal­ni­štvo (HPC): Znan­stve­ni izračuni in si­mu­la­ci­je iz­ko­ri­šča­jo visoko zmo­glji­vost FP64 grafičnih pro­ce­sor­jev H100.
  • Ge­ne­ra­tiv­na umetna in­te­li­gen­ca: NVIDIA H100 je idealna za ge­ne­ri­ra­nje besedila, slik in videov z modeli umetne in­te­li­gen­ce. GPU omogoča hitro in učin­ko­vi­to obdelavo velikih po­dat­kov­nih nizov, potrebnih za ge­ne­ra­tiv­no umetno in­te­li­gen­co.
  • Analiza podatkov: GPU Hopper podpirajo podjetja v različnih panogah, kot sta logistika in finance, pri izpeljavi natančnih napovedi in pred­vi­de­vanj iz velikih količin podatkov.

Kakšne so možne al­ter­na­ti­ve za grafično kartico H100?

Čeprav je NVIDIA H100 eden naj­moč­nej­ših grafičnih pro­ce­sor­jev za umetno in­te­li­gen­co in visoko zmogljivo ra­ču­nal­ni­štvo, so glede na na­memb­nost in proračun na voljo tudi al­ter­na­tiv­ne rešitve. Na primer zaradi večje stro­škov­ne učin­ko­vi­to­sti. Možne al­ter­na­ti­ve med drugim vklju­ču­je­jo:

  • NVIDIA A100: Predhodni model prav tako ponuja solidno zmo­glji­vost za uspo­sa­blja­nje AI, sklepanje in HPC, vendar je cenejši.
  • NVIDIA A30: A30 združuje visoko zmo­glji­vost in dostopno ceno.
  • NVIDIA H200: H200 je nekoliko iz­bolj­ša­na različica NVIDIA H100, ki ima še višjo pasovno širino po­mnil­ni­ka.
  • Intel Gaudi 3: Po­spe­še­val­nik umetne in­te­li­gen­ce za­go­ta­vlja visoko zmo­glji­vost za sklepanje umetne in­te­li­gen­ce.
Note

V našem članku, v katerem pri­mer­ja­mo stre­žni­ške grafične pro­ce­sor­je, po­drob­ne­je pred­sta­vlja­mo trenutno naj­po­go­ste­je upo­ra­blja­ne grafične pro­ce­sor­je.

Go to Main Menu