NVIDIA H100 on tipp­klassi GPU, mis on spet­siaal­selt loodud te­hisin­tel­lekti, sügavõppe ja HPC ra­ken­duste jaoks. H100 GPU põhineb uuen­dus­li­kul Hopperi ar­hi­tek­tuu­ril ja kasutab võimsaid neljanda põlvkonna Tensor Cores’i, et pakkuda era­kord­set jõudlust. Tänu oma tohutule ar­vu­tus­võim­su­sele on NVIDIA H100 ideaalne keerukate neu­ro­võrk­ude koo­li­ta­miseks, and­me­ma­hu­kate pilve töö­koor­muste ja kee­ru­liste HPC si­mu­lat­sioo­nide jaoks.

Millised on NVIDIA H100 omadused?

NVIDIA H100 pakub uuen­dus­liku Hopperi ar­hi­tek­tuuri alusel era­kord­set jõudlust. See ühendab Tensor Core teh­no­loo­gia trans­for­meri mootoriga, et pakkuda suuremat ar­vu­tus­võim­sust ja kii­ren­dada oluliselt te­hisin­tel­lekti mudelite koo­li­ta­mist. NVIDIA pakub H100 GPU-d kahes variandis: H100 SXM ja H100 NVL.

Need kaks versiooni erinevad üks­tei­sest nii vormi kui ka jõudluse, mälu ri­ba­laiuse ja ühen­du­vuse poolest. H100 SXM on mõeldud peamiselt ka­su­ta­miseks suure ti­he­du­sega ser­ve­ri­tes ja hü­per­skaala kesk­kon­da­des. H100 NVL on aga mõeldud PCIe pesadele, mis liht­sus­tab GPU in­teg­ree­ri­mist ole­mas­ole­va­tesse ser­ve­ri­struk­tuu­ri­desse. Järgnev tabel annab ük­sik­as­ja­liku ülevaate kahe NVIDIA H100 variandi jõud­lus­oma­dus­test:

Jõudlus NVIDIA H100 SXM NVIDIA H100 NVL
FP64 34 TFLOPS 30 TFLOPS
FP64 Tensor Core 67 TFLOPS 60 TFLOPS
FP32 67 TFLOPS 60 TFLOPS
TF32 Tensor Core 989 TFLOPS 835 TFLOPS
BFLOAT16 Tensor Core 1979 TFLOPS 1671 TFLOPS
FP16 Tensor Core 1979 TFLOPS 1671 TFLOPS
FP8 Tensor Core 3958 TFLOPS 3341 TFLOPS
INT8 ten­sori­tuum 3958 TOPS 3341 TOPS
GPU mälu 80 GB 94 GB
GPU mälu ribalaius 3,35 TB/s 3,9 TB/s
Dekooder 7 NVDEC, 7 JPEG 7 NVDEC, 7 JPEG
Mak­si­maalne soo­jus­di­sai­ni­võim­sus (TDP) 700 W (kon­fi­gu­ree­ri­tav) 350–400 W (kon­fi­gu­ree­ri­tav)
Mitme ins­tant­siga GPU (MIG) Kuni 7 MIG-i, igaüks 10 GB Kuni 7 MIG-i, igaüks 12 GB
Korpuse suurus SXM PCIe kahe pesaga ja õhuküte
Liides NVIDIA NVLink 900 GB/s, PCIe Gen5: 120 GB/s NVIDIA NVLink: 600 GB/s, PCIe Gen5 128 GB/s
Serveri valikud NVIDIA HGX H100 partnerid ja NVIDIA ser­ti­fit­see­ri­tud süsteemid 4 või 8 GPU-ga, NVIDIA DGX H100 8 GPU-ga Partnerid ja NVIDIA ser­ti­fit­see­ri­tud süsteemid kuni 8 GPU-ga
NVIDIA AI ettevõte Lisand Kõik
Note

TFLOPS (TeraFloatingPoint Ope­ra­tionsPerSecond) on ühik, millega kir­jel­da­takse arvutite tööt­le­mis­kii­rust (ujuv­ko­ma­ar­vud). Üks TFLOPS vastab tril­jo­nile ar­vu­tusele sekundis. Sama kehtib ka ühiku TOPS (TeraOpe­ra­tionsPerSecond) puhul, eri­ne­vu­seks on see, et siin on esindatud täisarvud.

Millised on NVIDIA H100 eelised ja puudused?

NVIDIA H100 on üks võim­sa­maid GPU-sid turul ja on va­rus­ta­tud mitmete täius­ta­tud teh­no­loo­gia­tega ja funkt­sioo­ni­dega. H100 GPU olu­li­se­mad eelised on:

  • Väga suur ar­vu­tus­võim­sus: H100 pakub suu­re­pä­rast FP8 ja FP16 Tensor Core jõudlust, mis teeb selle ideaal­seks kee­ru­liste, and­me­ma­hu­kate töö­koor­muste jaoks, nagu näiteks suured kee­le­mu­delid (LLM). Neljanda põlvkonna Tensor Core’ide ja trans­for­meri mootori kom­bi­nat­sioon võib oluliselt suu­ren­dada te­hisin­tel­lekti ope­rat­sioo­nide efek­tiiv­sust.
  • NVLink ja NVSwitch: NVIDIA H100 toetab neljanda põlvkonna NVLinki, mis võimaldab ühendada mitu serveri GPU-d omavahel ka­he­poolse ri­ba­laiu­sega 900 GB/s. Tänu NV­Switc­hile on võimalik vastavaid klastreid paind­li­kult ska­lee­rida.
  • Mitme instantsi GPU (MIG): GPU-d saab jagada kuni seitsmeks sõl­tu­ma­tuks GPU-ins­tant­siks, mis võimaldab mitme töö­koor­muse sa­ma­aeg­set täitmist spet­siaal­sete res­surs­si­dega. See parandab paind­lik­kust ja efek­tiiv­sust jagatud ar­vu­tus­kesk­kon­da­des.
  • Kon­fi­dent­siaalne arvutus: in­teg­ree­ri­tud tur­be­funkt­siooni abil on andmete kon­fi­dent­siaal­sus ja ter­vik­lik­kus kaitstud kogu töö­koor­muse vältel.
  • HBM3-mälu ja PCIe Gen5 tugi: kuni 94 GB HBM3-mäluga ja kuni 3,9 TB/s ri­ba­laiu­sega pakub NVIDIA H100 üht võimsamat mä­lu­la­hen­dust and­me­ma­hu­ka­tele töö­koor­mus­tele. Koos PCIe Gen5-ga võimaldab see väga kiiret and­meedas­tust.

See osutub aga eeliseks, kuna NVIDIA H100 kõrge jõudlus peegeldub ka hinnas. Sõltuvalt ver­sioo­nist maksavad GPU-d 25 000 kuni 35 000 naela. Seetõttu on H100-ins­tant­sid ka pil­ve­kesk­kon­da­des suh­te­li­selt kallid. Teine puudus on piiratud kät­te­saa­da­vus. Suure nõudluse tõttu esineb alati tar­ne­prob­leeme ja pikki ooteaegu.

Mil­lis­tele ra­ken­dus­tele sobib NVIDIA H100 GPU kõige paremini?

NVIDIA GPU H100 on spet­siaal­selt välja töötatud ar­vu­tus­ma­hu­kate töö­koor­muste jaoks ning sobib eriti hästi nõudlike AI- ja HPC-ra­ken­duste jaoks. Järgnev ülevaade näitab H100 GPU peamisi ra­ken­dus­vald­kondi:

  • Suurte AI-mudelite koolitus: tänu suurele ar­vu­tus­võim­su­sele kiirendab GPU oluliselt keerukate neu­ro­võrk­ude ja suurte kee­le­mu­de­lite, nagu GPT või LLaMA, mudelite koolitust.
  • Reaalajas AI jä­rel­da­mine: H100 suudab eelnevalt koo­li­ta­tud AI-mudeleid käitada mak­si­maal­sel kiirusel, mis on eeliseks sellistes vald­kon­da­des nagu kõ­ne­tööt­lus ja pil­di­tu­vas­tus.
  • Pilv ja and­me­kes­ku­sed: GPU-d moo­dus­ta­vad paljude GPU-serverite aluse, pakkudes kee­ru­liste töö­koor­muste jaoks vajalikku ar­vu­tus­võim­sust.
  • Kõrge jõud­lu­sega ar­vu­ta­mine (HPC): tea­dus­li­kud arvutused ja si­mu­lat­sioo­nid saavad kasu H100 graa­fi­ka­prot­ses­so­rite kõrgest FP64 jõud­lu­sest.
  • Ge­ne­ra­tiivne AI: NVIDIA H100 on ideaalne teksti, pildi ja video ge­ne­ree­ri­miseks AI-mu­de­li­tega. GPU võimaldab ge­ne­ra­tiivse AI jaoks vajalike suurte and­me­ko­gu­mite kiiret ja tõhusat tööt­le­mist.
  • Andmete analüüs: Hopperi GPU-d toetavad erinevate töös­tus­ha­rude, näiteks logistika ja rahanduse et­te­võt­teid, suu­re­ma­hu­lis­test andmetest täpsete prog­noo­side ja en­nus­tuste tegemisel.

Millised on H100 GPU või­ma­li­kud al­ter­na­tiivid?

Kuigi NVIDIA H100 on üks võim­sa­maid GPU-sid te­hisin­tel­lekti ja HPC jaoks, võivad sõltuvalt ka­su­tus­juh­tu­mist ja eelarvest olla saadaval ka al­ter­na­tiiv­sed la­hen­dused. Näiteks suurema ku­lu­tõ­hu­suse tõttu. Või­ma­li­kud al­ter­na­tiivid on muu hulgas järgmised:

  • NVIDIA A100: Eelmine mudel pakub samuti head jõudlust te­hisin­tel­lekti koo­li­ta­miseks, jä­rel­duste te­ge­miseks ja HPC-ks, kuid on odavam.
  • NVIDIA A30: A30 ühendab endas suure jõudluse ja tas­ku­ko­hase hinna.
  • NVIDIA H200: H200 on NVIDIA H100 veidi täius­ta­tud versioon, millel on veelgi suurem mälu ribalaius.
  • Intel Gaudi 3: AI kiirendi pakub AI jä­rel­duste te­ge­miseks kõrget jõudlust.
Note

Meie artiklis, kus võr­rel­dakse serveri GPU-sid, tut­vus­tame praegu kõige sa­ge­da­mini ka­su­ta­ta­vaid graa­fi­ka­prot­ses­so­reid ük­sik­as­ja­li­ku­malt.

Go to Main Menu