NVIDIA H100 on huip­pu­luo­kan GPU, joka on suun­ni­tel­tu eri­tyi­ses­ti tekoäly-, sy­vä­op­pi­mis- ja HPC-so­vel­luk­siin. H100 GPU perustuu in­no­va­tii­vi­seen Hopper-ark­ki­teh­tuu­riin ja käyttää te­hok­kai­ta neljännen su­ku­pol­ven Tensor-ytimiä poik­keuk­sel­li­sen suo­ri­tus­ky­vyn saa­vut­ta­mi­sek­si. Valtavan las­ken­ta­ka­pa­si­teet­tin­sa ansiosta NVIDIA:n H100 on ihan­teel­li­nen mo­ni­mut­kais­ten neu­ro­verk­ko­jen kou­lut­ta­mi­seen, da­tain­ten­sii­vi­siin pil­vi­pal­ve­lu­jen työ­kuor­miin ja mo­ni­mut­kai­siin HPC-si­mu­loin­tiin.

Mitkä ovat NVIDIA H100:n omi­nai­suu­det?

NVIDIA H100 tarjoaa poik­keuk­sel­li­sen suo­ri­tus­ky­vyn, joka perustuu uuteen Hopper-ark­ki­teh­tuu­riin. Se yhdistää Tensor Core -tekniikan ja muun­nin­moot­to­rin, mikä tarjoaa enemmän las­ken­ta­te­hoa ja nopeuttaa mer­kit­tä­väs­ti te­ko­ä­ly­mal­lien kou­lu­tus­ta. NVIDIA tarjoaa H100-gra­fiik­kapro­ses­so­ria kahdessa eri versiossa: H100 SXM ja H100 NVL.

Nämä kaksi versiota eroavat toi­sis­taan muo­dol­taan, suo­ri­tus­ky­vyl­tään, muis­ti­kais­tan­le­vey­del­tään ja lii­tet­tä­vyy­del­tään. H100 SXM on suun­ni­tel­tu en­si­si­jai­ses­ti käy­tet­tä­väk­si tiheästi pa­ka­tuis­sa pal­ve­li­mis­sa ja hy­persca­le-ym­pä­ris­töis­sä. H100 NVL puo­les­taan on suun­ni­tel­tu PCIe-paikoille, mikä helpottaa GPU:n in­tegroin­tia olemassa oleviin pal­ve­lin­ra­ken­tei­siin. Seu­raa­vas­sa tau­lu­kos­sa on yk­si­tyis­koh­tai­nen katsaus kahden NVIDIA H100 -mallin suo­ri­tus­ky­ky­omi­nai­suuk­siin:

Suo­ri­tus­ky­ky­omi­nai­suus NVIDIA H100 SXM NVIDIA H100 NVL
FP64 34 TFLOPS 30 TFLOPS
FP64 Tensor Core 67 TFLOPS 60 TFLOPS
FP32 67 TFLOPS 60 TFLOPS
TF32 Tensor Core 989 TFLOPS 835 TFLOPS
BFLOAT16-tensorin ydin 1 979 TFLOPS 1 671 TFLOPS
FP16-tensorin ydin 1 979 TFLOPS 1 671 TFLOPS
FP8-tensorin ydin 3 958 TFLOPS 3 341 TFLOPS
INT8-tensor-ydin 3 958 TOPS 3 341 TOPS
GPU-muisti 80 GB 94 GB
GPU-muistin kais­tan­le­veys 3,35 TB/s 3,9 TB/s
Dekooderi 7 NVDEC, 7 JPEG 7 NVDEC, 7 JPEG
Suurin läm­pö­suun­nit­te­lu­te­ho (TDP) 700 W (kon­fi­gu­roi­ta­vis­sa) 350–400 W (kon­fi­gu­roi­ta­vis­sa)
Monen ins­tans­sin GPU (MIG) Jopa 7 MIG:tä, kukin 10 Gt Jopa 7 MIG-ins­tans­sia, kukin 12 Gt
Muoto SXM PCIe, kaksi kort­ti­paik­kaa ja il­ma­jääh­dy­tys
Liitäntä NVIDIA NVLink 900 Gt/s, PCIe Gen5: 120 Gt/s NVIDIA NVLink: 600 Gb/s, PCIe Gen5 128 Gb/s
Pal­ve­lin­vaih­toeh­dot NVIDIA HGX H100 -kumppanit ja NVIDIA-ser­ti­fioi­dut jär­jes­tel­mät, joissa on 4 tai 8 GPU:ta, NVIDIA DGX H100, jossa on 8 GPU:ta Kumppanit ja NVIDIA-ser­ti­fioi­dut jär­jes­tel­mät, joissa on enintään 8 GPU:ta
NVIDIA AI -yritys Lisäosa Sisältyy
Huomio

TFLOPS (TeraFloatingPoint Ope­ra­tionsPerSecond) on yksikkö, jolla kuvataan tie­to­ko­nei­den pro­ses­soin­ti­no­peut­ta (liukuluku). Yksi TFLOPS vastaa yhtä biljoonaa las­ku­toi­mi­tus­ta se­kun­nis­sa. Sama pätee yksikköön TOPS (TeraOpe­ra­tionsPerSecond) – ero on siinä, että tässä kuvataan ko­ko­nais­lu­ku­las­ku­toi­mi­tuk­sia.

Mitkä ovat NVIDIA H100:n edut ja haitat?

NVIDIA H100 on yksi mark­ki­noi­den te­hok­kaim­mis­ta GPU:ista, ja se on va­rus­tet­tu lu­kui­sil­la edis­ty­neil­lä tek­no­lo­gioil­la ja toi­min­noil­la. H100 GPU:n tär­keim­mät edut ovat:

  • Erittäin suuri las­ken­ta­te­ho: H100 tarjoaa valtavan FP8- ja FP16-Tensor Core -suo­ri­tus­ky­vyn, mikä tekee siitä ihan­teel­li­sen mo­ni­mut­kai­siin, data-in­ten­sii­vi­siin työ­kuor­miin, kuten suuriin kie­li­mal­lei­hin (LLM). Neljännen su­ku­pol­ven Tensor Core -ytimien ja muuntaja-moottorin yh­dis­tel­mä voi mer­kit­tä­väs­ti lisätä tekoälyn toi­min­to­jen te­hok­kuut­ta.
  • NVLink ja NVSwitch: NVIDIA H100 tukee neljännen su­ku­pol­ven NVLinkiä, jonka avulla useita palvelin-GPU:ita voidaan liittää toisiinsa kak­si­suun­tai­sel­la 900 GB/s:n kais­tan­le­vey­del­lä. NVSwitc­hin ansiosta on myös mah­dol­lis­ta skaalata vastaavia klus­te­rei­ta jous­ta­vas­ti.
  • Multi-instance GPU (MIG): GPU voidaan jakaa jopa seit­se­mään it­se­näi­seen GPU-ins­tans­siin, mikä mah­dol­lis­taa useiden työ­kuor­mien sa­ma­nai­kai­sen suo­rit­ta­mi­sen omilla re­surs­seil­la. Tämä parantaa jous­ta­vuut­ta ja te­hok­kuut­ta jaetuissa las­ken­taym­pä­ris­töis­sä.
  • Luot­ta­muk­sel­li­nen las­ken­ta­te­ho: In­tegroi­dun suo­jauso­mi­nai­suu­den ansiosta tietojen luot­ta­muk­sel­li­suus ja eheys on suojattu koko työ­kuor­man ajan.
  • HBM3-muisti ja PCIe Gen5 -tuki: Jopa 94 Gt:n HBM3-muistilla ja jopa 3,9 Tt/s:n kais­tan­le­vey­del­lä NVIDIA H100 tarjoaa yhden te­hok­kaim­mis­ta muis­ti­rat­kai­suis­ta da­tain­ten­sii­vi­sil­le työ­kuor­mil­le. Yhdessä PCIe Gen5:n kanssa se mah­dol­lis­taa erittäin nopean tie­don­siir­ron.

Tämä osoit­tau­tuu kuitenkin haitaksi, sillä NVIDIA H100:n korkea suo­ri­tus­ky­ky heijastuu myös hintaan. Versiosta riippuen GPU:t maksavat 25 000–35 000 puntaa. H100-ins­tans­sit ovat siksi myös suh­teel­li­sen kalliita pil­vi­pal­ve­lu­ym­pä­ris­töis­sä. Toinen hait­ta­puo­li on ra­joi­tet­tu saatavuus. Suuren kysynnän vuoksi tar­jon­nas­sa on jat­ku­vas­ti pul­lon­kau­lo­ja ja pitkiä odo­tusai­ko­ja.

Mihin so­vel­luk­siin NVIDIA:n H100-gra­fiik­kapro­ses­so­ri sopii parhaiten?

NVIDIA GPU H100 on kehitetty eri­tyi­ses­ti las­ken­tain­ten­sii­vi­siin työ­kuor­miin ja sopii erityisen hyvin vaativiin tekoäly- ja HPC-so­vel­luk­siin. Seu­raa­vas­sa yleis­kat­sauk­ses­sa esitetään H100 GPU:n tär­keim­mät so­vel­lusa­lu­eet:

  • Suurten te­ko­ä­ly­mal­lien koulutus: Suuren las­ken­ta­te­hon­sa ansiosta GPU nopeuttaa mer­kit­tä­väs­ti mo­ni­mut­kais­ten neu­ro­verk­ko­jen ja suurten kie­li­mal­lien, kuten GPT:n tai LLaMA:n, mallien kou­lu­tus­ta.
  • Re­aa­liai­kai­nen tekoälyn päättely: H100 voi suorittaa esi­kou­lu­tet­tu­ja te­ko­ä­ly­mal­le­ja huip­pu­no­peu­del­la, mikä on etu esi­mer­kik­si pu­heen­kä­sit­te­lys­sä ja ku­van­tun­nis­tuk­ses­sa.
  • Pilvi- ja da­ta­kes­kuk­set: GPU:t muo­dos­ta­vat perustan monille GPU-pal­ve­li­mil­le tar­joa­mal­la mo­ni­mut­kai­siin työ­kuor­miin tar­vit­ta­van las­ken­ta­te­hon.
  • Suur­te­ho­las­ken­ta (HPC): Tie­teel­li­set laskelmat ja si­mu­laa­tiot hyötyvät H100-gra­fiik­kapro­ses­so­rei­den korkeasta FP64-suo­ri­tus­ky­vys­tä.
  • Ge­ne­ra­tii­vi­nen tekoäly: NVIDIA:n H100 on ihan­teel­li­nen tekstin, kuvien ja videoiden tuot­ta­mi­seen te­ko­ä­ly­mal­leil­la. GPU mah­dol­lis­taa ge­ne­ra­tii­vi­seen tekoälyyn tar­vit­ta­vien suurten tie­to­jouk­ko­jen nopean ja tehokkaan kä­sit­te­lyn.
  • Datan ana­ly­soin­ti: Hopper-GPU:t auttavat eri toi­mia­lo­jen yrityksiä, kuten lo­gis­tiik­ka- ja ra­hoi­tusa­lan yrityksiä, tekemään tarkkoja en­nus­tei­ta ja en­nus­tei­ta suurista da­ta­mää­ris­tä.

Mitkä ovat H100 GPU:n mah­dol­li­set vaih­toeh­dot?

Vaikka NVIDIA H100 on yksi te­hok­kaim­mis­ta GPU:ista tekoälyyn ja HPC:hen, käy­tet­tä­vis­sä voi olla vaih­toeh­toi­sia rat­kai­su­ja käyt­tö­tar­koi­tuk­ses­ta ja bud­je­tis­ta riippuen. Esi­mer­kik­si kor­keam­man kus­tan­nus­te­hok­kuu­den vuoksi. Mah­dol­li­sia vaih­toeh­to­ja ovat muun muassa:

  • NVIDIA A100: Edeltäjä malli tarjoaa myös vankan suo­ri­tus­ky­vyn tekoälyn kou­lu­tuk­seen, päät­te­lyyn ja HPC:hen, mutta se on edul­li­sem­pi.
  • NVIDIA A30: A30 yhdistää korkean suo­ri­tus­ky­vyn edul­li­seen hintaan.
  • NVIDIA H200: H200 on hieman pa­ran­net­tu versio NVIDIA H100:sta, ja siinä on entistä suurempi muis­ti­kais­tan­le­veys.
  • Intel Gaudi 3: Te­ko­ä­ly­kiih­dy­tin tarjoaa korkean suo­ri­tus­ky­vyn tekoälyn päät­te­lyyn.
Huomio

Esit­te­lem­me nykyisin ylei­sim­min käytetyt gra­fiik­kapro­ses­so­rit tarkemmin ar­tik­ke­lis­sam­me, jossa verrataan palvelin-GPU:ita.

Siirry pää­va­lik­koon