Hopper-gra­fiik­kapro­ses­so­rit edustavat NVIDIA:n uusinta su­ku­pol­vea korkean suo­ri­tus­ky­vyn gra­fiik­kapro­ses­so­rei­ta, jotka on suun­ni­tel­tu eri­tyi­ses­ti tekoälyä ja suur­te­ho­las­ken­taa (HPC) varten. Niissä on edis­tyk­sel­li­nen ark­ki­teh­tuu­ri ja ke­hit­ty­neet Tensor-ytimet, ja ne in­tegroi­vat useita in­no­va­tii­vi­sia tek­no­lo­gioi­ta mak­si­maa­li­sen te­hok­kuu­den saa­vut­ta­mi­sek­si. Hopper-gra­fiik­kapro­ses­so­rit sopivat erin­omai­ses­ti mo­nen­lai­siin työ­kuor­miin ja tukevat tekoälyn päättelyä, sy­vä­op­pi­mi­sen kou­lu­tus­ta, ge­ne­ra­tii­vis­ta tekoälyä ja paljon muuta.

Mikä on NVIDIA:n Hopper-gra­fiik­kapro­ses­so­rei­den ark­ki­teh­tuu­ri?

Nimi ”Hopper GPU” on peräisin Hopper-ark­ki­teh­tuu­ris­ta, joka on GPU-mik­roark­ki­teh­tuu­ri, joka muodostaa perustan korkean suo­ri­tus­ky­vyn gra­fiik­kapro­ses­so­reil­le ja on optimoitu tekoälyn työ­kuor­mil­le ja HPC-so­vel­luk­sil­le. Hopper GPU:t val­mis­te­taan TSMC:n 4 na­no­met­rin pro­ses­sil­la, ja niissä on yli 80 miljardia tran­sis­to­ria, mikä tekee niistä mark­ki­noi­den edis­ty­neim­piä gra­fiik­ka­kort­te­ja.

Hopper-ark­ki­teh­tuu­ris­sa NVIDIA yhdistää uusimman su­ku­pol­ven Tensor-ytimet viiteen uraa­uur­ta­vaan in­no­vaa­tioon: muuntaja-moottori, NVLink/NVSwitch/NVLink-kyt­kin­jär­jes­tel­mät, luot­ta­muk­sel­li­nen tie­to­jen­kä­sit­te­ly, toisen su­ku­pol­ven moni-instanssi-GPU:t (MIG) ja DPX-ohjeet. Näiden tek­no­lo­gioi­den ansiosta Hopper-gra­fiik­kapro­ses­so­rit saa­vut­ta­vat jopa 30-kertaisen AI-pää­tel­mien nopeuden edel­li­seen su­ku­pol­veen ver­rat­tu­na (perustuu NVIDIA:n Megatron 530B -chat­bot­tiin, joka on maailman kattavin ge­ne­ra­tii­vi­nen kie­li­mal­li).

Mitkä ovat Hopper-gra­fiik­kapro­ses­so­rei­den in­no­va­tii­vi­set omi­nai­suu­det?

Hopper-gra­fiik­kapro­ses­so­reis­sa on useita uusia omi­nai­suuk­sia, jotka pa­ran­ta­vat suo­ri­tus­ky­kyä, te­hok­kuut­ta ja skaa­lau­tu­vuut­ta. Esit­te­lem­me tär­keim­mät uutuudet alla:

  • Trans­for­mer-moottori: Trans­for­mer-moottorin avulla Hopper-GPU:t pystyvät kou­lut­ta­maan te­ko­ä­ly­mal­le­ja jopa yhdeksän kertaa nopeammin. Kie­li­mal­lien päät­te­ly­teh­tä­vis­sä GPU:t saa­vut­ta­vat jopa 30-kertaisen nopeuden edel­li­seen su­ku­pol­veen ver­rat­tu­na.
  • NVLink-kyt­kin­jär­jes­tel­mä: Neljännen su­ku­pol­ven NVLink tarjoaa kak­si­suun­tai­sen GPU-kais­tan­le­vey­den 900 GB/s, kun taas NVSwitch varmistaa H200-klus­te­rien paremman skaa­lau­tu­vuu­den. Tämä takaa, että te­ko­ä­ly­mal­le­ja, joissa on biljoonia pa­ra­met­re­ja, voidaan käsitellä te­hok­kaas­ti.
  • Luot­ta­muk­sel­li­nen tie­to­jen­kä­sit­te­ly: Hopper-ark­ki­teh­tuu­ri varmistaa, että tietosi, te­ko­ä­ly­mal­li­si ja al­go­rit­mi­si ovat suo­jat­tu­ja myös kä­sit­te­lyn aikana.
  • Multi-instance GPU (MIG) 2.0: Toisen su­ku­pol­ven MIG-tekniikka mah­dol­lis­taa yhden Hopper-GPU:n jakamisen jopa seit­se­mään eril­li­seen ins­tans­siin. Tämä mah­dol­lis­taa useiden hen­ki­löi­den sa­ma­nai­kai­sen eri työ­kuor­mien kä­sit­te­lyn ilman kes­ki­näi­siä häiriöitä.
  • DPX-ohjeet: DPX-ohjeiden avulla dy­naa­mi­ses­ti oh­jel­moi­dut al­go­rit­mit voidaan laskea jopa seitsemän kertaa nopeammin kuin Ampere-ark­ki­teh­tuu­rin GPU:illa.

Mihin käyt­tö­tar­koi­tuk­siin Hopper-gra­fiik­kapro­ses­so­rit sopivat?

Hopper-ark­ki­teh­tuu­riin pe­rus­tu­vat NVIDIA-gra­fiik­kapro­ses­so­rit on suun­ni­tel­tu mo­nen­lai­siin korkean suo­ri­tus­ky­vyn työ­kuor­miin. Hopper-gra­fiik­kapro­ses­so­rien pää­asial­li­set käyt­tö­alu­eet ovat: ¬

  • Pää­tel­mä­teh­tä­vät: GPU:t ovat alan johtavia rat­kai­su­ja tekoälyn pää­tel­mien tuot­ta­vaan käyttöön. Olipa kyseessä sitten suo­si­tus­jär­jes­tel­mät verk­ko­kau­pas­sa, lää­ke­tie­teel­li­nen diag­nos­tiik­ka tai re­aa­liai­kai­set ennusteet au­to­no­mi­sel­le aja­mi­sel­le, Hopper-GPU:t pystyvät kä­sit­te­le­mään valtavia määriä dataa nopeasti ja te­hok­kaas­ti.
  • Ge­ne­ra­tii­vi­nen tekoäly: Huip­pu­luo­kan GPU:t tarjoavat tar­vit­ta­van las­ken­ta­te­hon ge­ne­ra­tii­vi­sen tekoälyn työ­ka­lu­jen kou­lut­ta­mi­seen ja suo­rit­ta­mi­seen. Rin­nak­kaispro­ses­soin­ti mah­dol­lis­taa te­hok­kaam­mat laskelmat luoville teh­tä­vil­le, kuten tekstin, kuvien ja videoiden luo­mi­sel­le.
  • Sy­vä­op­pi­mi­sen koulutus: Suurella las­ken­ta­te­hol­laan Hopper-GPU:t ovat ihan­teel­li­sia suurten neu­ro­verk­ko­jen kou­lut­ta­mi­seen. Hopper-ark­ki­teh­tuu­ri lyhentää mer­kit­tä­väs­ti te­ko­ä­ly­mal­lien kou­lu­tus­ajo­ja.
  • Kes­kus­te­le­va tekoäly: Luon­nol­li­sen kielen kä­sit­te­lyyn (NLP) op­ti­moi­dut Hopper-gra­fiik­kapro­ses­so­rit ovat ihan­teel­li­sia te­ko­ä­ly­poh­jai­sil­le kie­li­jär­jes­tel­mil­le, kuten vir­tu­aa­lias­sis­ten­til­le ja te­ko­ä­ly­poh­jai­sil­le chat­bo­teil­le. Ne no­peut­ta­vat suurten te­ko­ä­ly­mal­lien kä­sit­te­lyä ja var­mis­ta­vat reagoivan vuo­ro­vai­ku­tuk­sen, joka voidaan in­tegroi­da sau­mat­to­mas­ti lii­ke­toi­min­tapro­ses­sei­hin, kuten tukeen.
  • Tietojen ana­ly­soin­ti ja big data: Hopper-GPU:t kä­sit­te­le­vät valtavia tie­to­mää­riä suurella no­peu­del­la ja no­peut­ta­vat mo­ni­mut­kai­sia laskelmia mas­sii­vi­sel­la rin­nak­kaispro­ses­soin­nil­la. Tämä mah­dol­lis­taa yri­tyk­sil­le big datan nopeamman ar­vioin­nin en­nus­tei­den te­ke­mi­sek­si ja oikeiden toi­men­pi­tei­den käyn­nis­tä­mi­sek­si.
  • Tiede ja tutkimus: Koska GPU:t on suun­ni­tel­tu HPC-so­vel­luk­siin, ne ovat ihan­teel­li­sia erittäin mo­ni­mut­kai­siin si­mu­laa­tioi­hin ja las­kel­miin. Hopper-GPU:ita käytetään esi­mer­kik­si astro­fy­sii­kas­sa, il­mas­to­mal­lin­nuk­ses­sa ja las­ken­nal­li­ses­sa kemiassa.

NVIDIA:n nykyiset mallit

NVIDIA H100: n ja NVIDIA H200:n julkaisun myötä yh­dys­val­ta­lai­nen yritys on tuonut mark­ki­noil­le kaksi Hopper-gra­fiik­kapro­ses­so­ria. Sen sijaan NVIDIA A30 perustuu edelleen aiempaan Ampere-ark­ki­teh­tuu­riin. Tek­ni­ses­ti katsoen H200 ei ole täysin uusi malli, vaan pi­kem­min­kin H100:n pa­ran­net­tu versio. Seu­raa­vas­sa yleis­kat­sauk­ses­sa esitetään näiden kahden gra­fiik­kapro­ses­so­rin tär­keim­mät erot:

  • Muisti ja kais­tan­le­veys: NVIDIA H100 on va­rus­tet­tu 80 Gt:n HBM3-muistilla, kun taas H200-GPU:ssa on 141 Gt:n HBM3e-muisti. H200 on myös selvästi edellä muistin kais­tan­le­vey­den suhteen: 4,8 Tt/s ver­rat­tu­na H100:n 2 Tt/s:iin.
  • Suo­ri­tus­ky­ky tekoälyn päät­te­lys­sä: Vertailun vuoksi NVIDIA H200 tarjoaa kak­sin­ker­tai­sen päät­te­ly­te­hon malleille, kuten LLaMA 2-70 B. Tämä mah­dol­lis­taa paitsi nopeamman kä­sit­te­lyn myös tehokkaan skaa­lau­tu­vuu­den.
  • HPC-so­vel­luk­set ja tie­teel­li­nen las­ken­ta­te­ho: H100 tarjoaa jo en­si­luok­kai­sen suo­ri­tus­ky­vyn mo­ni­mut­kai­sil­le las­kel­mil­le, mutta H200 ylittää sen. In­fe­rens­si­no­peus on jopa kak­sin­ker­tai­nen ja HPC-suo­ri­tus­ky­ky noin 20 pro­sent­tia korkeampi.
Siirry pää­va­lik­koon