Hopper GPU-d on NVIDIA uusim põlvkond kõrge jõud­lu­sega graa­fi­ka­prot­ses­so­reid, mis on spet­siaal­selt loodud te­hisin­tel­lekti ja kõrge jõud­lu­sega arvutuste (HPC) jaoks. Need on va­rus­ta­tud tipp­ta­se­mel ar­hi­tek­tuuriga ja täius­ta­tud Tensor Cores’iga ning in­teg­ree­rivad mitmeid uuen­dus­likke teh­no­loo­giaid, et pakkuda mak­si­maal­set efek­tiiv­sust. Hopper GPU-d sobivad ideaal­selt mit­me­su­guste töö­koor­muste jaoks ning toetavad te­hisin­tel­lekti järeldusi, sügavõppe koolitust, ge­ne­ra­tiiv­set te­hisin­tel­lekti ja palju muud.

Milline on NVIDIA Hopper GPU-de ar­hi­tek­tuu­ri­line disain?

Nimi „Hopper GPU” on tuletatud Hopperi ar­hi­tek­tuu­rist, mis on GPU mik­ro­ar­hi­tek­tuur, mis moodustab kõrge jõud­lu­sega graa­fi­ka­prot­ses­so­rite aluse ja on op­ti­mee­ri­tud te­hisin­tel­lekti töö­koor­muste ja HPC ra­ken­duste jaoks. Hopperi GPU-d toodab TSMC 4-na­no­meet­ri­lise protsessi abil ja neis on üle 80 miljardi tran­sis­tori, mis teeb neist ühed kõige are­ne­nu­mad graa­fi­ka­kaar­did turul.

Hopperi ar­hi­tek­tuuriga ühendab NVIDIA viimase põlvkonna Tensor Cores’i viie mur­ran­gu­lise uuen­du­s­ega: trans­for­meri mootor, NVLink/NVSwitch/NVLink lü­li­tus­süs­tee­mid, kon­fi­dent­siaalne arvutus, teise põlvkonna mitme instantsi GPU-d (MIG-d) ja DPX-juhised. Need teh­no­loo­giad või­mal­da­vad Hopperi GPU-del saavutada kuni 30-kordse AI-jä­rel­duste kii­ren­duse võrreldes eelmise põlv­kon­naga (põhineb NVIDIA Megatron 530B chatbotil – maailma kõige kõi­ke­hõl­ma­va­mal ge­ne­ra­tiiv­sel kee­le­mu­de­lil).

Millised on Hopperi GPU-de uuen­dus­li­kud omadused?

Hopperi GPU-del on mitu uut funkt­siooni, mis aitavad parandada jõudlust, tõhusust ja ska­lee­ri­ta­vust. Allpool tut­vus­tame kõige olu­li­se­maid uuendusi:

  • Trans­for­mer-mootor: Trans­for­mer-mootori abil suudavad Hopper GPU-d treenida AI-mudeleid kuni üheksa korda kiiremini. Kee­le­mu­de­lite valdkonna jä­rel­duste tegemise üles­an­nete puhul saa­vu­ta­vad GPU-d kuni 30-kordse kii­ren­duse võrreldes eelmise põlv­kon­naga.
  • NVLink-lü­li­tus­süs­teem: Neljanda põlvkonna NVLink pakub ka­he­pool­set GPU ri­ba­laiust 900 GB/s, samas kui NVSwitch tagab H200-klastrite parema ska­lee­ri­ta­vuse. See tagab, et tril­jo­neid pa­ra­meetreid si­sal­da­vaid AI-mudeleid saab tõhusalt töödelda.
  • Kon­fi­dent­siaalne arvutus: Hopperi ar­hi­tek­tuur tagab, et teie andmed, AI-mudelid ja algo­rit­mid on ka tööt­le­mise ajal kaitstud.
  • Multi-instance GPU (MIG) 2.0: Teise põlvkonna MIG-teh­no­loo­gia võimaldab ühe Hopper GPU jagada kuni seitsmeks iso­lee­ri­tud ins­tant­siks. See võimaldab mitmel inimesel töötada sa­ma­aeg­selt erinevate töö­koor­mus­tega, ilma et nad üksteist segaksid.
  • DPX-juhised: DPX-juhised või­mal­da­vad dü­naa­mi­li­selt prog­ram­mee­ri­tud algoritme arvutada kuni seitse korda kiiremini kui Ampere ar­hi­tek­tuuri GPU-dega.

Milliste ka­su­tus­juh­tude jaoks Hopperi GPU-d sobivad?

Hopperi ar­hi­tek­tuu­ril põhinevad NVIDIA GPU-d on mõeldud mit­me­su­guste suure jõud­lu­sega töö­koor­muste jaoks. Hopperi GPU-de peamised ra­ken­dus­alad on: ¬

  • Jä­rel­duste tegemine: GPU-d on tööstuse juhtivad la­hen­dused te­hisin­tel­lekti jä­rel­duste pro­duk­tiiv­seks ka­su­ta­miseks. Olgu tegemist soo­vi­tus­süs­teemi­dega e-kau­ban­duses, me­dit­sii­ni­lise diag­nos­tika või au­to­noomse sõidu reaalajas prog­noo­si­dega, Hopperi GPU-d suudavad töödelda suuri and­me­hulki kiiresti ja tõhusalt.
  • Ge­ne­ra­tiivne AI: Kõr­ge­ta­se­me­li­sed GPU-d pakuvad vajalikku ar­vu­tus­võim­sust ge­ne­ra­tiivse AI-ga töö­riis­tade koo­li­ta­miseks ja käi­vi­ta­miseks. Pa­ral­leelne tööt­le­mine võimaldab tõ­hu­samaid arvutusi loo­min­gu­liste üles­an­nete jaoks, nagu teksti, pildi ja video ge­ne­ree­ri­mine.
  • Sügavõppe koolitus: oma suure ar­vu­tus­võim­su­sega on Hopperi GPU-d ideaalsed suurte neu­ro­võrk­ude koo­li­ta­miseks. Hopperi ar­hi­tek­tuur lühendab oluliselt AI-mudelite koo­li­tus­aega.
  • Vest­lus­lik AI: Hopper GPU-d on op­ti­mee­ri­tud loomuliku keele tööt­le­miseks (NLP) ja sobivad ideaal­selt AI-põhiste kee­le­süs­teemide jaoks, nagu vir­tuaal­sed as­sis­ten­did ja AI-chatbotid. Need kii­ren­da­vad suurte AI-mudelite tööt­le­mist ja tagavad rea­gee­riva suhtluse, mis on sujuvalt in­teg­ree­ri­tav äri­prot­ses­si­desse, nagu näiteks tugi.
  • Andmete analüüs ja suured and­me­hul­gad: Hopperi GPU-d töötlevad suuri and­me­hulki suure kiirusega ja kii­ren­da­vad keerukaid arvutusi massilise pa­ral­leelse tööt­le­mise abil. See võimaldab et­te­võ­te­tel suurt and­me­hulka kiiremini hinnata, et teha prognoose ja võtta õigeid meetmeid.
  • Teadus ja uuri­mis­töö: Kuna GPU-d on loodud HPC-ra­ken­duste jaoks, sobivad need ideaal­selt väga kee­ru­liste si­mu­lat­sioo­nide ja arvutuste jaoks. Hopper GPU-sid ka­su­ta­takse näiteks ast­ro­füü­si­kas, klii­ma­mu­de­lite loomisel ja ar­vu­tus­kee­mias.

NVIDIA praegused mudelid

NVIDIA H100 ja NVIDIA H200 turule toomisega on Ameerika Ühend­rii­ki­des asuv ettevõte tut­vus­ta­nud turule kahte Hopper GPU-d. Seevastu NVIDIA A30 põhineb endiselt eelmisel Ampere ar­hi­tek­tuu­ril. Teh­ni­li­selt ei ole H200 täiesti uus mudel, vaid pigem H100 täius­ta­tud versioon. Järgnev ülevaade toob esile nende kahe GPU peamised eri­ne­vu­sed:

  • Mälu ja ribalaius: NVIDIA H100 on va­rus­ta­tud 80 GB HBM3-mäluga, H200 GPU-l on aga 141 GB ma­hu­ta­vu­sega HBM3e-mälu. H200 on selgelt ees ka mälu ri­ba­laiuse poolest, mis on 4,8 TB/s võrreldes H100 2 TB/s-ga.
  • Te­hisin­tel­lekti jä­rel­duste tegemise jõudlus: võrdluses pakub NVIDIA H200 kaks korda suuremat jä­rel­duste tegemise jõudlust selliste mudelite puhul nagu LLaMA 2-70 B. See võimaldab mitte ainult kiiremat tööt­le­mist, vaid ka tõhusat ska­lee­ri­mist.
  • HPC-ra­ken­dused ja tea­dus­li­kud arvutused: H100 pakub juba es­ma­klas­si­list jõudlust kee­ru­liste arvutuste jaoks, mida H200 ületab. Jä­rel­duste tegemise kiirus on kuni kaks korda suurem, HPC-jõudlus umbes 20 protsenti suurem.
Go to Main Menu