Mis on Hopper GPU?
Hopper GPU-d on NVIDIA uusim põlvkond kõrge jõudlusega graafikaprotsessoreid, mis on spetsiaalselt loodud tehisintellekti ja kõrge jõudlusega arvutuste (HPC) jaoks. Need on varustatud tipptasemel arhitektuuriga ja täiustatud Tensor Cores’iga ning integreerivad mitmeid uuenduslikke tehnoloogiaid, et pakkuda maksimaalset efektiivsust. Hopper GPU-d sobivad ideaalselt mitmesuguste töökoormuste jaoks ning toetavad tehisintellekti järeldusi, sügavõppe koolitust, generatiivset tehisintellekti ja palju muud.
Milline on NVIDIA Hopper GPU-de arhitektuuriline disain?
Nimi „Hopper GPU” on tuletatud Hopperi arhitektuurist, mis on GPU mikroarhitektuur, mis moodustab kõrge jõudlusega graafikaprotsessorite aluse ja on optimeeritud tehisintellekti töökoormuste ja HPC rakenduste jaoks. Hopperi GPU-d toodab TSMC 4-nanomeetrilise protsessi abil ja neis on üle 80 miljardi transistori, mis teeb neist ühed kõige arenenumad graafikakaardid turul.
Hopperi arhitektuuriga ühendab NVIDIA viimase põlvkonna Tensor Cores’i viie murrangulise uuendusega: transformeri mootor, NVLink/NVSwitch/NVLink lülitussüsteemid, konfidentsiaalne arvutus, teise põlvkonna mitme instantsi GPU-d (MIG-d) ja DPX-juhised. Need tehnoloogiad võimaldavad Hopperi GPU-del saavutada kuni 30-kordse AI-järelduste kiirenduse võrreldes eelmise põlvkonnaga (põhineb NVIDIA Megatron 530B chatbotil – maailma kõige kõikehõlmavamal generatiivsel keelemudelil).
Millised on Hopperi GPU-de uuenduslikud omadused?
Hopperi GPU-del on mitu uut funktsiooni, mis aitavad parandada jõudlust, tõhusust ja skaleeritavust. Allpool tutvustame kõige olulisemaid uuendusi:
- Transformer-mootor: Transformer-mootori abil suudavad Hopper GPU-d treenida AI-mudeleid kuni üheksa korda kiiremini. Keelemudelite valdkonna järelduste tegemise ülesannete puhul saavutavad GPU-d kuni 30-kordse kiirenduse võrreldes eelmise põlvkonnaga.
- NVLink-lülitussüsteem: Neljanda põlvkonna NVLink pakub kahepoolset GPU ribalaiust 900 GB/s, samas kui NVSwitch tagab H200-klastrite parema skaleeritavuse. See tagab, et triljoneid parameetreid sisaldavaid AI-mudeleid saab tõhusalt töödelda.
- Konfidentsiaalne arvutus: Hopperi arhitektuur tagab, et teie andmed, AI-mudelid ja algoritmid on ka töötlemise ajal kaitstud.
- Multi-instance GPU (MIG) 2.0: Teise põlvkonna MIG-tehnoloogia võimaldab ühe Hopper GPU jagada kuni seitsmeks isoleeritud instantsiks. See võimaldab mitmel inimesel töötada samaaegselt erinevate töökoormustega, ilma et nad üksteist segaksid.
- DPX-juhised: DPX-juhised võimaldavad dünaamiliselt programmeeritud algoritme arvutada kuni seitse korda kiiremini kui Ampere arhitektuuri GPU-dega.
Milliste kasutusjuhtude jaoks Hopperi GPU-d sobivad?
Hopperi arhitektuuril põhinevad NVIDIA GPU-d on mõeldud mitmesuguste suure jõudlusega töökoormuste jaoks. Hopperi GPU-de peamised rakendusalad on: ¬
- Järelduste tegemine: GPU-d on tööstuse juhtivad lahendused tehisintellekti järelduste produktiivseks kasutamiseks. Olgu tegemist soovitussüsteemidega e-kaubanduses, meditsiinilise diagnostika või autonoomse sõidu reaalajas prognoosidega, Hopperi GPU-d suudavad töödelda suuri andmehulki kiiresti ja tõhusalt.
- Generatiivne AI: Kõrgetasemelised GPU-d pakuvad vajalikku arvutusvõimsust generatiivse AI-ga tööriistade koolitamiseks ja käivitamiseks. Paralleelne töötlemine võimaldab tõhusamaid arvutusi loominguliste ülesannete jaoks, nagu teksti, pildi ja video genereerimine.
- Sügavõppe koolitus: oma suure arvutusvõimsusega on Hopperi GPU-d ideaalsed suurte neurovõrkude koolitamiseks. Hopperi arhitektuur lühendab oluliselt AI-mudelite koolitusaega.
- Vestluslik AI: Hopper GPU-d on optimeeritud loomuliku keele töötlemiseks (NLP) ja sobivad ideaalselt AI-põhiste keelesüsteemide jaoks, nagu virtuaalsed assistendid ja AI-chatbotid. Need kiirendavad suurte AI-mudelite töötlemist ja tagavad reageeriva suhtluse, mis on sujuvalt integreeritav äriprotsessidesse, nagu näiteks tugi.
- Andmete analüüs ja suured andmehulgad: Hopperi GPU-d töötlevad suuri andmehulki suure kiirusega ja kiirendavad keerukaid arvutusi massilise paralleelse töötlemise abil. See võimaldab ettevõtetel suurt andmehulka kiiremini hinnata, et teha prognoose ja võtta õigeid meetmeid.
- Teadus ja uurimistöö: Kuna GPU-d on loodud HPC-rakenduste jaoks, sobivad need ideaalselt väga keeruliste simulatsioonide ja arvutuste jaoks. Hopper GPU-sid kasutatakse näiteks astrofüüsikas, kliimamudelite loomisel ja arvutuskeemias.
NVIDIA praegused mudelid
NVIDIA H100 ja NVIDIA H200 turule toomisega on Ameerika Ühendriikides asuv ettevõte tutvustanud turule kahte Hopper GPU-d. Seevastu NVIDIA A30 põhineb endiselt eelmisel Ampere arhitektuuril. Tehniliselt ei ole H200 täiesti uus mudel, vaid pigem H100 täiustatud versioon. Järgnev ülevaade toob esile nende kahe GPU peamised erinevused:
- Mälu ja ribalaius: NVIDIA H100 on varustatud 80 GB HBM3-mäluga, H200 GPU-l on aga 141 GB mahutavusega HBM3e-mälu. H200 on selgelt ees ka mälu ribalaiuse poolest, mis on 4,8 TB/s võrreldes H100 2 TB/s-ga.
- Tehisintellekti järelduste tegemise jõudlus: võrdluses pakub NVIDIA H200 kaks korda suuremat järelduste tegemise jõudlust selliste mudelite puhul nagu LLaMA 2-70 B. See võimaldab mitte ainult kiiremat töötlemist, vaid ka tõhusat skaleerimist.
- HPC-rakendused ja teaduslikud arvutused: H100 pakub juba esmaklassilist jõudlust keeruliste arvutuste jaoks, mida H200 ületab. Järelduste tegemise kiirus on kuni kaks korda suurem, HPC-jõudlus umbes 20 protsenti suurem.