Kas yra Hopper GPU?
Hopper GPU yra naujausios kartos NVIDIA aukštos kokybės grafikos procesoriai, specialiai sukurti dirbtiniam intelektui (AI) ir aukštos kokybės skaičiavimams (HPC). Šie procesoriai pasižymi pažangia architektūra su pažangiais Tensor Core procesoriais ir integruoja keletą novatoriškų technologijų, kad užtikrintų maksimalų efektyvumą. Hopper GPU yra idealūs įvairiems darbo krūviams, palaiko AI išvadų darymą, giluminio mokymosi treniruotes, generatyvinį AI ir dar daugiau.
Koks yra NVIDIA „Hopper“ GPU architektūros dizainas?
Pavadinimas „Hopper GPU“ kilęs iš Hopper architektūros, kuri yra GPU mikroarchitektūra, sudaranti aukštos našumo grafikos procesorių pagrindą ir optimizuota dirbtinio intelekto užduotims bei HPC programoms. Hopper GPU gamina TSMC, naudodama 4 nanometrų procesą, ir turi daugiau nei 80 milijardų tranzistorių, todėl tai yra vienos iš pažangiausių grafikos plokščių, esančių rinkoje.
Naudodama „Hopper“ architektūrą, „NVIDIA“ derina naujausios kartos „Tensor Cores“ su penkiomis novatoriškomis naujovėmis: transformatoriaus varikliu, „NVLink/NVSwitch/NVLink“ perjungimo sistemomis, konfidencialiu skaičiavimu, antros kartos daugiafunkciniais GPU (MIG) ir DPX instrukcijomis. Šios technologijos leidžia Hopper GPU pasiekti iki 30 kartų didesn į AI išvados pagreitinimą, palyginti su ankstesne karta (remiantis NVIDIA „Megatron 530B“ pokalbių robotu – išsamiausiu generatyviniu kalbos modeliu pasaulyje).
Kokios yra novatoriškos Hopper GPU savybės?
Hopper GPU turi keletą naujų funkcijų, kurios padeda pagerinti našumą, efektyvumą ir mastelį. Toliau pateikiame svarbiausias naujoves:
- Transformatoriaus variklis: transformatoriaus variklio pagalba „Hopper“ GPU gali mokyti AI modelius iki devynis kartus greičiau. Kalbos modelių srities išvadų užduočių atveju GPU pasiekia iki 30 kartų didesnį pagreitį nei ankstesnės kartos modeliai.
- NVLink jungiklių sistema: ketvirtos kartos NVLink užtikrina 900 GB/s dviejų krypčių GPU pralaidumą, o NVSwitch užtikrina geresnį H200 klasterių mastelio keitimą. Tai užtikrina, kad AI modeliai su trilijonais parametrų gali būti apdorojami efektyviai.
- Konfidencialus skaičiavimas: Hopper architektūra užtikrina, kad jūsų duomenys, AI modeliai ir algoritmai taip pat būtų apsaugoti apdorojimo metu.
- Daugiainstancinis GPU (MIG) 2.0: antros kartos MIG technologija leidžia vieną Hopper GPU padalyti į iki septynių izoliuotų instancų. Tai leidžia keliems žmonėms vienu metu apdoroti skirtingus darbo krūvius, netrukdant vieni kitiems.
- DPX instrukcijos: DPX instrukcijos leidžia dinamiškai programuotus algoritmus apskaičiuoti iki septynių kartų greičiau nei naudojant Ampere architektūros GPU.
Kokiems naudojimo atvejams tinka „Hopper“ GPU?
NVIDIA GPU, pagrįsti Hopper architektūra, yra sukurti įvairiems didelio našumo uždaviniams atlikti. Pagrindinės Hopper GPU taikymo sritys yra: ¬
- Išvadų darymo užduotys: GPU yra vienos iš pirmaujančių pramonės sprendimų, skirtų produktyviai naudoti AI išvadas. Nesvarbu, ar tai būtų rekomendacijų sistemos elektroninėje komercijoje, medicininė diagnostika ar realaus laiko prognozės autonominiam vairavimui, „Hopper“ GPU gali greitai ir efektyviai apdoroti didelius duomenų kiekius.
- Generatyvinė AI: aukščiausios klasės GPU suteikia reikiamą skaičiavimo galią generatyvinės AI įrankių mokymui ir vykdymui. Lygiagretus apdorojimas leidžia efektyviau atlikti kūrybines užduotis, pvz., tekstų, vaizdų ir vaizdo įrašų generavimą.
- Gilusis mokymasis: Dėl didelės skaičiavimo galios Hopper GPU yra idealios didelių neuroninių tinklų mokymui. Hopper architektūra žymiai sutrumpina AI modelių mokymo laiką.
- Konversacinė AI: Optimizuoti natūralios kalbos apdorojimui (NLP), Hopper GPU yra idealiai tinka AI valdomoms kalbos sistemoms, pvz., virtualiems asistentams ir AI pokalbių robotams. Jie pagreitina didelių AI modelių apdorojimą ir užtikrina greitą sąveiką, kuri gali būti sklandžiai integruota į verslo procesus, pvz., pagalbą.
- Duomenų analizė ir didieji duomenys: „Hopper“ GPU greitai apdoroja didelius duomenų kiekius ir pagreitina sudėtingus skaičiavimus, naudodami masinį lygiagretų apdorojimą. Tai leidžia įmonėms greičiau įvertinti didžiuosius duomenis, kad būtų galima daryti prognozes ir imtis tinkamų priemonių.
- Mokslas ir tyrimai: GPU yra suprojektuoti HPC taikymams, todėl jie idealiai tinka labai sudėtingiems modeliavimams ir skaičiavimams. Hopper GPU naudojami, pavyzdžiui, astrofizikoje, klimato modeliavime ir kompiuterinėje chemijoje.
Dabartiniai NVIDIA modeliai
Išleidusi NVIDIA H100 ir NVIDIA H200, JAV įsikūrusi bendrovė rinkai pristatė du Hopper GPU. Tuo tarpu NVIDIA A30 vis dar yra pagamintas pagal ankstesnę Ampere architektūrą. Techniniu požiūriu H200 nėra visiškai naujas modelis, o greičiau patobulinta H100 versija. Toliau pateiktoje apžvalgoje išskirti pagrindiniai šių dviejų GPU skirtumai:
- Atmintis ir pralaidumas: NVIDIA H100 yra įrengtas 80 GB HBM3 atmintimi, o H200 GPU turi 141 GB talpos HBM3e atmintį. H200 taip pat aiškiai lenkia H100 atminties pralaidumo atžvilgiu – 4,8 TB/s palyginti su 2 TB/s.
- AI išvados našumas: Palyginti su NVIDIA H200, H200 užtikrina dvigubai didesnį išvados našumą tokiems modeliams kaip LLaMA 2-70 B. Tai leidžia ne tik greičiau apdoroti duomenis, bet ir efektyviai keisti mastelį.
- HPC programos ir moksliniai skaičiavimai: H100 jau siūlo aukščiausio lygio našumą sudėtingiems skaičiavimams, kurį H200 dar pranoksta. Išvadų greitis yra iki dvigubai didesnis, o HPC našumas – apie 20 procentų didesnis.