Hopper GPU yra nau­jau­sios kartos NVIDIA aukštos kokybės grafikos pro­ce­so­riai, spe­cia­liai sukurti dirb­ti­niam in­te­lek­tui (AI) ir aukštos kokybės skai­čia­vi­mams (HPC). Šie pro­ce­so­riai pasižymi pažangia ar­chi­tek­tū­ra su pa­žan­giais Tensor Core pro­ce­so­riais ir in­te­gruo­ja keletą no­va­to­riš­kų tech­no­lo­gi­jų, kad už­tik­rin­tų maksimalų efek­ty­vu­mą. Hopper GPU yra idealūs įvairiems darbo krūviams, palaiko AI išvadų darymą, giluminio mokymosi tre­ni­ruo­tes, ge­ne­ra­ty­vi­nį AI ir dar daugiau.

Koks yra NVIDIA „Hopper“ GPU ar­chi­tek­tū­ros dizainas?

Pa­va­di­ni­mas „Hopper GPU“ kilęs iš Hopper ar­chi­tek­tū­ros, kuri yra GPU mik­ro­ar­chi­tek­tū­ra, sudaranti aukštos našumo grafikos pro­ce­so­rių pagrindą ir op­ti­mi­zuo­ta dirbtinio intelekto užduotims bei HPC prog­ra­moms. Hopper GPU gamina TSMC, naudodama 4 nanometrų procesą, ir turi daugiau nei 80 milijardų tran­zis­to­rių, todėl tai yra vienos iš pa­žan­giau­sių grafikos plokščių, esančių rinkoje.

Naudodama „Hopper“ ar­chi­tek­tū­rą, „NVIDIA“ derina nau­jau­sios kartos „Tensor Cores“ su penkiomis no­va­to­riš­ko­mis nau­jo­vė­mis: trans­for­ma­to­riaus varikliu, „NVLink/NVSwitch/NVLink“ pe­r­jun­gi­mo sis­te­mo­mis, kon­fi­den­cia­liu skai­čia­vi­mu, antros kartos dau­gia­funk­ci­niais GPU (MIG) ir DPX inst­ruk­ci­jo­mis. Šios tech­no­lo­gi­jos leidžia Hopper GPU pasiekti iki 30 kartų didesn į AI išvados pa­grei­ti­ni­mą, palyginti su ankstesne karta (remiantis NVIDIA „Megatron 530B“ pokalbių robotu – iš­sa­miau­siu ge­ne­ra­ty­vi­niu kalbos modeliu pasaulyje).

Kokios yra no­va­to­riš­kos Hopper GPU savybės?

Hopper GPU turi keletą naujų funkcijų, kurios padeda pagerinti našumą, efek­ty­vu­mą ir mastelį. Toliau pa­tei­kia­me svar­biau­sias naujoves:

  • Trans­for­ma­to­riaus variklis: trans­for­ma­to­riaus variklio pagalba „Hopper“ GPU gali mokyti AI modelius iki devynis kartus greičiau. Kalbos modelių srities išvadų užduočių atveju GPU pasiekia iki 30 kartų didesnį pagreitį nei anks­tes­nės kartos modeliai.
  • NVLink jungiklių sistema: ketvirtos kartos NVLink užtikrina 900 GB/s dviejų krypčių GPU pra­lai­du­mą, o NVSwitch užtikrina geresnį H200 klasterių mastelio keitimą. Tai užtikrina, kad AI modeliai su tri­li­jo­nais parametrų gali būti ap­do­ro­ja­mi efek­ty­viai.
  • Kon­fi­den­cia­lus skai­čia­vi­mas: Hopper ar­chi­tek­tū­ra užtikrina, kad jūsų duomenys, AI modeliai ir al­go­rit­mai taip pat būtų apsaugoti ap­do­ro­ji­mo metu.
  • Dau­giains­tan­ci­nis GPU (MIG) 2.0: antros kartos MIG tech­no­lo­gi­ja leidžia vieną Hopper GPU padalyti į iki septynių izoliuotų instancų. Tai leidžia keliems žmonėms vienu metu apdoroti skir­tin­gus darbo krūvius, ne­truk­dant vieni kitiems.
  • DPX inst­ruk­ci­jos: DPX inst­ruk­ci­jos leidžia di­na­miš­kai prog­ra­muo­tus al­go­rit­mus ap­skai­čiuo­ti iki septynių kartų greičiau nei naudojant Ampere ar­chi­tek­tū­ros GPU.

Kokiems naudojimo atvejams tinka „Hopper“ GPU?

NVIDIA GPU, pagrįsti Hopper ar­chi­tek­tū­ra, yra sukurti įvairiems didelio našumo už­da­vi­niams atlikti. Pag­rin­di­nės Hopper GPU taikymo sritys yra: ¬

  • Išvadų darymo užduotys: GPU yra vienos iš pir­mau­jan­čių pramonės sprendimų, skirtų pro­duk­ty­viai naudoti AI išvadas. Nesvarbu, ar tai būtų re­ko­men­da­ci­jų sistemos elekt­ro­ni­nė­je ko­mer­ci­jo­je, me­di­ci­ni­nė dia­g­nos­ti­ka ar realaus laiko prognozės au­to­no­mi­niam vai­ra­vi­mui, „Hopper“ GPU gali greitai ir efek­ty­viai apdoroti didelius duomenų kiekius.
  • Ge­ne­ra­ty­vi­nė AI: aukš­čiau­sios klasės GPU suteikia reikiamą skai­čia­vi­mo galią ge­ne­ra­ty­vi­nės AI įrankių mokymui ir vykdymui. Ly­gia­gre­tus ap­do­ro­ji­mas leidžia efek­ty­viau atlikti kūrybines užduotis, pvz., tekstų, vaizdų ir vaizdo įrašų ge­ne­ra­vi­mą.
  • Gilusis mokymasis: Dėl didelės skai­čia­vi­mo galios Hopper GPU yra idealios didelių ne­u­ro­ni­nių tinklų mokymui. Hopper ar­chi­tek­tū­ra žymiai su­trum­pi­na AI modelių mokymo laiką.
  • Kon­ver­sa­ci­nė AI: Op­ti­mi­zuo­ti na­tū­ra­lios kalbos ap­do­ro­ji­mui (NLP), Hopper GPU yra idealiai tinka AI valdomoms kalbos sistemoms, pvz., vir­tu­aliems asi­sten­tams ir AI pokalbių robotams. Jie pa­grei­ti­na didelių AI modelių ap­do­ro­ji­mą ir užtikrina greitą sąveiką, kuri gali būti sklan­džiai in­te­gruo­ta į verslo procesus, pvz., pagalbą.
  • Duomenų analizė ir didieji duomenys: „Hopper“ GPU greitai apdoroja didelius duomenų kiekius ir pa­grei­ti­na su­dė­tin­gus skai­čia­vi­mus, naudodami masinį ly­gia­gre­tų ap­do­ro­ji­mą. Tai leidžia įmonėms greičiau įvertinti di­džiuo­sius duomenis, kad būtų galima daryti prognozes ir imtis tinkamų priemonių.
  • Mokslas ir tyrimai: GPU yra su­p­ro­jek­tuo­ti HPC taikymams, todėl jie idealiai tinka labai su­dė­tin­giems mo­de­lia­vi­mams ir skai­čia­vi­mams. Hopper GPU naudojami, pa­vyz­džiui, ast­ro­fi­zi­ko­je, klimato mo­de­lia­vi­me ir kom­piu­te­ri­nė­je chemijoje.

Da­bar­ti­niai NVIDIA modeliai

Išleidusi NVIDIA H100 ir NVIDIA H200, JAV įsikūrusi bendrovė rinkai pristatė du Hopper GPU. Tuo tarpu NVIDIA A30 vis dar yra pa­ga­min­tas pagal ankstesnę Ampere ar­chi­tek­tū­rą. Techniniu požiūriu H200 nėra visiškai naujas modelis, o greičiau pa­to­bu­lin­ta H100 versija. Toliau pa­teik­to­je ap­žval­go­je išskirti pag­rin­di­niai šių dviejų GPU skirtumai:

  • Atmintis ir pra­lai­du­mas: NVIDIA H100 yra įrengtas 80 GB HBM3 atmintimi, o H200 GPU turi 141 GB talpos HBM3e atmintį. H200 taip pat aiškiai lenkia H100 atminties pra­lai­du­mo atžvilgiu – 4,8 TB/s palyginti su 2 TB/s.
  • AI išvados našumas: Palyginti su NVIDIA H200, H200 užtikrina dvigubai didesnį išvados našumą tokiems modeliams kaip LLaMA 2-70 B. Tai leidžia ne tik greičiau apdoroti duomenis, bet ir efek­ty­viai keisti mastelį.
  • HPC programos ir moks­li­niai skai­čia­vi­mai: H100 jau siūlo aukš­čiau­sio lygio našumą su­dė­tin­giems skai­čia­vi­mams, kurį H200 dar pranoksta. Išvadų greitis yra iki dvigubai didesnis, o HPC našumas – apie 20 procentų didesnis.
Go to Main Menu