Hopper GPU ir NVIDIA jaunākās paaudzes augstas veikt­spē­jas grafikas procesori, kas ir īpaši iz­strā­dā­ti mākslīgā intelekta (AI) un augstas veikt­spē­jas skait­ļo­ša­nas (HPC) va­ja­dzī­bām. Tie ir aprīkoti ar modernu ar­hi­tek­tū­ru un uz­la­bo­tiem Tensor Cores kodoliem, kā arī integrē vairākas ino­va­tī­vas teh­no­lo­ģi­jas, lai no­dro­ši­nā­tu maksimālu efek­ti­vi­tā­ti. Hopper GPU ir ideāli piemēroti plašam darba slodžu klāstam un atbalsta AI se­ci­nā­ju­mus, dziļo mācīšanos, ģe­ne­ra­tī­vo AI un daudz ko citu.

Kāda ir NVIDIA Hopper GPU ar­hi­tek­tū­ras kons­truk­ci­ja?

Nosaukums „Hopper GPU” ir cēlies no Hopper ar­hi­tek­tū­ras, kas ir GPU mik­roar­hi­tek­tū­ra, kas veido augstas veikt­spē­jas grafikas procesoru pamatu un ir op­ti­mi­zē­ta AI darba slodzēm un HPC lie­to­jum­prog­ram­mām. Hopper GPU ražo TSMC, iz­man­to­jot 4 nanometru procesu, un tajos ir vairāk nekā 80 miljardi tranzis­to­ru, kas padara tos par vieniem no mo­der­nā­ka­jiem grafikas kartēm, kas pieejamas tirgū.

Ar Hopper ar­hi­tek­tū­ru NVIDIA apvieno jaunākās paaudzes Tensor Cores ar piecām re­vo­lu­cio­nā­rām ino­vā­ci­jām: transfor­ma­to­ru dzinēju, NVLink/NVSwitch/NVLink ko­mu­tā­ci­jas sistēmām, kon­fi­den­ciā­lu aprēķinu, otrās paaudzes dau­dzin­stancu GPU (MIG) un DPX ins­truk­ci­jām. Šīs teh­no­lo­ģi­jas ļauj Hopper GPU sasniegt līdz pat 30 reizes ātrāku AI se­ci­nā­ju­mu pa­āt­ri­nā­ju­mu sa­lī­dzi­nā­ju­mā ar ie­priek­šē­jo paaudzi (bal­sto­ties uz NVIDIA Megatron 530B čatbotu — pasaulē vi­s­ap­tve­ro­šā­ko ģe­ne­ra­tī­vo valodas modeli).

Kādas ir Hopper GPU ino­vā­ci­jas?

Hopper GPU ir vairākas jaunas funkcijas, kas palīdz uzlabot veikt­spē­ju, efek­ti­vi­tā­ti un mē­ro­go­ja­mī­bu. Sva­rī­gā­kās ino­vā­ci­jas ir ap­rak­stī­tas zemāk:

  • Transfor­ma­to­ru dzinējs: ar transfor­ma­to­ru dzinēja palīdzību Hopper GPU var apmācīt AI modeļus līdz pat deviņas reizes ātrāk. Valodas modeļu jomas se­ci­nā­ju­mu uzdevumos GPU sasniedz līdz pat 30 reizes lielāku pa­āt­ri­nā­ju­mu nekā ie­priek­šē­jās paaudzes modeļi.
  • NVLink ko­mu­tā­ci­jas sistēma: Ceturtās paaudzes NVLink nodrošina div­vir­zie­nu GPU joslas platumu 900 GB/s, bet NVSwitch nodrošina labāku H200 klasteru mē­ro­go­ja­mī­bu. Tas nodrošina, ka AI modeļus ar tril­jo­niem parametru var efektīvi apstrādāt.
  • Kon­fi­den­ciā­la datu apstrāde: Hopper ar­hi­tek­tū­ra nodrošina, ka jūsu dati, AI modeļi un algoritmi tiek aiz­sar­gā­ti arī apstrādes laikā.
  • Multi-instance GPU (MIG) 2.0: otrās paaudzes MIG teh­no­lo­ģi­ja ļauj vienu Hopper GPU sadalīt līdz pat septiņām izolētām instancēm. Tas ļauj vairākiem cilvēkiem vien­lai­kus apstrādāt dažādas darba slodzes, ne­trau­cē­jot viens otru.
  • DPX ins­truk­ci­jas: DPX ins­truk­ci­jas ļauj dinamiski prog­ram­mē­tus al­go­ritmus aprēķināt līdz septiņas reizes ātrāk nekā ar Ampere ar­hi­tek­tū­ras GPU.

Kādiem lie­to­ju­miem Hopper GPU ir piemēroti?

NVIDIA GPU, kas balstīti uz Hopper ar­hi­tek­tū­ru, ir paredzēti plašam augstas veikt­spē­jas darba slodžu klāstam. Galvenās Hopper GPU lie­to­ša­nas jomas ir: ¬

  • Se­ci­nā­ju­mu uzdevumi: GPU ir viens no nozares va­do­ša­jiem ri­si­nā­ju­miem pro­duk­tī­vai AI se­ci­nā­ju­mu iz­man­to­ša­nai. Ne­at­ka­rī­gi no tā, vai runa ir par ieteikumu sistēmām e-komercijā, me­di­cī­nis­ka­jā diag­nos­ti­kā vai reāllaika prognozēm au­to­no­ma­jai brauk­ša­nai, Hopper GPU spēj ātri un efektīvi apstrādāt milzīgus datu apjomus.
  • Ģe­ne­ra­tī­vā AI: Augstas klases GPU nodrošina ne­pie­cie­ša­mo skait­ļo­ša­nas jaudu, lai apmācītu un izpildītu rīkus ar ģe­ne­ra­tī­vo AI. Paralēlā apstrāde ļauj efektīvāk veikt aprēķinus radošiem uz­de­vu­miem, piemēram, teksta, attēlu un video ģe­ne­rē­ša­nai.
  • Dziļās apmācības apmācība: ar savu augsto skait­ļo­ša­nas jaudu Hopper GPU ir ideāli piemēroti lielu neironu tīklu apmācībai. Hopper ar­hi­tek­tū­ra ie­vē­ro­ja­mi saīsina AI modeļu apmācības laiku.
  • Sarunu AI: Hopper GPU ir op­ti­mi­zē­ti dabiskās valodas apstrādei (NLP) un ir ideāli piemēroti AI valodas sistēmām, piemēram, vir­tuā­la­jiem asis­ten­tiem un AI čatbotiem. Tie paātrina lielu AI modeļu apstrādi un nodrošina ātru mi­jie­dar­bī­bu, ko var viegli integrēt biznesa procesos, piemēram, atbalsta dienestos.
  • Datu analīze un lielie dati: Hopper GPU apstrādā milzīgus datu apjomus ar lielu ātrumu un paātrina sa­rež­ģī­tus aprēķinus, iz­man­to­jot masīvu paralēlo apstrādi. Tas ļauj uz­ņē­mu­miem ātrāk izvērtēt lielos datus, lai veiktu prognozes un uzsāktu pareizos pasākumus.
  • Zinātne un pēt­nie­cī­ba: tā kā GPU ir paredzēti HPC lie­to­jum­prog­ram­mām, tie ir ideāli piemēroti ļoti sa­rež­ģī­tiem si­mu­lā­ci­jām un ap­rē­ķi­niem. Hopper GPU tiek izmantoti, piemēram, as­tro­fi­zi­kā, klimata mo­de­lē­ša­nā un skait­ļo­ša­nas ķīmijā.

Pa­šrei­zē­jie NVIDIA modeļi

Ar NVIDIA H100 un NVIDIA H200 izlaišanu ASV bāzētā kompānija ir ieviesusi tirgū divus Hopper GPU. Savukārt NVIDIA A30 joprojām ir veidots uz ie­priek­šē­jās Ampere ar­hi­tek­tū­ras bāzes. Tehniskā ziņā H200 nav pilnīgi jauns modelis, bet drīzāk uzlabota H100 versija. Turp­mā­ka­jā pārskatā ir izcelti galvenie at­šķi­rī­bas starp šiem diviem GPU:

  • Atmiņa un joslas platums: NVIDIA H100 ir aprīkots ar 80 GB HBM3 atmiņu, bet H200 GPU ir HBM3e atmiņa ar 141 GB ka­pa­ci­tā­ti. H200 ir arī ne­pār­spē­jams atmiņas joslas platuma ziņā ar 4,8 TB/s sa­lī­dzi­nā­ju­mā ar H100 2 TB/s.
  • Veikt­spē­ja AI se­ci­nā­ju­miem: sa­lī­dzi­nā­ju­mā NVIDIA H200 nodrošina divreiz lielāku se­ci­nā­ju­mu veikt­spē­ju modeļiem, piemēram, LLaMA 2-70 B. Tas ļauj ne tikai ātrāk apstrādāt datus, bet arī efektīvi mainīt mērogu.
  • HPC lie­to­jum­prog­ram­mas un zi­nāt­nis­kie aprēķini: H100 jau piedāvā pirm­kla­sī­gu veikt­spē­ju sa­rež­ģī­tiem ap­rē­ķi­niem, ko H200 pārspēj. In­fe­ren­ces ātrums ir līdz pat divreiz lielāks, HPC veikt­spē­ja ir apmēram par 20 pro­cen­tiem augstāka.
Go to Main Menu