Intel Gaudi 3 ir jaudīgs AI pa­āt­ri­nā­tājs, kas iz­strā­dāts īpaši prasīgām AI darba slodzēm. Gaudi 3 ir ražots, iz­man­to­jot 5 nanometru procesu, tam ir 64 tenzoru kodoli un tas piedāvā divreiz lielāku FP8 veikt­spē­ju un četrreiz lielāku AI aprēķinu jaudu nekā tā priekš­gā­jējs. Tas padara Intel Gaudi 3 ideālu se­ci­nā­ju­mu iz­da­rī­ša­nai un lielu AI modeļu apmācībai.

Kādas ir Intel Gaudi 3 veikt­spē­jas īpašības?

Ar Gaudi 3 Intel nosaka jaunus stan­dar­tus attiecībā uz veikt­spē­ju un ener­goe­fek­ti­vi­tā­ti. AI pa­āt­ri­nā­tājs ir balstīts uz Gaudi 2 ar­hi­tek­tū­ru, bet piedāvā ie­vē­ro­ja­mi lielāku skait­ļo­ša­nas jaudu, augstāku atmiņas joslas platumu un labāku ener­goe­fek­ti­vi­tā­ti. Turp­mā­ka­jā pārskatā apkopotas Intel Gaudi 3 sva­rī­gā­kās veikt­spē­jas funkcijas:

  • FP8 skait­ļo­ša­nas jauda: Gaudi 3 sasniedz FP8 skait­ļo­ša­nas jaudu 1,835 PFLOPS. Tā priekš­gā­jējs sasniedza nedaudz vairāk par 0,8 PFLOPS, kas nozīmē, ka FP8 aprēķinu veikt­spē­ja ir vairāk nekā div­kār­šo­ju­sies.
  • BF16 skait­ļo­ša­nas jauda: BF16 aprēķinos Intel Gaudi 3 sasniedz arī 1,835 PFLOPS, kas ir čet­rkār­tīgs skait­ļo­ša­nas jaudas pieaugums sa­lī­dzi­nā­ju­mā ar Gaudi 2.
  • Tīkla joslas platums: Div­vir­zie­nu tīkla joslas platums ir div­kār­šo­jies līdz 1200 gi­ga­bi­tiem sekundē, no­dro­ši­not ātrāku ko­mu­ni­kā­ci­ju starp mezgliem AI klasteru sistēmās.
  • HBM ka­pa­ci­tā­te un joslas platums: ar 128 gigabaitu HBM atmiņu Gaudi 3 piedāvā par 50 pro­cen­tiem lielāku atmiņas joslas platumu nekā ie­priek­šē­jā paaudze. HBM joslas platums 3,7 terabaiti sekundē atbilst 33 procentu pie­au­gu­mam.
Note

PFLOPS (PetaFloatingPoint Ope­ra­tionsperSecond) ir vienība, ar ko apraksta datoru apstrādes ātrumu. IBM iz­strā­dā­tais su­per­da­tors ar nosaukumu „Road­run­ner” 2008. gadā pirmais pārvarēja PFLOP barjeru.

Intel Gaudi 3 ir divi skait­ļo­ša­nas mik­roshē­mas (speciālas skait­ļo­ša­nas vienības), kas satur 64 tenzoru procesoru kodolus un 8 MME (matricas rei­zi­nā­ša­nas dzinējus paralēlai apstrādei). 24 RDMA NIC porti, katrs ar 200 gi­ga­bi­tiem sekundē, nodrošina ātru ko­mu­ni­kā­ci­ju, iz­man­to­jot stan­dar­ti­zē­tus Ethernet tīklus.

Kādas ir Intel Gaudi 3 priekš­ro­cī­bas un trūkumi?

Gaudi 3 paaudzes AI pa­āt­ri­nā­tā­ja iz­man­to­ša­nai ir dažādas priekš­ro­cī­bas. No­zī­mī­gā­kās no tām ir šādas:

  • Augsta skait­ļo­ša­nas jauda: ar 1835 PFLOPS FP8 un BF16 veikt­spē­ju Intel Gaudi 3 piedāvā milzīgu veikt­spē­ju, kas ir līdzīga daudz dārgākam NVIDIA H100. Saskaņā ar Intel preses relīzi, uzņēmuma iekšējais AI pa­āt­ri­nā­tājs dažās jomās pat pārspēj NVIDIA flagmani.
  • Augsta ener­goe­fek­ti­vi­tā­te: Gaudi 3 AI pa­āt­ri­nā­tā­ji ir ražoti, iz­man­to­jot 5 nanometru procesu (TSMC), kas nodrošina augstāku jaudas blīvumu. Tas samazina enerģijas patēriņu un pazemina datu centru eks­plua­tā­ci­jas izmaksas.
  • Rentabla AI mē­ro­go­ja­mī­ba: ar Intel Gaudi 3 sistēmas var elastīgi mērogot vertikāli un ho­ri­zon­tā­li, kas ir īpaši izdevīgi sa­rež­ģī­tiem ie­vie­ša­nas ga­dī­ju­miem.
  • Atvērtu standartu atbalsts: Tā kā Gaudi 3 atbalsta atvērtos stan­dar­tus, AI pa­āt­ri­nā­tā­jus var elastīgi integrēt esošajās IT in­fras­truk­tū­rās. Tas padara uzņēmumus ne­at­ka­rī­gā­kus AI platformu izvēlē.

Tomēr AI pa­āt­ri­nā­tā­jiem ir arī ie­vē­ro­ja­mi trūkumi. Lai gan Intel Gaudi 3 nodrošina pirm­kla­sī­gu veikt­spē­ju, NVIDIA augstākās klases mik­roshē­mas kopumā piedāvā vēl labāku veikt­spē­ju. Kāpēc tas ir svarīgi? Tāpēc, ka uzņēmumi, kas darbojas AI jomā, līdz šim ir tendējuši iz­vē­lē­ties nevis visren­tab­lā­ko, bet gan vis­jau­dī­gā­ko ri­si­nā­ju­mu. Rezultātā Intel Gaudi 3 ir mazāk izplatīts nekā NVIDIA AI pa­āt­ri­nā­tā­ji, kuru eko­sis­tē­ma gūst labumu no plaša AI izstrādes komandu atbalsta.

Kādām lietojuma jomām Intel Gaudi 3 ir vis­pie­mē­ro­tā­kais?

Intel Gaudi 3 ir iz­strā­dāts īpaši aprēķinu in­ten­sī­vām AI darba slodzēm un ir īpaši piemērots se­ci­nā­ju­mu uz­de­vu­miem, kas prasa augstu paralēlo apstrādi un atmiņas joslas platumu. Tipiskas darba slodzes ietver teksta ģe­ne­rē­ša­nu ar lieliem valodas modeļiem (LLM), attēlu ģe­ne­rē­ša­nu un runas sintēzi. Pa­tei­co­ties augstajam se­ci­nā­ju­mu ātrumam un op­ti­mi­zē­ta­jai FP8 ar­hi­tek­tū­rai, Gaudi 3 nodrošina jaudīgu un ener­goe­fek­tī­vu ģe­ne­ra­tī­vo AI modeļu apstrādi. Tomēr ir arī citas pie­mē­ro­ša­nas jomas. Tās ietver:

  • Lielu AI modeļu pamata apmācība: Gaudi 3 ļauj efektīvi apstrādāt lielus datu kopumus. Tādējādi AI pa­āt­ri­nā­tā­ji ir ideāli piemēroti AI modeļu apmācībai no nulles, piemēram, neironu tīkliem ma­šīn­mā­cī­bai vai transfor­ma­to­ru modeļiem, piemēram, GPT un LLaMA.
  • Attēlu apstrāde un da­torre­dze: pa­tei­co­ties augstajai skait­ļo­ša­nas jaudai, Intel Gaudi 3 spēj reāllaikā apstrādāt sa­rež­ģī­tus attēlu datus. Tas padara AI pa­āt­ri­nā­tā­ju piemērotu arī tādām lie­to­jum­prog­ram­mām kā drošības uz­rau­dzī­ba vai rūp­nie­cis­kā au­to­ma­ti­zā­ci­ja.
  • GPU serveri un AI klasteri datu centros: Intel Gaudi 3 var izmantot GPU serveriem, lai no­dro­ši­nā­tu AI apmācībai un se­ci­nā­ju­miem ne­pie­cie­ša­mo skait­ļo­ša­nas jaudu.

Kādas ir ie­spē­ja­mās al­ter­na­tī­vas Intel Gaudi 3?

Ir dažādi AI pa­āt­ri­nā­tā­ji, kurus var uzskatīt par Intel Gaudi 3 al­ter­na­tī­vām. Viena no pa­zīs­ta­mā­ka­jām al­ter­na­tī­vām un kon­ku­rē­jo­ša­jiem pro­duk­tiem ir NVIDIA H100. Intel pa­āt­ri­nā­tājs ir ideāli piemērots se­ci­nā­ju­mu iz­da­rī­ša­nai, bet H100 piedāvā augstas klases veikt­spē­ju AI un datu zinātnes lie­to­ju­miem. Vēl viena bieži izvēlēta Gaudi 3 al­ter­na­tī­va ir NVIDIA A30, kas apvieno augstu veikt­spē­ju ar pieejamu cenu.

Note

Mūsu serveru GPU sa­lī­dzi­nā­ša­nas ceļvedī mēs pie­dā­vā­jam labākos grafikas pro­ce­so­rus iz­man­to­ša­nai datu centros un augstas veikt­spē­jas serveros.

Go to Main Menu