Ny­ky­ai­kais­ten tie­to­ko­nei­den las­ken­ta­te­ho mitataan FLOPS-yksiköinä, joka tar­koit­taa se­kun­nis­sa suo­ri­tet­ta­via liu­ku­lu­kuo­pe­raa­tioi­ta. Erittäin tehokkaat jär­jes­tel­mät voivat saavuttaa exaFLOPS-tason, joka on kvin­til­joo­na (1018) ope­raa­tio­ta se­kun­nis­sa. Tämä valtava las­ken­ta­ka­pa­si­teet­ti on rat­kai­se­van tärkeää mo­ni­mut­kais­ten las­kel­mien suo­rit­ta­mi­ses­sa.

Mitä FLOPS on ja mihin sitä käytetään?

FLOPS tar­koit­taa se­kun­nis­sasuo­ri­tet­ta­via liu­ku­lu­kuo­pe­raa­tioi­ta. Liu­ku­lu­kua­rit­me­tiik­ka on tie­to­ko­neis­sa vält­tä­mä­tön­tä tie­teel­li­sis­sä las­kel­mis­sa, si­mu­loin­neis­sa, te­ko­ä­lys­sä ja muissa las­ken­ta­te­hoa vaa­ti­vis­sa so­vel­luk­sis­sa. Toisin kuin yk­sin­ker­tai­set ko­ko­nais­lu­ku­jen ope­raa­tiot, liu­ku­lu­vut mah­dol­lis­ta­vat de­si­maa­li­lu­ku­jen erittäin tarkan las­ke­mi­sen ja esit­tä­mi­sen.

Tie­to­ko­neen suo­ri­tus­ky­ky FLOPS-yksiköinä mitataan eri­tyi­sil­lä ver­tai­luar­voil­la, jotka testaavat, kuinka monta liu­ku­lu­kuo­pe­raa­tio­ta voidaan suorittaa se­kun­nis­sa. Tähän käytetään usein ohjelmia, kuten LINPACK ja HPCG, jotka suo­rit­ta­vat mo­ni­mut­kai­sia ma­te­maat­ti­sia laskelmia ja mittaavat las­ken­ta­no­peut­ta to­del­li­sis­sa olo­suh­teis­sa. To­del­li­nen suo­ri­tus­ky­ky voi vaihdella lait­teis­ton, oh­jel­mis­ton op­ti­moin­nin ja laskelman tyypin mukaan.

Kuinka monta FLOPSia on exaFLOP­Sis­sa?

Yksi exaFLOP vastaa tar­kal­leen 1018 FLOPS:ia tai yhtä kvin­til­joo­naa liu­ku­lu­kuo­pe­raa­tio­ta se­kun­nis­sa. Vertailun vuoksi yksi petaFLOPS (1015 FLOPS) on tuhat kertaa pienempi kuin exaFLOPS, ja yksi teraFLOPS (1012 FLOPS) on miljoona kertaa pienempi.

Mitä muita FLOPS-yksiköitä on olemassa ja miten ne muun­ne­taan exaFLOPS-yk­si­köik­si?

On olemassa monia FLOPS-yksiköitä, jotka eroavat toi­sis­taan sen suhteen, kuinka monta ope­raa­tio­ta se­kun­nis­sa ne tar­koit­ta­vat.

Yksikkö FLOPS-arvo Muun­ta­mi­nen exaFLOPS-arvoon
KiloFLOP 103 FLOPS (1 000) 10–15 exaFLOPS
MegaFLOP 106 FLOPS (1 miljoona) 10–12 eksaFLOPS
GigaFLOP 109 FLOPS (1 miljardi) 10-9 eksaFLOPS
TeraFLOP 1012 FLOPS (1 biljoona) 10-6 eksaFLOPS
PetaFLOP 1015 FLOPS (1 kvadril­joo­na) 10-3 eksaFLOPS
ExaFLOP 1018 FLOPS (1 kvin­til­joo­na) 1 eksaFLOP

Nämä yksiköt hel­pot­ta­vat eri jär­jes­tel­mien las­ken­ta­te­hon vertailua keskenään.

Kuinka monta FLOPS-las­ku­toi­mi­tus­ta ny­ky­ai­kai­set tie­to­ko­neet ja GPU:t saa­vut­ta­vat?

Ny­ky­ai­kai­set korkean suo­ri­tus­ky­vyn tie­to­ko­neet saa­vut­ta­vat nykyään exaFLOPS-tason. En­sim­mäi­nen exaFLOPS-su­per­tie­to­ko­ne oli Tianhe-3, joka sijaitsee Kiinan kan­sal­li­ses­sa su­per­tie­to­ko­ne­kes­kuk­ses­sa Guangz­hous­sa ja jonka suo­ri­tus­ky­ky on jopa 1,7 exaFLOPS. Myös muut su­per­tie­to­ko­neet, kuten Frontier Yh­dys­val­lois­sa, toimivat nykyään exaFLOPS-tasolla.

Huip­pu­luo­kan näy­tö­noh­jai­met, kuten pelien ja ko­neop­pi­mi­sen yh­tey­des­sä käy­tet­tä­vät näy­tö­noh­jai­met, ovat myös FLOPS-ar­voil­taan korkeita, vaikka ne eivät läheskään saa­vu­ta­kaan exaFLOPS-tasoa:

  • NVIDIA RTX 4090: Noin 82 teraFLOPS (0,000082 exaFLOPS) FP32-las­kel­mil­le; yli­kel­lo­tet­tu­na se voi ylittää 1 000 teraFLOPS
  • NVIDIA H100 SXM: Noin 989 teraFLOPS (0,000989 exaFLOPS) FP32 Tensor Core -las­kel­mil­le
  • NVIDIA A30: Noin 10,3 teraFLOPS (0,000010 exaFLOPS) FP32-las­kel­mil­le
  • AMD Radeon RX 7900 XTX: Noin 61 teraFLOPS (0,000061 exaFLOPS) FP32-las­kel­mil­le

GPU:t on suun­ni­tel­tu en­si­si­jai­ses­ti tekoälyn ja grafiikan kä­sit­te­lyn rin­nak­kais­las­ken­taan, kun taas su­per­tie­to­ko­nei­ta käytetään erittäin mo­ni­mut­kai­siin si­mu­laa­tioi­hin tieteessä ja teol­li­suu­des­sa.

Siirry pää­va­lik­koon