TeraFLOPS (TFLOPS) on yksikkö, joka ilmaisee, kuinka monta biljoonaa liu­ku­lu­kuis­ta las­ku­toi­mi­tus­ta tietokone voi suorittaa se­kun­nis­sa. Arvo toimii pro­ses­so­rien, eri­tyi­ses­ti GPU:iden ja su­per­tie­to­ko­nei­den suo­ri­tus­ky­vyn mittana. TFLOPS on erityisen mer­ki­tyk­sel­li­nen so­vel­luk­sis­sa, joissa tehdään paljon las­ku­toi­mi­tuk­sia, kuten te­ko­ä­lys­sä, tie­teel­li­sis­sä si­mu­laa­tiois­sa ja ko­neop­pi­mi­ses­sa.

Mitä FLOPS on ja mihin sitä käytetään?

FLOPS tar­koit­taa kelluviende­si­maa­lien ope­raa­tioi­ta se­kun­nis­saja on las­ken­ta­te­hon yksikkö. Kelluvien de­si­maa­lien operaatio on ma­te­maat­ti­nen las­ku­toi­mi­tus, jossa käytetään de­si­maa­li­pis­tei­tä. Ne ovat erityisen tärkeitä las­ken­ta­te­hoa vaa­ti­vis­sa so­vel­luk­sis­sa, jotka edel­lyt­tä­vät suurta tark­kuut­ta.

FLOPS-laskentaa käytetään pää­asias­sa tie­teel­li­sis­sä las­kel­mis­sa, si­mu­loin­neis­sa, te­ko­ä­lys­sä, ko­neop­pi­mi­ses­sa ja gra­fiik­ka­so­vel­luk­sis­sa. Se on kes­kei­ses­sä roolissa useilla aloilla, kuten lää­ke­tie­teel­li­ses­sä ku­van­kä­sit­te­lys­sä ja fy­si­kaa­li­sis­sa si­mu­loin­neis­sa. Se on tärkeä myös ra­hoi­tusa­lal­la, esi­mer­kik­si mark­ki­na­tie­to­jen ana­ly­soin­nis­sa. Pe­lia­lal­la FLOPS-laskentaa käytetään modernien GPU-gra­fiik­kapro­ses­so­rei­den gra­fiik­ka­te­hon mää­rit­tä­mi­seen. FLOPS-ka­pa­si­tee­tin jat­ku­vas­ti kasvaessa ny­ky­ai­kai­set tie­to­ko­neet pystyvät tuot­ta­maan yhä rea­lis­ti­sem­pia fyysisiä te­hos­tei­ta ja korkean re­so­luu­tion gra­fiik­kaa.

FLOPS-arvo mitataan yleensä käyt­tä­mäl­lä eri­tyi­ses­ti ke­hi­tet­ty­jä ver­tai­lu­tes­te­jä, jotka mää­rit­tä­vät kelluvien de­si­maa­lien ope­raa­tioi­den määrän se­kun­nis­sa. Usein käy­tet­ty­jä ver­tai­lu­tes­te­jä ovat LINPACK, jota käytetään pää­asias­sa su­per­tie­to­ko­neis­sa, ja FP32/FP64, jotka mittaavat GPU:iden las­ken­ta­te­hoa. Testien aikana suo­ri­te­taan mo­ni­mut­kai­sia ma­te­maat­ti­sia laskelmia, jotta voidaan määrittää, kuinka monta ope­raa­tio­ta se­kun­nis­sa jär­jes­tel­mä pystyy kä­sit­te­le­mään. Val­mis­ta­jat antavat usein teo­reet­ti­sia FLOPS-arvoja, jotka pe­rus­tu­vat tie­to­ko­neen ark­ki­teh­tuu­riin. To­del­li­sis­sa so­vel­luk­sis­sa arvot voivat kuitenkin vaihdella työmäärän ja te­hok­kuu­den mukaan.

Kuinka monta FLOPSia on te­raFLOP­Sis­sa?

Yksi teraFLOPS vastaa yhtä biljoonaa (1 000 000 000 000 tai1012) liu­ku­lu­kuo­pe­raa­tio­ta se­kun­nis­sa. Tämä tar­koit­taa, että 1 TFLOPS:n pro­ses­so­ri voi suorittaa biljoona liu­ku­lu­kuo­pe­raa­tio­ta se­kun­nis­sa.

Vertailun vuoksi, tietokone, jolla on vain 1 FLOPS, tar­vit­si­si 31 000 vuotta suo­rit­taak­seen biljoona liu­ku­lu­kuo­pe­raa­tio­ta. Joten TFLOPS-tasoiset tie­to­ko­neet ovat te­hok­kai­ta jär­jes­tel­miä, jotka pystyvät suo­rit­ta­maan ny­ky­ai­kai­sia so­vel­luk­sia re­aa­lia­jas­sa.

Mitä muita FLOPS-yksiköitä on olemassa ja miten ne muun­ne­taan TFLOPS-yk­si­köik­si?

On olemassa monia FLOPS-yksiköitä, jotka eroavat toi­sis­taan sen suhteen, kuinka monta ope­raa­tio­ta se­kun­nis­sa ne tar­koit­ta­vat.

Yksikkö FLOPS-arvo Muunnos TFLOPS-arvoiksi
KiloFLOPS 103 FLOPS (1 000) 10-9 TFLOPS
MegaFLOPS 106 FLOPS (1 miljoona) 10-6 TFLOPS
GigaFLOPS 109 FLOPS (1 miljardi) 10-3 TFLOPS
TeraFLOPS 1012 FLOPS (1 biljoona) 1 TFLOP
PetaFLOPS 1015 FLOPS (1 kvadril­joo­na) 103 TFLOPS
ExaFLOPS 1018 FLOPS (1 kvin­til­joo­na) 106 TFLOPS

Su­per­tie­to­ko­nei­den suo­ri­tus­ky­ky mitataan petaFLOPS- ja jopa exaFLOPS-yk­si­köis­sä, kun taas huip­pu­luo­kan näy­tö­noh­jai­met luo­ki­tel­laan yleensä teraFLOPS-yk­si­köis­sä.

Kuinka monta FLOPS-las­ku­toi­mi­tus­ta ny­ky­ai­kai­set tie­to­ko­neet ja GPU:t saa­vut­ta­vat?

Suo­ri­tus­ky­kyi­sen laskennan alalla käy­tet­tä­vät GPU:t ja ny­ky­ai­kai­set tie­to­ko­neet ovat saa­vut­ta­neet vai­kut­ta­via FLOPS-arvoja. NVIDIA H100, yksi te­hok­kaim­mis­ta GPU:ista tekoälyyn ja da­ta­kes­kuk­siin, saavuttaa jopa 989 teraFLOPS:n suo­ri­tus­ky­vyn FP32 Tensor Core -las­kel­mis­sa. Se onkin ihan­teel­li­nen valinta suurille neu­ro­ver­koil­le ja si­mu­laa­tioil­le.

NVIDIA A30 on da­ta­kes­kuk­siin optimoitu GPU, jonka suo­ri­tus­ky­ky on 10 TFLOPS ja joka sopii erityisen hyvin tekoälyn kou­lu­tuk­seen ja päät­te­lyyn. Vertailun vuoksi pe­laa­jil­le suunnattu NVIDIA RTX 4090 voi yli­kel­lot­taa yli 100 TFLOPS:iin ja mah­dol­lis­taa erittäin rea­lis­ti­sen grafiikan.

Su­per­tie­to­ko­neet ovat vieläkin te­hok­kaam­pia: Frontier-su­per­tie­to­ko­ne on ylittänyt 1 exaFLOPS-rajan ja sitä käytetään erittäin mo­ni­mut­kai­siin tie­teel­li­siin si­mu­laa­tioi­hin. Muut tut­ki­muk­ses­sa käy­tet­tä­vät tehokkaat su­per­tie­to­ko­neet, kuten ja­pa­ni­lai­nen Fugaku-tietokone, toimivat myös tällä tasolla.

Siirry pää­va­lik­koon