Mitä ovat TFLOPS?
TeraFLOPS (TFLOPS) on yksikkö, joka ilmaisee, kuinka monta biljoonaa liukulukuista laskutoimitusta tietokone voi suorittaa sekunnissa. Arvo toimii prosessorien, erityisesti GPU:iden ja supertietokoneiden suorituskyvyn mittana. TFLOPS on erityisen merkityksellinen sovelluksissa, joissa tehdään paljon laskutoimituksia, kuten tekoälyssä, tieteellisissä simulaatioissa ja koneoppimisessa.
Mitä FLOPS on ja mihin sitä käytetään?
FLOPS tarkoittaa kelluviendesimaalien operaatioita sekunnissaja on laskentatehon yksikkö. Kelluvien desimaalien operaatio on matemaattinen laskutoimitus, jossa käytetään desimaalipisteitä. Ne ovat erityisen tärkeitä laskentatehoa vaativissa sovelluksissa, jotka edellyttävät suurta tarkkuutta.
FLOPS-laskentaa käytetään pääasiassa tieteellisissä laskelmissa, simuloinneissa, tekoälyssä, koneoppimisessa ja grafiikkasovelluksissa. Se on keskeisessä roolissa useilla aloilla, kuten lääketieteellisessä kuvankäsittelyssä ja fysikaalisissa simuloinneissa. Se on tärkeä myös rahoitusalalla, esimerkiksi markkinatietojen analysoinnissa. Pelialalla FLOPS-laskentaa käytetään modernien GPU-grafiikkaprosessoreiden grafiikkatehon määrittämiseen. FLOPS-kapasiteetin jatkuvasti kasvaessa nykyaikaiset tietokoneet pystyvät tuottamaan yhä realistisempia fyysisiä tehosteita ja korkean resoluution grafiikkaa.
FLOPS-arvo mitataan yleensä käyttämällä erityisesti kehitettyjä vertailutestejä, jotka määrittävät kelluvien desimaalien operaatioiden määrän sekunnissa. Usein käytettyjä vertailutestejä ovat LINPACK, jota käytetään pääasiassa supertietokoneissa, ja FP32/FP64, jotka mittaavat GPU:iden laskentatehoa. Testien aikana suoritetaan monimutkaisia matemaattisia laskelmia, jotta voidaan määrittää, kuinka monta operaatiota sekunnissa järjestelmä pystyy käsittelemään. Valmistajat antavat usein teoreettisia FLOPS-arvoja, jotka perustuvat tietokoneen arkkitehtuuriin. Todellisissa sovelluksissa arvot voivat kuitenkin vaihdella työmäärän ja tehokkuuden mukaan.
Kuinka monta FLOPSia on teraFLOPSissa?
Yksi teraFLOPS vastaa yhtä biljoonaa (1 000 000 000 000 tai1012) liukulukuoperaatiota sekunnissa. Tämä tarkoittaa, että 1 TFLOPS:n prosessori voi suorittaa biljoona liukulukuoperaatiota sekunnissa.
Vertailun vuoksi, tietokone, jolla on vain 1 FLOPS, tarvitsisi 31 000 vuotta suorittaakseen biljoona liukulukuoperaatiota. Joten TFLOPS-tasoiset tietokoneet ovat tehokkaita järjestelmiä, jotka pystyvät suorittamaan nykyaikaisia sovelluksia reaaliajassa.
Mitä muita FLOPS-yksiköitä on olemassa ja miten ne muunnetaan TFLOPS-yksiköiksi?
On olemassa monia FLOPS-yksiköitä, jotka eroavat toisistaan sen suhteen, kuinka monta operaatiota sekunnissa ne tarkoittavat.
| Yksikkö | FLOPS-arvo | Muunnos TFLOPS-arvoiksi |
|---|---|---|
| KiloFLOPS | 103 FLOPS (1 000) | 10-9 TFLOPS |
| MegaFLOPS | 106 FLOPS (1 miljoona) | 10-6 TFLOPS |
| GigaFLOPS | 109 FLOPS (1 miljardi) | 10-3 TFLOPS |
| TeraFLOPS | 1012 FLOPS (1 biljoona) | 1 TFLOP |
| PetaFLOPS | 1015 FLOPS (1 kvadriljoona) | 103 TFLOPS |
| ExaFLOPS | 1018 FLOPS (1 kvintiljoona) | 106 TFLOPS |
Supertietokoneiden suorituskyky mitataan petaFLOPS- ja jopa exaFLOPS-yksiköissä, kun taas huippuluokan näytönohjaimet luokitellaan yleensä teraFLOPS-yksiköissä.
Kuinka monta FLOPS-laskutoimitusta nykyaikaiset tietokoneet ja GPU:t saavuttavat?
Suorituskykyisen laskennan alalla käytettävät GPU:t ja nykyaikaiset tietokoneet ovat saavuttaneet vaikuttavia FLOPS-arvoja. NVIDIA H100, yksi tehokkaimmista GPU:ista tekoälyyn ja datakeskuksiin, saavuttaa jopa 989 teraFLOPS:n suorituskyvyn FP32 Tensor Core -laskelmissa. Se onkin ihanteellinen valinta suurille neuroverkoille ja simulaatioille.
NVIDIA A30 on datakeskuksiin optimoitu GPU, jonka suorituskyky on 10 TFLOPS ja joka sopii erityisen hyvin tekoälyn koulutukseen ja päättelyyn. Vertailun vuoksi pelaajille suunnattu NVIDIA RTX 4090 voi ylikellottaa yli 100 TFLOPS:iin ja mahdollistaa erittäin realistisen grafiikan.
Supertietokoneet ovat vieläkin tehokkaampia: Frontier-supertietokone on ylittänyt 1 exaFLOPS-rajan ja sitä käytetään erittäin monimutkaisiin tieteellisiin simulaatioihin. Muut tutkimuksessa käytettävät tehokkaat supertietokoneet, kuten japanilainen Fugaku-tietokone, toimivat myös tällä tasolla.