Sumutietojenkäsittely
Esineiden internet(IoT) on mullistanut IT-ympäristöjä ympäri maailmaa, ja sitä pidetään jo avainteknologiana monissa tulevaisuuteen suuntautuvissa hankkeissa. Perinteiset IoT-arkkitehtuurit, joissa dataa kerätään ja käsitellään keskitetysti, eivät pysty skaalautumaan rajattomasti esimerkiksi kaistanleveyden kaltaisten rajoitusten vuoksi. Fog-laskennan alalla kehitetään parhaillaan ratkaisuja, joilla pyritään vastaamaan tällaisiin IoT:n käyttöönottoon liittyviin haasteisiin.
Mitä on sumutietojenkäsittely? Määritelmä
Fog-laskenta on pilviteknologia, jossa päätelaitteiden tuottamat tiedot eivät siirry suoraan pilveen, vaan ne esikäsitellään hajautetuissa pienissä datakeskuksissa. Konsepti perustuu verkkoarkkitehtuuriin, joka ulottuu verkon ulkoreunasta (jossa IoT-laitteet tuottavat tietoja) julkisen pilven keskitettyyn datapisteeseen tai yksityiseen datakeskukseen (yksityinen pilvi).
”Foggingin” tavoitteena on lyhentää viestintämatkoja ja vähentää tietojen siirtoa ulkoisten verkkojen kautta. Fog-solmut muodostavat verkkoon välitasoisen kerroksen, jossa päätetään, mitkä tiedot käsitellään paikallisesti ja mitkä välitetään pilvipalveluun tai keskitettyyn tietokeskukseen jatkokäsittelyä tai -analysointia varten.
Seuraava kaaviokuva esittää sumutietojenkäsittelyarkkitehtuurin kolme kerrosta:

- Reunakerros: Reunakerros käsittää kaikki IoT-arkkitehtuurin ”älylaitteet” (reunalaitteet). Reunakerroksessa syntyvä data joko käsitellään suoraan laitteessa tai lähetetään fog-kerroksen palvelimelle (fog-solmuun).
- Fog-kerros: fog-kerros sisältää useita tehokkaita palvelimia, jotka vastaanottavat dataa reuna-kerroksesta, esikäsittelevät sitä ja lataavat sen pilveen tarpeen mukaan.
- Pilvikerros: pilvikerros on fog-laskentarakenteen keskeinen datapäätepiste.
OpenFog Consortium (nykyisin Industry IoT Consortium, IIC) on kehittänyt viitearkkitehtuurin sumuteknologiajärjestelmille. Lisää sumuteknologiaa käsitteleviä raportteja löytyy IIC:n verkkosivuilta.
Miten sumupilvipalvelut eroavat pilvipalveluista?
Pilvipalvelut eroavat perinteisestä tietojenkäsittelystä resurssien tarjoamisen ja tietojen käsittelytavan osalta. Pilvipalvelut toteutetaan yleensä keskitetyissä datakeskuksissa. Resurssit, kuten laskentateho ja tallennustila, kootaan taustapalvelimille ja tarjotaan asiakkaiden käyttöön verkon kautta. Kahden tai useamman päätelaitteen välinen viestintä tapahtuu aina taustalla toimivan palvelimen välityksellä.
Älykkäässä valmistuksessa käytettävien kaltaiset järjestelmät edellyttävät jatkuvaa tiedonvaihtoa lukemattomien päätelaitteiden välillä, mikä vie tällaisen arkkitehtuurin rajoilleen. Fog-laskennassa hyödynnetään välivaiheen käsittelyä lähellä tietolähdettä, jotta tietoliikennettä datakeskukseen voidaan vähentää.
Miten sumutietojenkäsittely eroaa reunalaitteiden tietojenkäsittelystä?
Pilvipalvelujen rajoja koettelevat kuitenkin muutkin tekijät kuin vain suurten IoT-arkkitehtuurien tiedonsiirtonopeus. Toinen ongelma on viive. Keskitetty tietojenkäsittelyyn liittyy aina viivettä pitkien siirtoreittien vuoksi. Loppulaitteiden ja anturien on kommunikoitava keskenään datakeskuksen palvelimen kautta, mikä aiheuttaa viivettä sekä pyynnön että vastauksen ulkoisessa käsittelyssä. Tällaiset viiveajat muodostuvat ongelmallisiksi IoT-tuetuissa tuotantoprosesseissa, joissa reaaliaikainen tietojenkäsittely on välttämätöntä, jotta koneet voivat reagoida välittömästi, kun tapahtuu häiriö.
Yksi ratkaisu viiveongelmaan on reuna-laskenta (edge computing), joka on osa sumulaskennan (fog computing) käsitteistöä ja jossa tietojenkäsittely ei ole pelkästään hajautettua, vaan se tapahtuu suoraan päätelaitteessa verkon reunalla. Jokainen älylaite on varustettu omalla mikrokontrollerillaan, joka mahdollistaa perustason tietojenkäsittelyn sekä viestinnän muiden IoT-laitteiden ja anturien kanssa. Tämä vähentää paitsi viivettä myös keskusdatakeskuksen tietoliikennettä.
Vaikka sumutietojenkäsittely ja reunatietojenkäsittely liittyvät läheisesti toisiinsa, ne eivät ole sama asia. Ratkaiseva ero on siinä, missä ja milloin dataa käsitellään. Reunatietojenkäsittelyssä dataa käsitellään siellä, missä se syntyy, ja useimmissa tapauksissa data lähetetään välittömästi käsittelyn jälkeen. Sen sijaan sumutietojenkäsittelyssä raakadataa kerätään ja käsitellään useista lähteistä datakeskuksessa, joka sijaitsee datalähteen ja keskitetyn datakeskuksen välissä. Tietojen käsittely tällä tavalla mahdollistaa sen, että epäolennaisten tietojen tai tulosten välittämistä keskitettyyn datakeskukseen vältetään. Se, onko edge-laskenta, fog-laskenta vai näiden yhdistelmä paras ratkaisu, riippuu suuresti kunkin käyttötapauksen erityispiirteistä.
Mitkä ovat sumutietojenkäsittelyn edut?
Fog-laskenta tarjoaa ratkaisuja moniin pilvipohjaisiin IT-infrastruktuureihin liittyviin ongelmiin. Se painottaa lyhyitä tiedonsiirtoreittejä ja rajoittaa tiedostojen lähettämisen pilvipalveluun minimiin. Tässä ovat tärkeimmät edut:
- Vähemmän verkkoliikennettä: sumutietojenkäsittely vähentää IoT-laitteiden ja pilvipalvelun välistä liikennettä.
- Kustannussäästöjä kolmansien osapuolten verkkojen käytön ansiosta: verkko-operaattoreille aiheutuu korkeita kustannuksia pilvipalveluun suuntautuvasta nopeasta tiedonsiirrosta. Fog-laskenta vähentää näitä kustannuksia.
- Offline-käytettävyys: fog computing -arkkitehtuurissa IoT-laitteet ovat käytettävissä myös offline-tilassa.
- Pienempi viive: fog-laskenta lyhentää viestintäreittejä, mikä nopeuttaa automatisoituja analyysi- ja päätöksentekoprosesseja.
- Tietoturva: foggingissa laitetiedot esikäsitellään usein paikallisessa verkossa. Tämä mahdollistaa toteutuksen, jossa arkaluontoiset tiedot voivat jäädä yrityksen sisälle tai ne voidaan salata tai anonymisoida ennen pilvipalveluun lähettämistä.
Mitkä ovat sumutietojenkäsittelyn haitat?
Hajautetulla käsittelyllä pienissä datakeskuksissa on myös omat haittapuolensa. Suurimpia haittoja ovat hajautetun järjestelmän ylläpidon ja hallinnan kustannukset sekä monimutkaisuus. Fog-laskentajärjestelmien haittoja ovat:
- Korkeammat laitteistokustannukset: sumutietojenkäsittely edellyttää, että IoT-laitteet ja anturit varustetaan lisäprosessointiyksiköillä, jotta paikallinen tietojenkäsittely ja laitteiden välinen viestintä on mahdollista.
- Lisääntyneet ylläpitovaatimukset: hajautettu tietojenkäsittely vaatii enemmän ylläpitoa, koska käsittely- ja tallennuspaikat ovat hajautettuina koko verkkoon eikä niitä voida, toisin kuin pilviratkaisuissa, ylläpitää tai hallinnoida keskitetysti.
- Lisävaatimukset verkon tietoturvalle: fog-laskenta on alttiina man-in-the-middle-hyökkäyksille.