Mitä URL-kaappaus on ja miten sitä voi estää?
URL-kaappaus voi johtaa siihen, että verkkosivustosi poistetaan hakukoneen hakutuloksista ja piilotetaan potentiaalisilta kävijöiltä. Tämä ilmiö esiintyy yleisesti silloin, kun linkkien sijaan käytetään uudelleenohjauksia.
Mitä URL-kaappaus on?
URL-kaappaus tarkoittaa ilmiötä, jossa verkkosivusto katoaa hakukoneen tuloksista ja korvataan toisella sivustolla. Tämä toinen sivusto ohjaa käyttäjän varsinaiselle kohdesivulle tai URL-osoitteeseen uudelleenohjauksen avulla. Esimerkiksi linked-site.com ohjaa sivustolle your-site.com, mutta käyttää uudelleenohjausta tavallisen HTML-tagin <a> sijaan. Uudelleenohjattu URL-osoite näyttää seuraavalta:
www.linked-site.com/redirect .php?target=www.your-site.comKun hakukone löytää tällaisen linkin, se luokittelee linkitetyn sivuston ja kohdesivuston identtisiksi, mikä tarkoittaa, että se poistaa toisen näistä hakemistosta. Se perustuu uudelleenohjaukseen liitettyihin HTTP-tilakoodeihin.
Kun koodi 301 (Siirretty pysyvästi) tarkoittaa pysyvää uudelleenohjausta annetusta URL-osoitteesta, koodi 302 (Löytyi) tarkoittaa väliaikaista uudelleenohjausta määritettyyn URL-osoitteeseen. Ensimmäinen tyyppi ei aiheuta ongelmia, mutta 302-uudelleenohjaus on URL-kaappauksen pääasiallinen syy. Nämä hyvin tehdyt uudelleenohjaukset antavat hakukoneen indeksointirobotille kuvan, että kohdesivusto on vain väliaikainen ja että linkitetty sivu on itse asiassa alkuperäinen – eikä indeksointirobotti koskaan tarkista, ovatko sivustot todella toisiinsa liittyviä. Jos tätä ei tarkisteta, väärä sivu indeksoidaan ja se saa linkitetyn URL-osoitteen sijoituksen.
Milloin 301- ja 302-uudelleenohjauksia käytetään?
URL-uudelleenohjauksia käytetään monista eri syistä. Tästä syystä kirjoitusvirheellisten verkkotunnusten pysyvä uudelleenohjaus oikealle verkkotunnukselle on yleinen käytäntö. Jos esimerkiksi kirjoitat vahingossa selaimen osoiteriville googel.com google.com sijaan, sinut ohjataan silti suositun hakukoneen aloitussivulle. Pysyvä uudelleenohjaus pääsivun oikeaan osoitteeseen ei myöskään ole harvinaista.
Jos esimerkiksi avaat englanninkielisen Wikipedian pääsivun ja kirjoitat osoitteeseen en.wikipedia.org, sinut ohjataan 301-uudelleenohjauksen avulla osoitteeseen en.wikipedia.org/wiki/Main_Page. Kehittäjät käyttävät pysyviä uudelleenohjauksia myös ohjaamaan kävijöitä uuteen verkko-osoitteeseen verkkotunnuksen vaihdon jälkeen tai osoittamaan verkkoprojektin sisällön, jolle on annettu uusi URL-osoite.
Toisaalta väliaikaisia 302-uudelleenohjauksia käytetään pääasiassa toisen URL-osoitteen sisällön väliaikaiseen näyttämiseen, jotta se pysyy saatavilla esimerkiksi silloin, kun alkuperäistä sivua huolletaan. Jos kehittäjä luo tällaisen uudelleenohjauksen manuaalisesti, tarkoituksena on, että sisältö näkyy myöhemmin jälleen alkuperäisessä URL-osoitteessa. On olemassa kolme väliaikaista uudelleenohjaustapausta, jotka voivat johtaa URL-kaappaukseen, ja yksi niistä käytetään tarkoituksella juuri tähän tarkoitukseen:
302-uudelleenohjauksen tahaton käyttö
On täysin mahdollista, että kehittäjät linkittävät toiseen verkkoprojektiin väliaikaisella uudelleenohjauksella ilman pahantahtoisia aikeita. Kyseessä voi olla virhe, kun heidän tarkoituksenaan oli asettaa pysyvä uudelleenohjaus. Apache-verkkopalvelimen URL-uudelleenkirjoitusmoottori mod_rewrite asettaa oletusarvoiset uudelleenohjaukset tilakoodilla 302.
Dynaamisesti luodut URL-osoitteet
PHP on laajalti käytetty skriptikieli verkkosivujen kehittämisessä. Tällä ohjelmointikielellä kirjoitetut palvelinskriptit ovat yksinkertainen ja käytännöllinen tapa luoda dynaamista sisältöä verkkosivustollesi. Usein kyseessä ovat kuitenkin myös PHP-skriptit, jotka integroivat kohdeosoitteet dynaamisesti olemassa olevaan URL-osoitteeseen käyttämällä väliaikaista uudelleenohjauskoodia 302. Tällaisia skriptejä käytetään pääasiassa verkkosivustohakemistoissa, mutta myös monissa sisällönhallintajärjestelmissä.
Tahallinen URL-kaappaus
Myös rikolliset osaavat hyödyntää URL-kaappauksia ja käyttävät niitä mielellään hyväkseen. He käyttävät tietoisesti 302-uudelleenohjauksia nostaakseen omaa sisältöään hakukoneiden tuloksissa ja ”kaapatakseen” erityisesti hyvin sijoittuneita sivuja. Tämä taktiikka ei ole kestävä eikä laillinen, ja se kuuluu niin sanotun black hat -hakukoneoptimoinnin piiriin.
URL-kaappaus verrattuna muihin hyökkäysmenetelmiin
URL-kaappaus sekoitetaan usein muihin hyökkäysmenetelmiin, kuten verkkotunnuksen kaappaukseen tai typosquattingiin. Nämä ovat itse asiassa erilaisia hyökkäystyyppejä, joita voidaan käyttää vahingoittamaan sinua tai verkkosivustosi sijoitusta hakukoneissa.
URL-kaappaus vs. verkkotunnuksen kaappaus
Vaikka sekä URL-kaappausta että verkkotunnuksen kaappausta käytetään verkkosivuston hallinnan saamiseksi, nämä kaksi hyökkäysmenetelmää eroavat toisistaan etenkin toteutustavansa osalta:
Verkkotunnuksen kaappaus tarkoittaa sitä, että hyökkääjät saavat verkkotunnuksen hallintaansa pääsemällä käsiksi verkkotunnuksen hallintatileihin, esimerkiksi muuttamalla DNS-asetuksia. Pahimmassa tapauksessa hyökkääjät voivat kaapata uhrin koko verkkosivuston.
URL-kaappaus vs. typosquatting
Kuten nimestäkin voi päätellä, typosquatting-hyökkäystekniikka hyödyntää kirjoitusvirheitä. Kun uudelleenohjauksia käytetään yleensä auttamaan kävijää pääsemään halutulle verkkosivustolle pienistä kirjoitusvirheistä huolimatta, juuri tässä typosquatting iskee. Hyökkääjät rekisteröivät tarkoituksella verkkotunnuksia, joissa on yleisiä kirjoitusvirheitä, ohjataakseen kävijät omalle verkkosivustolleen, joka sisältää usein haitallista koodia.
Kuinka suojata verkkosivustosi URL-kaappauksilta
Verkkosivustojen ylläpitäjät, jotka pyrkivät parantamaan sivustonsa sijoitusta hakukoneissa, tietävät, kuinka haastava ja aikaa vievä prosessi se on. Mitä korkeammalle nouset hakukoneiden tuloksissa, sitä todennäköisemmin indeksoidut sivusi joutuvat kaappauksen kohteeksi. Toisin kuin hyökkäykset, jotka johtuvat verkkoprojektin tietoturva-aukkoista, URL-kaappaus liittyy läheisesti linkkien rakentamiseen, joka on keskeinen osa hakukoneoptimointia, joten sitä ei voida estää pelkästään virustorjuntaohjelmiston avulla.
Tämän vuoksi on äärimmäisen tärkeää analysoida säännöllisesti sekä uusia että olemassa olevia linkkejä ongelmallisten URL-osoitteiden karsimiseksi. Tätä varten on olemassa useita työkaluja ja palveluita, kuten:
Google tarjoaa URL-poistotyökalun, jonka avulla voit poistaa hakuhakemistosta kaikki ei-toivotut uudelleenohjaukset, jotka viittaavat verkkosivustoosi. Ennen kuin teet näin, sinun tulisi aina ottaa yhteyttä sivustosta vastaavaan ylläpitäjään ja pyytää häntä muuttamaan uudelleenohjausasetuksia. Näin on mahdollista säilyttää kyseiset takaisinlinkit. Tilan koodi 307 (Temporary Redirect) sisältää vaihtoehdon väliaikaiseen uudelleenohjaukseen, joka ei johda URL-kaappaukseen. Tämä vaihtoehto on ollut käytettävissä HTTP 1.1:stä lähtien. Jos alkuperäinen sivusto puuttuu jo hakukoneiden indeksistä, sinun tulisi ottaa yhteyttä hakukoneen tarjoajaan ja pyytää alkuperäisten sijoitusten palauttamista, kun olet korjannut tai poistanut vahingoittuneen takaisinlinkin.