Tarp­tau­ti­nės te­le­ko­mu­ni­ka­ci­jų sąjungos (ITU) duo­me­ni­mis, pa­sau­li­niu tinklu naudojasi daugiau nei trys mi­li­jar­dai žmonių, ir vis dažniau jie tai daro savo gimtąja kalba. Šį pokytį iš dalies lėmė tarp­tau­ti­nių domenų vardų įvedimas 2003 metais. Pa­aiš­kin­si­me, kaip veikia IDN domenai.

Kas yra tarp­tau­ti­nis domeno vardas (IDN)?

IETF (Interneto in­ži­ne­ri­jos darbo grupė) IDN apibrėžia kaip domenų vardus, kuriuose yra specialių simbolių, ne­pri­klau­san­čių lotynų abėcėlei, pa­vyz­džiui, umlautų ar kitų abėcėlių simbolių. Tačiau domenų vardų sistema (DNS), kuri yra atsakinga už URL adresų vertimą į IP adresus, šių domenų vardų ne­su­pran­ta. DNS veikia remiantis ribotu stan­dar­ti­niu simbolių rinkiniu ASCII.

Siekiant, kad IDN būtų su­pran­ta­mi tiek DNS, tiek kitiems interneto pro­to­ko­lams, 2003 m. buvo sukurtas interneto stan­dar­tas „Domenų vardų in­ter­na­cio­na­li­za­vi­mas prog­ra­mo­se“ (IDNA). Jis apibrėžia stan­dar­ti­zuo­tą kon­ver­si­ją iš Unicode į ASCII, todėl domenų varduose galima naudoti ne ASCII simbolius.

Kaip veikia IDNA?

Didžioji dalis interneto inf­rastruk­tū­ros palaiko tik ASCII simbolių rinkinį. Siekiant už­tik­rin­ti, kad būtų galima apdoroti tarp­tau­ti­nius domenų vardus, kiek­vie­nas Unicode formatu pa­tei­kia­mas IDN verčiamas į ASCII pagrįstą ACE eilutę. Po to rodomi URL adresai, kuriuose yra simbolių su dia­kri­ti­niais ženklais ar umlautais. Kita vertus, serveris toliau apdoroja adresus kaip su­de­ri­na­mus su ASCII. Ši procedūra yra nurodyta interneto standarte IDNA2003 ir 2010 m. pa­tvir­tin­to­je IDNA2008 re­dak­ci­jo­je. Vertimas iš Unicode į ASCII vyksta kliento pusėje (nar­šyk­lė­je, el. pašto prog­ra­mo­je ir pan.) ir yra pagrįstas stan­dar­ti­zuo­tu kodavimo procesu, vadinamu Punycode.

Punycode

RFC 3492 standarte api­brėž­tas „Punycode“ buvo sukurtas tam, kad Unicode simbolių sekas būtų galima aiškiai rodyti kaip ASCII simbolius ne­pra­ran­dant kokybės. Visi ne ASCII simboliai iš domeno vardo pa­ša­li­na­mi, už­ko­duo­ja­mi ir at­ski­ria­mi brūkšne­liu. Ši kodų seka apima in­for­ma­ci­ją apie ati­tin­ka­mą Unicode simbolį bei jo vietą domeno varde. Be to, kiekviena tokiu būdu sukurta ACE eilutė pažymima prieš­dė­liu xn–. Tai skai­ty­to­jui paaiškina, kad simbolių seka yra IDN, už­ko­duo­tas pagal IDNA ir Punycode stan­dar­tus. Išsamų kodavimo proceso pa­aiš­ki­ni­mą bei keletą pavyzdžių rasite mūsų straips­ny­je apie Punycode.

Tip

Nau­do­da­mie­si in­ter­ne­ti­niu IDN domenų kon­ver­te­riu, galite kon­ver­tuo­ti IDN į ati­tin­ka­mas ACE eilutes, naudodami Punycode.

IDNA2003 ir IDNA2008 skirtumai

Pagal pradinę 2003 m. procedūrą tarp­tau­ti­niai URL adresai prieš kodavimą naudojant „Punycode“ buvo nor­ma­li­zuo­ja­mi taikant „nameprep“ metodą. Šis metodas di­džią­sias raides keisdavo į mažąsias, pa­ša­lin­da­vo valdymo simbolius ir ati­tin­ka­mus simbolius pa­vers­da­vo vienoda forma. Įvedus IDNA2008, „nameprep“ buvo pa­ša­lin­tas iš šio proceso. Dabar IDNA nenustato jokios nor­ma­li­za­ci­jos. Vietoj to re­ko­men­duo­ja­mas al­go­rit­mas, kuris di­džią­sias raides kon­ver­tuo­ja į mažąsias.

Šis pa­kei­ti­mas taip pat pa­leng­vi­na gyvenimą vokiškai kalbančių šalių var­to­to­jams, nes Vo­kie­ti­jo­je plačiai nau­do­ja­mas Unicode simbolis „ß“ pagal IDNA2003 standartą iš pradžių buvo api­brėž­tas kaip „ss“ ek­vi­va­len­tas. Todėl tokių domenų kaip www.fußball-ergebnisse.de „nameprep“ procese buvo au­to­ma­tiš­kai nor­ma­li­zuo­ja­mi į www.fussball-ergebnisse.de “. Nuo IDNA2008 įsi­ga­lio­ji­mo tai ne­be­vyks­ta. Nuo 2010 m. „ß“ teisingai in­ter­pre­tuo­ja­mas kaip „mažoji lotynų abėcėlės raidė „s“ su akcentu“ ir gali būti re­gist­ruo­ja­mas kaip IDN domeno dalis.

Be to, apie 8 000 simbolių, kurie buvo leidžiami domeno varduose pagal IDNA2003, pagal IDNA2008 nebėra palaikomi. Keturi simboliai, tarp jų ir „ß“, nuo standarto peržiūros yra in­ter­pre­tuo­ja­mi kitaip. Išsamią in­for­ma­ci­ją apie IDNA2003 ir IDNA2008 skirtumus rasite „Unicode“ tech­ni­nia­me standarte Nr. 46. Toliau pa­teik­to­je lentelėje api­bend­rin­ti pag­rin­di­niai skirtumai:

IDNA2003 IDNA2008
Rei­ka­lin­ga „Nameprep“ procedūra Nor­ma­li­za­vi­mas ne­nu­ro­dy­tas
Tinka Unicode 3.2 Galioja Unicode versijoms nuo 5.2
Griežtos taisyklės šriftams, rašomiems iš dešinės į kairę Aiškesnės taisyklės šriftams, rašomiems iš dešinės į kairę
Di­džio­sios ir mažosios raidės laikomos atskirais sim­bo­liais Di­džio­sios raidės kon­ver­tuo­ja­mos į mažąsias
Daugelis simbolių yra drau­džia­mi, pvz., grafiniai simboliai, ne­pri­klau­san­tys jokiai abėcėlei, taip pat kai kurie skyrybos ženklai
Iš kai kurių Unicode simbolių pa­ša­lin­tas „pe­rad­re­sa­vi­mas“, nes tai galėjo sukelti ne­tiks­lu­mus

Kokios problemos kyla dėl IDN?

Šiuo metu visos po­pu­lia­rios interneto programos turėtų gebėti atpažinti IDN. Tačiau kartais kyla problemų su tarp­tau­ti­niais domenų vardais, nes perėjimas nuo IDNA2003 prie IDNA2008 dar nėra nuo­sek­liai įgy­ven­din­tas. Vienas iš pavyzdžių, keliančių problemų vokiečių kalbai, yra skir­tin­gas simbolio „ß“ in­ter­pre­ta­vi­mas. Kadangi IDNA2003 pri­va­lo­mai kon­ver­tuo­ja „ß“ į „ss“, specialūs „ß“ domenai, kuriuos galima re­gist­ruo­ti pagal IDNA2008, dažnai yra ne­ap­tin­ka­mi sistemoms, kurios kon­ver­tuo­ja pagal pasenusį standartą. Vietoj to, var­to­to­jai nu­krei­pia­mi į ati­tin­ka­mą domeną, kuriame yra „ss“. Šią problemą galima apeiti, jei svetainių ope­ra­to­riai už­re­gist­ruo­ja abu variantus ir nukreipia antrąjį domeną į pri­o­ri­te­ti­nį rašybos variantą naudodami domeno nu­krei­pi­mą.

Go to Main Menu