De acuerdo con la Unión In­te­r­na­cio­nal de Te­le­co­mu­ni­ca­cio­nes (ITU), más de tres mil millones de personas utilizan hoy en día las po­si­bi­li­da­des que brinda la red in­fo­r­má­ti­ca mundial, es decir, la World Wide Web (WWW), y cada vez es más común que estos usuarios hagan uso de ellas en su propia lengua materna. Esto es posible gracias a los nombres de dominio in­te­r­na­cio­na­li­za­dos, conocidos como IDN por sus siglas en inglés, que están a di­s­po­si­ción de los usuarios de Internet desde 2003. Descubre el fu­n­cio­na­mie­n­to de estos IDN.

¿Qué es un nombre de dominio in­te­r­na­cio­na­li­za­do (IDN)?

El IETF (Internet En­gi­nee­ri­ng Task Force) denomina nombres de dominio in­te­r­na­cio­na­li­za­dos (IDN) a los nombres de dominio que incluyen ca­ra­c­te­res es­pe­cia­les, como diéresis, ca­ra­c­te­res no incluidos en el alfabeto latino básico o ca­ra­c­te­res de otros alfabetos. Sin embargo, el DNS, que se encarga de traducir las URL en di­re­c­cio­nes IP y se basa en un conjunto limitado de ca­ra­c­te­res ASCII, no es capaz de entender estos nombres de dominio in­te­r­na­cio­na­li­za­dos.

Para que los IDN sean co­m­pre­n­si­bles tanto para el DNS como para otros pro­to­co­los de Internet, en 2003 se creó el protocolo “Nombres de dominio in­te­r­na­cio­na­li­za­dos en apli­ca­cio­nes” (IDNA), en el que se establece una tra­du­c­ción es­ta­n­da­ri­za­da de Unicode a ASCII, gracias a lo cual es posible utilizar ca­ra­c­te­res no ASCII en los nombres de dominio.

Domain Name Re­gi­s­tra­tion
Proyecta tu marca con un gran dominio
  • Gratis SSL Wildcard para tra­n­s­fe­re­n­cias de datos más seguras
  • Gratis registro privado para más pri­va­ci­dad  

¿Cómo funcionan los IDNA?

Para ga­ra­n­ti­zar que los nombres de dominio in­te­r­na­cio­na­li­za­dos también puedan ser uti­li­za­dos por los numerosos sistemas en Internet que solo soportan el conjunto de ca­ra­c­te­res ASCII, cada IDN en Unicode puede tra­du­ci­r­se en el formato ACE, que está basado en ca­ra­c­te­res ASCII. De esta manera, mientras que en el navegador se mostrarán di­re­c­cio­nes URL con diéresis, por ejemplo, el servidor las tra­n­s­fo­r­ma de forma que sean co­m­pa­ti­bles con ASCII. Este proceso es es­pe­ci­fi­ca­do tanto en el estándar de Internet IDNA2003 como en la revisión IDNA2008, au­to­ri­za­da en 2010. La tra­du­c­ción de Unicode a ASCII se lleva a cabo por la parte del cliente (en el navegador web, en el software de correo ele­c­tró­ni­co, por ejemplo) teniendo como base un pro­ce­di­mie­n­to es­ta­n­da­ri­za­do de co­di­fi­ca­ción que recibe el nombre de Punycode.

Punycode

El Punycode es­ta­n­da­ri­za­do en RFC 3492 fue de­sa­rro­lla­do para poder re­pre­se­n­tar se­cue­n­cias Unicode en ca­ra­c­te­res ASCII de manera clara y sin que se produzcan pérdidas. Para ello, todos los ca­ra­c­te­res que no sean ASCII se eliminan del nombre de dominio, se codifican y se adjuntan separados por un guion. Esta secuencia de códigos contiene la in­fo­r­ma­ción sobre el tipo de ca­ra­c­te­res Unicode de que se trata, así como de su posición en el nombre del dominio. En cada ACE creado, además, se antepone el prefijo xn–, el cual señala la secuencia de ca­ra­c­te­res de manera ine­quí­vo­ca como IDN, co­di­fi­ca­do de acuerdo con el protocolo IDNA y Punycode. En nuestro artículo sobre Punycode puedes encontrar más in­fo­r­ma­ción sobre este pro­ce­di­mie­n­to, además de algunos ejemplos.

Consejo

Con un co­n­ve­r­ti­dor de IDN online como Cy­be­r­ne­ti­cos puedes convertir los IDN en cadenas ACE usando punycode.

Di­fe­re­n­cias entre IDNA2003 e IDNA2008

En sus comienzos en 2003, las di­re­c­cio­nes URL in­te­r­na­cio­na­li­za­das se no­r­ma­li­za­ban con el algoritmo Nameprep antes de la co­di­fi­ca­ción en Punycode. Para ello, las ma­yú­s­cu­las se co­n­ve­r­tían en mi­nú­s­cu­las, se eli­mi­na­ban los ca­ra­c­te­res de control y se uni­fo­r­ma­ban los ca­ra­c­te­res equi­va­le­n­tes. Desde la aparición de la im­ple­me­n­ta­ción IDNA2008, Nameprep ya no forma parte del proceso de tra­du­c­ción. IDNA, por su parte, ya no fija ninguna no­r­ma­li­za­ción, aunque sí re­co­mie­n­da la uti­li­za­ción de un algoritmo que tra­n­s­fo­r­me las ma­yú­s­cu­las en mi­nú­s­cu­las.

Para poder leer un análisis detallado sobre las di­fe­re­n­cias entre IDNA2003 e IDNA2008, puedes acceder al Unicode Technical Standard #46. En la siguiente tabla te pre­se­n­ta­mos un resumen con las pri­n­ci­pa­les di­fe­re­n­cias:

IDNA2003 IDNA2008
No­r­ma­li­za­ción con Nameprep No se es­pe­ci­fi­ca no­r­ma­li­za­ción
Válido para Unicode 3.2 Válido a partir de Unicode a 5.2
Reglas estrictas para ti­po­gra­fías de escritura de derecha a izquierda Reglas más claras para ti­po­gra­fías de escritura de derecha a izquierda
Las ma­yú­s­cu­las y mi­nú­s­cu­las se co­n­si­de­ran como ca­ra­c­te­res separados Las ma­yú­s­cu­las se co­n­vie­r­ten di­re­c­ta­me­n­te en mi­nú­s­cu­las
Hay símbolos prohi­bi­dos, por ejemplo, símbolos gráficos que no pe­r­te­ne­cen a ningún sistema de escritura, así como algunos signos de pu­n­tua­ción
Eli­mi­na­ción del remapping de algunos ca­ra­c­te­res Unicode, ya que esto podría causar irre­gu­la­ri­da­des

Problemas con los IDN

En la ac­tua­li­dad todos los programas de Internet deberían poder entender los IDN. Sin embargo, debido a que la co­n­ve­r­sión de IDNA2003 a IDNA2008 en Internet no ha podido llevarse a cabo aún de un modo co­n­se­cue­n­te, pueden surgir problemas con los nombres in­te­r­na­cio­na­les. Además, puede darse el caso de que los usuarios no puedan in­tro­du­cir el carácter especial que compone el dominio in­te­r­na­cio­nal y, en su lugar, in­tro­du­z­can otro similar (lo que re­su­l­ta­ría en una URL diferente que dirigiría a otra página web distinta).

Para evitar este tipo de di­fi­cu­l­ta­des los ad­mi­ni­s­tra­do­res de páginas web pueden registrar ambas variantes y pueden redirigir el segundo dominio a la grafía que más prioridad tenga por medio de los métodos para re­di­re­c­cio­nar una página web.

Domain checker
Ir al menú principal