Una red neuronal (en inglés, neural network) es un sistema dentro de la te­c­no­lo­gía de la in­fo­r­ma­ción inspirado en la es­tru­c­tu­ra del cerebro humano, que dota a los or­de­na­do­res de ca­ra­c­te­rí­s­ti­cas propias de la in­te­li­ge­n­cia ar­ti­fi­cial (IA). Las redes neu­ro­na­les son un co­m­po­ne­n­te fu­n­da­me­n­tal y una de las muchas me­to­do­lo­gías empleadas en las apli­ca­cio­nes modernas de IA, como los chatbots, por ejemplo, de ChatGPT.

Existen diversos tipos de redes neu­ro­na­les ar­ti­fi­cia­les, cada uno con di­fe­re­n­tes ca­pa­ci­da­des para procesar in­fo­r­ma­ción en el contexto del deep learning. En los últimos años, la in­ve­s­ti­ga­ción en este campo ha avanzado eno­r­me­me­n­te. Las redes neu­ro­na­les co­n­s­ti­tu­yen una te­c­no­lo­gía clave para enseñar a las máquinas a pensar de forma autónoma, pe­r­mi­tie­n­do que los or­de­na­do­res resuelvan problemas por sí mismos y mejoren sus ca­pa­ci­da­des. Hoy en día, las redes neu­ro­na­les forman parte de sistemas mu­l­ti­mo­da­les que integran texto, imagen, audio y vídeo.

¿Cómo funciona una neural network?

La es­tru­c­tu­ra de las redes neu­ro­na­les se basa en la del cerebro humano, es decir, en una red de neuronas a través de las cuales se transmite la in­fo­r­ma­ción.

Las redes neu­ro­na­les ar­ti­fi­cia­les pueden de­s­cri­bi­r­se como modelos de dos capas como mínimo: una de entrada y una de salida, así como, en la mayoría de los casos, otras capas in­te­r­me­dias (en inglés, hidden layers). Las redes modernas, como las redes neu­ro­na­les co­n­vo­lu­cio­na­les (CNN) o los modelos Tra­n­s­fo­r­mer, suelen requerir muchas capas, incluso para tareas sencillas, ya que la pro­fu­n­di­dad co­n­tri­bu­ye a su efi­cie­n­cia. En cada una de ellas se pueden encontrar numerosas neuronas ar­ti­fi­cia­les es­pe­cia­li­za­das.

He­rra­mie­n­tas de IA
Saca el máximo partido a la in­te­li­ge­n­cia ar­ti­fi­cial
  • Crea tu página web en tiempo récord
  • Impulsa tu negocio gracias al marketing de IA
  • Ahorra tiempo y obtén mejores re­su­l­ta­dos

Pro­ce­sa­mie­n­to de la in­fo­r­ma­ción en una red neuronal

En una red neuronal, el pro­ce­sa­mie­n­to de la in­fo­r­ma­ción se produce siempre de la misma manera: la in­fo­r­ma­ción llega a las neuronas de la capa de entrada en forma de patrón o señal y allí es procesada. Durante el proceso, a cada neurona se le asigna un peso numérico, que re­pre­se­n­ta el nivel de im­po­r­ta­n­cia de cada neurona. De este peso y de una función de tra­n­s­fe­re­n­cia depende la in­fo­r­ma­ción de entrada que se tra­n­s­mi­ti­rá.

En el siguiente paso, una función de ac­ti­va­ción y un valor de umbral se encargan de calcular y ponderar el valor de salida de la neurona. Según la eva­lua­ción y la po­n­de­ra­ción de la in­fo­r­ma­ción, se enlazarán otras neuronas y se activarán con mayor o menor fuerza.

Mediante estos enlaces y po­n­de­ra­cio­nes se modela un algoritmo que genera un resultado para cada input o in­fo­r­ma­ción de entrada. Los trainings sirven luego para afinar las po­n­de­ra­cio­nes y, con ellas, los al­go­ri­t­mos, para que la red dé re­su­l­ta­dos cada vez más exactos.

Red neuronal: ejemplo de uso

Las redes neu­ro­na­les pueden usarse, por ejemplo, para reconocer imágenes. Un ordenador por sí solo no es capaz de reconocer, como lo haría una persona de un vistazo, si en una foto aparece una casa, un perro o una planta, sino que para ello debe buscar ca­ra­c­te­rí­s­ti­cas concretas. Para saber qué ca­ra­c­te­rí­s­ti­cas le darán la respuesta, el ordenador puede o bien recurrir al algoritmo im­ple­me­n­ta­do o bien realizar él mismo un análisis de datos para ave­ri­guar­lo.

En cada una de las capas de la red, el sistema analiza las señales de entrada, es decir, las imágenes, en busca de criterios como el color, las esquinas o los contornos. Con cada análisis, el ordenador aprende a evaluar mejor el contenido de la imagen.

En un primer momento, los re­su­l­ta­dos dejan mucho que desear. Luego, con la ayuda del feedback de en­tre­na­do­res humanos, la red neuronal mejora su algoritmo: es lo que se denomina apre­n­di­za­je au­to­má­ti­co o machine learning. También existe el llamado pre­n­di­za­je profundo o deep learning, en el que no in­te­r­vie­nen personas, sino que el sistema aprende de su propia ex­pe­rie­n­cia y mejora en mayor medida cuanto más material gráfico se le presente.

El resultado final de este proceso debería ser, en el mejor de los casos, un algoritmo sin fallos, capaz de ide­n­ti­fi­car el contenido de las imágenes teniendo en cuenta, entre otras cosas, el en­tre­na­mie­n­to que ha recibido, si son imágenes a color o en blanco y negro o la posición del objeto en la imagen.

Tipos de redes neu­ro­na­les

De­pe­n­die­n­do del tipo de apre­n­di­za­je que se les haya aplicado y del fin con el que se quieran usar, existen es­tru­c­tu­ras de redes neu­ro­na­les muy variadas.

Pe­r­ce­p­trón

La red neuronal en su forma original y más sencilla es una red de una sola neurona que se modifica mediante po­n­de­ra­cio­nes y según su valor de umbral. El término pe­r­ce­p­trón se usa ac­tua­l­me­n­te también para designar redes pre­ali­me­n­ta­das o fee­d­fo­r­wa­rd de una sola capa.

Redes fee­d­fo­r­wa­rd o pre­ali­me­n­ta­das

Estas redes neu­ro­na­les ar­ti­fi­cia­les solo pueden tra­n­s­mi­tir in­fo­r­ma­ción en una dirección. Puede tratarse de redes de una sola capa (de entrada o de salida) o de más de una, con varias capas ocultas o in­te­r­me­dias (en inglés, hidden layers).

Nota

Descubre más sobre los redes fee­d­fo­r­wa­rd o pre­ali­me­n­ta­das en nuestra Digital Guide.

Redes neu­ro­na­les re­cu­rre­n­tes

En las redes re­cu­rre­n­tes, la in­fo­r­ma­ción puede recorrer también ciclos de feedback, volviendo atrás a través de las capas. La re­tro­ali­me­n­ta­ción permite que el sistema de­sa­rro­lle una memoria. Este tipo de redes se usan, por ejemplo, para el re­co­no­ci­mie­n­to de voz, la tra­du­c­ción y el re­co­no­ci­mie­n­to de texto ma­nu­s­cri­to.

Nota

Puedes obtener más in­fo­r­ma­ción detallada en nuestra guía es­pe­cí­fi­ca sobre redes neu­ro­na­les re­cu­rre­n­tes.

Redes neu­ro­na­les co­n­vo­lu­cio­na­les

Estas redes son una su­b­ca­te­go­ría de las redes de muchas capas, en concreto, han de tener al menos cinco. En cada una de ellas se realiza un re­co­no­ci­mie­n­to de patrones cuyo resultado se transmite a la siguiente capa. Este tipo de redes neu­ro­na­les se usan para reconocer imágenes.

Nota

En nuestra guía sobre redes neu­ro­na­les co­n­vo­lu­cio­na­les en­co­n­tra­rás in­fo­r­ma­ción más detallada.

Métodos de apre­n­di­za­je

Para que las co­ne­xio­nes en las redes neu­ro­na­les ar­ti­fi­cia­les se enlacen ade­cua­da­me­n­te y puedan resolver las tareas pro­pue­s­tas, hay que en­tre­nar­las pre­via­me­n­te. Para ello, existen dos procesos básicos:

Apre­n­di­za­je su­pe­r­vi­sa­do

En este tipo de apre­n­di­za­je se define un resultado concreto para di­fe­re­n­tes inputs o co­n­te­ni­dos de entrada. Si, por ejemplo, se espera que el sistema reconozca fotos de gatos, habrá personas que controlen la cla­si­fi­ca­ción realizada por el sistema y le hagan saber con qué imágenes ha acertado y con cuáles no. De este modo pueden mo­di­fi­car­se las po­n­de­ra­cio­nes en la red y optimizar el algoritmo.

Apre­n­di­za­je no su­pe­r­vi­sa­do

En un apre­n­di­za­je no su­pe­r­vi­sa­do, el resultado de la tarea no viene dado, sino que el sistema lo averigua ex­clu­si­va­me­n­te a partir de la in­fo­r­ma­ción de entrada. En este proceso in­te­r­vie­ne la ley de Hebb o la teoría de la re­so­na­n­cia adaptiva. Hoy en día, la práctica se centra en al­go­ri­t­mos como el descenso de gradiente es­to­cá­s­ti­co (SGD).

Ámbitos de apli­ca­ción de las redes neu­ro­na­les

Las redes neu­ro­na­les resultan es­pe­cia­l­me­n­te útiles y eficaces cuando hay muchos datos que evaluar y poco co­no­ci­mie­n­to acerca de cómo hacerlo si­s­te­má­ti­ca­me­n­te. Algunos casos típicos en los que se aplica son el re­co­no­ci­mie­n­to de texto, de imágenes y de voz, es decir, casos en los que el ordenador busca rasgos concretos en los datos para poder luego cla­si­fi­car­los.

Las redes neu­ro­na­les, como las redes neu­ro­na­les co­n­vo­lu­cio­na­les (CNN), permiten a los or­de­na­do­res reconocer co­n­te­ni­dos en imágenes. Esta te­c­no­lo­gía se utiliza en el análisis de imágenes médicas o en el control de calidad au­to­ma­ti­za­do en la industria. En estos casos, las redes neu­ro­na­les se aplican pa­r­cia­l­me­n­te en la técnica de control, donde su­pe­r­vi­san valores objetivo y, en caso de de­s­via­cio­nes, toman medidas co­rre­c­ti­vas de forma au­to­má­ti­ca o de­te­r­mi­nan valores objetivo de manera autónoma a partir del análisis de datos.

Modelos de lenguaje, como ChatGPT, basados en redes neu­ro­na­les, generan textos que suenan de forma realista, responden preguntas o analizan grandes ca­n­ti­da­des de datos textuales.

Las redes neu­ro­na­les ar­ti­fi­cia­les o ar­ti­fi­cial neural networks también pueden usarse para crear pro­nó­s­ti­cos y si­mu­la­cio­nes, como pueden ser las del ámbito de la me­teo­ro­lo­gía o del dia­g­nó­s­ti­co médico. Las redes neu­ro­na­les co­n­vo­lu­cio­na­les (CNN) permiten, por ejemplo, que los or­de­na­do­res re­co­no­z­can co­n­te­ni­dos en imágenes. Esta te­c­no­lo­gía se utiliza en el análisis de imágenes médicas para ide­n­ti­fi­car, por ejemplo, tumores en ra­dio­gra­fías.

Los avances en el apre­n­di­za­je no su­pe­r­vi­sa­do de redes neu­ro­na­les ar­ti­fi­cia­les están a punto de ampliar si­g­ni­fi­ca­ti­va­me­n­te el alcance y el re­n­di­mie­n­to de estas redes. Entre los casos de uso más de­s­ta­ca­dos de las redes neu­ro­na­les au­to­di­da­c­tas se encuentra la síntesis de voz en los asi­s­te­n­tes de voz. Sistemas como Alexa, Siri o Google Assistant utilizan redes neu­ro­na­les para convertir el habla en texto y responder a las consultas. Modelos Tra­n­s­fo­r­mer como GPT o BERT han re­vo­lu­cio­na­do la calidad de las tra­du­c­cio­nes au­to­má­ti­cas.

Historia y pe­r­s­pe­c­ti­vas de futuro

En la última década, las redes neu­ro­na­les han pasado a ser un tema muy popular a través del debate sobre in­te­li­ge­n­cia ar­ti­fi­cial. La te­c­no­lo­gía en sí, sin embargo, existe desde hace ya muchas décadas.

Los primeros esbozos de redes neu­ro­na­les ar­ti­fi­cia­les se remontan al principio de los años 40, cuando Warren McCulloch y Walter Pitts de­s­cri­bie­ron un modelo que in­te­r­co­ne­c­ta­ba unidades ele­me­n­ta­les y estaba inspirado en la es­tru­c­tu­ra del cerebro humano. Este modelo permitía calcular prá­c­ti­ca­me­n­te cualquier función ari­t­mé­ti­ca. En 1949, Donald Hebb de­sa­rro­lló la ley de apre­n­di­za­je neuronal pre­via­me­n­te me­n­cio­na­da y que hoy en día sigue apli­cá­n­do­se en muchas redes neu­ro­na­les.

En 1960 se de­sa­rro­lló una web neuronal que tuvo un gran éxito comercial porque servía para reducir el eco en la telefonía analógica. La in­ve­s­ti­ga­ción al respecto, sin embargo, se redujo poco después. Por un lado, porque cie­n­tí­fi­cos de­s­ta­ca­dos llegaron a la co­n­clu­sión de que el modelo de redes neu­ro­na­les no podría so­lu­cio­nar problemas im­po­r­ta­n­tes. Por otro, porque un apre­n­di­za­je efectivo requería grandes ca­n­ti­da­des de datos digitales, de las que entonces no se disponía.

Fue con la llegada del big data cuando esto cambió. La in­tro­du­c­ción del algoritmo de re­tro­pro­pa­ga­ción hizo posible entrenar redes multicapa, sentando las bases de los modelos modernos de deep learning. La co­m­bi­na­ción de grandes volúmenes de datos y la potencia de cálculo de los pro­ce­sa­do­res gráficos modernos (GPU) supuso un gran avance en la década de 2010. Fra­me­wo­r­ks como Te­n­so­r­Flow y PyTorch hicieron que el de­sa­rro­llo de redes neu­ro­na­les fuera más accesible.

El interés por la in­te­li­ge­n­cia ar­ti­fi­cial y las redes neu­ro­na­les resurgió, y la victoria de una CNN en la co­m­pe­ti­ción de ImageNet en 2012 marcó el inicio del deep learning moderno. Desde entonces, esta te­c­no­lo­gía ha crecido rá­pi­da­me­n­te en im­po­r­ta­n­cia e influye en prá­c­ti­ca­me­n­te todos los campos de la in­fo­r­má­ti­ca.

Desde entonces, el de­sa­rro­llo en este campo avanza a un ritmo ve­r­ti­gi­no­so. Aunque los re­su­l­ta­dos son pro­me­te­do­res, las redes neu­ro­na­les no son la única te­c­no­lo­gía para im­ple­me­n­tar in­te­li­ge­n­cia ar­ti­fi­cial en los or­de­na­do­res. Re­pre­se­n­tan solo una de las muchas po­si­bi­li­da­des, aunque en el debate público a menudo se presentan como el único camino viable. Ac­tua­l­me­n­te, la in­ve­s­ti­ga­ción va más allá de las redes neu­ro­na­les clásicas. Los modelos mu­l­ti­mo­da­les, que combinan texto, imagen y voz, junto con enfoques para reducir el consumo de energía, están en el centro de atención. Al mismo tiempo, las redes neu­ro­na­les se integran cada vez más en apli­ca­cio­nes co­ti­dia­nas, desde sma­r­t­pho­nes hasta di­s­po­si­ti­vos in­te­li­ge­n­tes para el hogar.

Ir al menú principal