Una red neuronal (en inglés, neural network) es un sistema dentro de la tecnología de la información inspirado en la estructura del cerebro humano, que dota a los ordenadores de características propias de la inteligencia artificial (IA). Las redes neuronales son un componente fundamental y una de las muchas metodologías empleadas en las aplicaciones modernas de IA, como los chatbots, por ejemplo, de ChatGPT.

Existen diversos tipos de redes neuronales artificiales, cada uno con diferentes capacidades para procesar información en el contexto del deep learning. En los últimos años, la investigación en este campo ha avanzado enormemente. Las redes neuronales constituyen una tecnología clave para enseñar a las máquinas a pensar de forma autónoma, permitiendo que los ordenadores resuelvan problemas por sí mismos y mejoren sus capacidades. Hoy en día, las redes neuronales forman parte de sistemas multimodales que integran texto, imagen, audio y vídeo.

¿Cómo funciona una neural network?

La estructura de las redes neuronales se basa en la del cerebro humano, es decir, en una red de neuronas a través de las cuales se transmite la información.

Las redes neuronales artificiales pueden describirse como modelos de dos capas como mínimo: una de entrada y una de salida, así como, en la mayoría de los casos, otras capas intermedias (en inglés, hidden layers). Las redes modernas, como las redes neuronales convolucionales (CNN) o los modelos Transformer, suelen requerir muchas capas, incluso para tareas sencillas, ya que la profundidad contribuye a su eficiencia. En cada una de ellas se pueden encontrar numerosas neuronas artificiales especializadas.

Herramientas de IA
Saca el máximo partido a la inteligencia artificial
  • Crea tu página web en tiempo récord
  • Impulsa tu negocio gracias al marketing de IA
  • Ahorra tiempo y obtén mejores resultados

Procesamiento de la información en una red neuronal

En una red neuronal, el procesamiento de la información se produce siempre de la misma manera: la información llega a las neuronas de la capa de entrada en forma de patrón o señal y allí es procesada. Durante el proceso, a cada neurona se le asigna un peso numérico, que representa el nivel de importancia de cada neurona. De este peso y de una función de transferencia depende la información de entrada que se transmitirá.

En el siguiente paso, una función de activación y un valor de umbral se encargan de calcular y ponderar el valor de salida de la neurona. Según la evaluación y la ponderación de la información, se enlazarán otras neuronas y se activarán con mayor o menor fuerza.

Mediante estos enlaces y ponderaciones se modela un algoritmo que genera un resultado para cada input o información de entrada. Los trainings sirven luego para afinar las ponderaciones y, con ellas, los algoritmos, para que la red dé resultados cada vez más exactos.

Red neuronal: ejemplo de uso

Las redes neuronales pueden usarse, por ejemplo, para reconocer imágenes. Un ordenador por sí solo no es capaz de reconocer, como lo haría una persona de un vistazo, si en una foto aparece una casa, un perro o una planta, sino que para ello debe buscar características concretas. Para saber qué características le darán la respuesta, el ordenador puede o bien recurrir al algoritmo implementado o bien realizar él mismo un análisis de datos para averiguarlo.

En cada una de las capas de la red, el sistema analiza las señales de entrada, es decir, las imágenes, en busca de criterios como el color, las esquinas o los contornos. Con cada análisis, el ordenador aprende a evaluar mejor el contenido de la imagen.

En un primer momento, los resultados dejan mucho que desear. Luego, con la ayuda del feedback de entrenadores humanos, la red neuronal mejora su algoritmo: es lo que se denomina aprendizaje automático o machine learning. También existe el llamado prendizaje profundo o deep learning, en el que no intervienen personas, sino que el sistema aprende de su propia experiencia y mejora en mayor medida cuanto más material gráfico se le presente.

El resultado final de este proceso debería ser, en el mejor de los casos, un algoritmo sin fallos, capaz de identificar el contenido de las imágenes teniendo en cuenta, entre otras cosas, el entrenamiento que ha recibido, si son imágenes a color o en blanco y negro o la posición del objeto en la imagen.

Tipos de redes neuronales

Dependiendo del tipo de aprendizaje que se les haya aplicado y del fin con el que se quieran usar, existen estructuras de redes neuronales muy variadas.

Perceptrón

La red neuronal en su forma original y más sencilla es una red de una sola neurona que se modifica mediante ponderaciones y según su valor de umbral. El término perceptrón se usa actualmente también para designar redes prealimentadas o feedforward de una sola capa.

Redes feedforward o prealimentadas

Estas redes neuronales artificiales solo pueden transmitir información en una dirección. Puede tratarse de redes de una sola capa (de entrada o de salida) o de más de una, con varias capas ocultas o intermedias (en inglés, hidden layers).

Nota

Descubre más sobre los redes feedforward o prealimentadas en nuestra Digital Guide.

Redes neuronales recurrentes

En las redes recurrentes, la información puede recorrer también ciclos de feedback, volviendo atrás a través de las capas. La retroalimentación permite que el sistema desarrolle una memoria. Este tipo de redes se usan, por ejemplo, para el reconocimiento de voz, la traducción y el reconocimiento de texto manuscrito.

Nota

Puedes obtener más información detallada en nuestra guía específica sobre redes neuronales recurrentes.

Redes neuronales convolucionales

Estas redes son una subcategoría de las redes de muchas capas, en concreto, han de tener al menos cinco. En cada una de ellas se realiza un reconocimiento de patrones cuyo resultado se transmite a la siguiente capa. Este tipo de redes neuronales se usan para reconocer imágenes.

Nota

En nuestra guía sobre redes neuronales convolucionales encontrarás información más detallada.

Métodos de aprendizaje

Para que las conexiones en las redes neuronales artificiales se enlacen adecuadamente y puedan resolver las tareas propuestas, hay que entrenarlas previamente. Para ello, existen dos procesos básicos:

Aprendizaje supervisado

En este tipo de aprendizaje se define un resultado concreto para diferentes inputs o contenidos de entrada. Si, por ejemplo, se espera que el sistema reconozca fotos de gatos, habrá personas que controlen la clasificación realizada por el sistema y le hagan saber con qué imágenes ha acertado y con cuáles no. De este modo pueden modificarse las ponderaciones en la red y optimizar el algoritmo.

Aprendizaje no supervisado

En un aprendizaje no supervisado, el resultado de la tarea no viene dado, sino que el sistema lo averigua exclusivamente a partir de la información de entrada. En este proceso interviene la ley de Hebb o la teoría de la resonancia adaptiva. Hoy en día, la práctica se centra en algoritmos como el descenso de gradiente estocástico (SGD).

Ámbitos de aplicación de las redes neuronales

Las redes neuronales resultan especialmente útiles y eficaces cuando hay muchos datos que evaluar y poco conocimiento acerca de cómo hacerlo sistemáticamente. Algunos casos típicos en los que se aplica son el reconocimiento de texto, de imágenes y de voz, es decir, casos en los que el ordenador busca rasgos concretos en los datos para poder luego clasificarlos.

Las redes neuronales, como las redes neuronales convolucionales (CNN), permiten a los ordenadores reconocer contenidos en imágenes. Esta tecnología se utiliza en el análisis de imágenes médicas o en el control de calidad automatizado en la industria. En estos casos, las redes neuronales se aplican parcialmente en la técnica de control, donde supervisan valores objetivo y, en caso de desviaciones, toman medidas correctivas de forma automática o determinan valores objetivo de manera autónoma a partir del análisis de datos.

Modelos de lenguaje, como ChatGPT, basados en redes neuronales, generan textos que suenan de forma realista, responden preguntas o analizan grandes cantidades de datos textuales.

Las redes neuronales artificiales o artificial neural networks también pueden usarse para crear pronósticos y simulaciones, como pueden ser las del ámbito de la meteorología o del diagnóstico médico. Las redes neuronales convolucionales (CNN) permiten, por ejemplo, que los ordenadores reconozcan contenidos en imágenes. Esta tecnología se utiliza en el análisis de imágenes médicas para identificar, por ejemplo, tumores en radiografías.

Los avances en el aprendizaje no supervisado de redes neuronales artificiales están a punto de ampliar significativamente el alcance y el rendimiento de estas redes. Entre los casos de uso más destacados de las redes neuronales autodidactas se encuentra la síntesis de voz en los asistentes de voz. Sistemas como Alexa, Siri o Google Assistant utilizan redes neuronales para convertir el habla en texto y responder a las consultas. Modelos Transformer como GPT o BERT han revolucionado la calidad de las traducciones automáticas.

Historia y perspectivas de futuro

En la última década, las redes neuronales han pasado a ser un tema muy popular a través del debate sobre inteligencia artificial. La tecnología en sí, sin embargo, existe desde hace ya muchas décadas.

Los primeros esbozos de redes neuronales artificiales se remontan al principio de los años 40, cuando Warren McCulloch y Walter Pitts describieron un modelo que interconectaba unidades elementales y estaba inspirado en la estructura del cerebro humano. Este modelo permitía calcular prácticamente cualquier función aritmética. En 1949, Donald Hebb desarrolló la ley de aprendizaje neuronal previamente mencionada y que hoy en día sigue aplicándose en muchas redes neuronales.

En 1960 se desarrolló una web neuronal que tuvo un gran éxito comercial porque servía para reducir el eco en la telefonía analógica. La investigación al respecto, sin embargo, se redujo poco después. Por un lado, porque científicos destacados llegaron a la conclusión de que el modelo de redes neuronales no podría solucionar problemas importantes. Por otro, porque un aprendizaje efectivo requería grandes cantidades de datos digitales, de las que entonces no se disponía.

Fue con la llegada del big data cuando esto cambió. La introducción del algoritmo de retropropagación hizo posible entrenar redes multicapa, sentando las bases de los modelos modernos de deep learning. La combinación de grandes volúmenes de datos y la potencia de cálculo de los procesadores gráficos modernos (GPU) supuso un gran avance en la década de 2010. Frameworks como TensorFlow y PyTorch hicieron que el desarrollo de redes neuronales fuera más accesible.

El interés por la inteligencia artificial y las redes neuronales resurgió, y la victoria de una CNN en la competición de ImageNet en 2012 marcó el inicio del deep learning moderno. Desde entonces, esta tecnología ha crecido rápidamente en importancia e influye en prácticamente todos los campos de la informática.

Desde entonces, el desarrollo en este campo avanza a un ritmo vertiginoso. Aunque los resultados son prometedores, las redes neuronales no son la única tecnología para implementar inteligencia artificial en los ordenadores. Representan solo una de las muchas posibilidades, aunque en el debate público a menudo se presentan como el único camino viable. Actualmente, la investigación va más allá de las redes neuronales clásicas. Los modelos multimodales, que combinan texto, imagen y voz, junto con enfoques para reducir el consumo de energía, están en el centro de atención. Al mismo tiempo, las redes neuronales se integran cada vez más en aplicaciones cotidianas, desde smartphones hasta dispositivos inteligentes para el hogar.

¿Le ha resultado útil este artículo?
Ir al menú principal