Uma rede neural (neural network) é um sistema de tecnologia da informação inspirado na estrutura do cérebro humano e projetado para dotar computadores de inteligência artificial (IA). Redes neurais são fundamentais (entre outras abordagens) para aplicações modernas de IA, como o chatbot ChatGPT.

Existem diferentes tipos de redes neurais artificiais, cada uma com uma forma diferente de processar informações no contexto do aprendizado profundo (deep learning). Nos últimos anos, grandes avanços nessa área puderam ser testemunhados. Redes neurais são uma tecnologia essencial para ensinar máquinas a “pensar por conta própria”, o que permite que computadores resolvam problemas de forma autônoma e melhorem continuamente suas capacidades. Atualmente, redes neurais são utilizadas em sistemas multimodais, capazes de combinar texto, imagem, áudio e vídeo.

Como funciona uma rede neural?

Redes neurais são inspiradas na estrutura do cérebro humano, que processa informações por meio de uma rede de neurônios.

s-Ue8SdQy3I.jpg Para exibir esse vídeo precisamos usar cookies de terceiros. Você pode acessar e mudar suas configurações de cookies here.

Redes neurais artificiais podem ser descritas como modelos compostos por pelo menos duas camadas, uma de entrada e uma de saída, assim como por camadas intermediárias, chamadas de camadas ocultas (hidden layers). Modelos modernos como de redes neurais convolucionais (CNN) baseadas em transformers geralmente requerem muitas camadas, mesmo para tarefas simples, já que a profundidade do modelo contribui para a eficiência deste. Em cada uma das camadas existem vários neurônios artificiais especializados.

Processamento de informações por uma rede neural

O processamento de dados em uma rede neural segue sempre o mesmo princípio: as informações chegam aos neurônios da camada de entrada na forma de padrões ou sinais, e são processadas. Cada neurônio tem um peso associado, o que confere diferentes níveis de importância a eles. Esse peso, juntamente com uma função de transferência, determina como os dados de entrada devem ser processados e encaminhados.

Em seguida, uma função de ativação e um limiar são utilizados para calcular e ponderar o valor de saída do neurônio. Dependendo da avaliação e ponderação das informações, diferentes neurônios são conectados e ativados, com maior ou menor intensidade.

Por meio dessas conexões e ponderações forma-se um algoritmo, que gera um resultado específico para cada entrada de dados. Os pesos são ajustados a cada treinamento, aprimorando o algoritmo e permitindo que a rede forneça resultados cada vez mais precisos e eficazes.

Exemplo de aplicação de uma rede neural

Redes neurais podem ser usadas, por exemplo, para o reconhecimento de imagens. Diferentemente dos humanos, um computador não consegue identificar imediatamente se uma imagem mostra uma pessoa, uma planta ou um objeto: ele precisa analisar a imagem em busca de características específicas para fazer esse reconhecimento. As características relevantes podem ser pré-definidas pelo algoritmo implementado ou descoberto pela máquina por meio de análises de dados.

Em cada camada da rede, o sistema avalia os sinais de entrada (neste caso as imagens) segundo critérios como cor, contornos e formas. A cada nova análise, o computador se torna mais preciso ao identificar elementos presentes na imagem.

Inicialmente, os resultados ainda apresentarão erros. Quando a rede neural recebe feedback de um treinador humano e ajusta seu algoritmo de acordo, ocorre o aprendizado de máquina. No deep learning, o treinamento humano pode ser dispensado. Nesse caso, o sistema aprende por experiência própria. Assim, quanto mais imagens forem fornecidas, melhor será o desempenho.

Por fim, o ideal é que o algoritmo consiga identificar corretamente o conteúdo das imagens, independentemente de elas estarem em preto e branco, da posição ou do ângulo em que os objetos foram fotografados.

Tipos de redes neurais

A estrutura das redes neurais varia conforme o tipo de aprendizado utilizado e a finalidade da aplicação.

Perceptron

A forma mais simples de rede neural, conhecida inicialmente como perceptron, era composta por um único neurônio, cuja resposta era modificada com base em pesos e um valor de limiar. Hoje em dia, o termo também é utilizado para designar redes do tipo feedforward com apenas uma camada.

Redes feedforward

Redes neurais artificiais do tipo feedforward transmitem informações em apenas uma direção: da entrada para a saída. Elas podem ter uma única camada (apenas entrada e saída) ou múltiplas camadas intermediárias, chamadas de hidden layers.

Nota

Saiba mais sobre redes feedforward neste artigo especializado do nosso Digital Guide.

Redes neurais recorrentes

Em redes neurais recorrentes, as informações podem passar por laços de retroalimentação e retornar a camadas anteriores. Essas retroalimentações permitem que o sistema desenvolva uma espécie de memória. Redes recorrentes são utilizadas, por exemplo, em reconhecimento de fala, na tradução automática e no reconhecimento de escrita manual.

Nota

O nosso Digital Guide também tem mais detalhes sobre redes neurais recorrentes.

Redes neurais convolucionais

São uma subcategoria das redes neurais multicamadas. Redes neurais convolucionais são compostas por no mínimo cinco camadas. Em cada camada realiza-se uma detecção de padrões, sendo o resultado de uma camada repassado para a seguinte. Esse tipo de rede neural é amplamente utilizado no reconhecimento de imagens.

Nota

Acesse o nosso artigo especializado em redes neurais convolucionais para obter informações mais detalhadas.

Técnicas de aprendizado

Para que as conexões dentro de redes neurais artificiais sejam formadas de forma adequada à tarefa proposta, é necessário treiná-las. Existem dois métodos fundamentais de aprendizado:

Aprendizado supervisionado

No aprendizado supervisionado, define-se um resultado específico para cada entrada. Se, por exemplo, você deseja que o sistema reconheça imagens de gatos, humanos verificam e corrigem as classificações feitas pelo sistema, informando quais imagens foram corretamente ou incorretamente reconhecidas. Com isso, os pesos das conexões dentro da rede são ajustados e o algoritmo é aprimorado.

Aprendizado não supervisionado

No aprendizado não supervisionado, não se define previamente qual deve ser o resultado da tarefa. Em vez disso, o sistema aprende apenas com base nas informações de entrada. Técnicas como a Lei de Hebb e a Teoria da Ressonância Adaptativa são usadas nesse contexto.

Aplicabilidade das redes neurais

Redes neurais são especialmente eficazes quando há uma grande quantidade de dados a serem analisados, mas pouco conhecimento sistemático sobre como resolver o problema. Casos clássicos de aplicação incluem o reconhecimento de texto, imagem e voz, em que computadores analisam dados em busca de padrões para classificá-los.

Redes neurais artificiais, como as convolucionais, permitem que computadores identifiquem o conteúdo de uma imagem. Essa tecnologia é usada na análise de imagens médicas e também no controle de qualidade automatizado da indústria. Em alguns casos, redes neurais também são empregadas na automação de controle, monitorando valores de referência e reagindo automaticamente à detecção de desvios, ou mesmo definindo valores com base em análises de dados.

Modelos de linguagem como o ChatGPT, baseados em redes neurais, geram textos de aparência natural, respondem perguntas e analisam grandes volumes de dados textuais.

As redes neurais artificiais também podem ser usadas para gerar previsões e simulações, previsões do tempo ou diagnósticos médicos. Redes neurais convolucionais, por exemplo, permitem que computadores identifiquem conteúdos em imagens. A tecnologia é empregada na análise de imagens médicas para detectar, por exemplo, tumores em radiografias.

Os avanços no aprendizado não supervisionado têm ampliado consideravelmente o campo de aplicação e o desempenho das redes neurais. Um dos casos mais emblemáticos é a síntese de voz de assistentes virtuais. Sistemas como Alexa, Siri e Google Assistente utilizam redes neurais para converter fala em texto e responder de forma adequada. Modelos do tipo transformer, como o GPT e o BERT, revolucionaram a qualidade da tradução automática.

História das redes neurais e perspectivas para o futuro

Redes neurais ganharam notoriedade pública nos últimos dez anos, juntamente com o avanço da inteligência artificial, mas a tecnologia em si já existe há décadas.

As primeiras ideias sobre redes neurais artificiais datam do início dos anos 1940. Warren McCulloch e Walter Pitts descreveram um modelo composto por unidades elementares conectadas entre si, inspirado na estrutura do cérebro humano. Esse modelo era capaz de realizar praticamente qualquer função aritmética. Em 1949, Donald Hebb desenvolveu a já mencionada Lei de Hebb, ainda hoje aplicada em muitos modelos.

Em 1960, foi criada uma rede neural mundialmente utilizada para fins comerciais, com a função de filtrar ecos em telefones analógicos. Depois disso, a pesquisa na área estagnou, porque cientistas concluíram que as redes neurais não conseguiam resolver problemas essenciais. Também se chegou à conclusão de que eram necessários grandes volumes de dados digitais para que os sistemas aprendessem de forma eficaz, o que não era viável na época.

Foi apenas com o surgimento do conceito de big data que o cenário começou a mudar. A introdução do algoritmo de retropropagação (backpropagation) possibilitou o treinamento de redes neurais multicamadas, lançando as bases para os modelos modernos de deep learning. A combinação de grandes volumes de dados com o poder computacional das GPUs modernas levou a uma revolução na década de 2010. Frameworks como TensorFlow e PyTorch tornaram o desenvolvimento de redes neurais muito mais acessível.

O interesse pela inteligência artificial e por redes neurais ressurgiu, e a vitória de uma CNN na competição ImageNet em 2012 marcou o início da era moderna do deep learning. Desde então, a tecnologia evoluiu rapidamente e passou a impactar praticamente todos os campos da informática.

Hoje, o ritmo de desenvolvimento de redes neurais continua acelerado. Apesar de resultados promissores, elas não são a única tecnologia disponível para implementar inteligência artificial em computadores, sendo apenas uma das abordagens possíveis — ainda que frequentemente sejam vistas como a única opção viável no debate público. Pesquisas atuais vão além das redes neurais tradicionais: modelos multimodais, que integram texto, imagem e som, além de iniciativas voltadas à redução do consumo energético começam a ganhar destaque. Ao mesmo tempo, redes neurais estão cada vez mais presentes no nosso cotidiano, integradas a smartphones e eletrodomésticos inteligentes.

Este artigo foi útil?
Ir para o menu principal