Uma rede neural (neural network) é um sistema de tec­no­lo­gia da in­for­ma­ção inspirado na estrutura do cérebro humano e projetado para dotar com­pu­ta­do­res de in­te­li­gên­cia ar­ti­fi­cial (IA). Redes neurais são fun­da­men­tais (entre outras abor­da­gens) para apli­ca­ções modernas de IA, como o chatbot ChatGPT.

Existem di­fe­ren­tes tipos de redes neurais ar­ti­fi­ci­ais, cada uma com uma forma diferente de processar in­for­ma­ções no contexto do apren­di­zado profundo (deep learning). Nos últimos anos, grandes avanços nessa área puderam ser tes­te­mu­nha­dos. Redes neurais são uma tec­no­lo­gia essencial para ensinar máquinas a “pensar por conta própria”, o que permite que com­pu­ta­do­res resolvam problemas de forma autônoma e melhorem con­ti­nu­a­mente suas ca­pa­ci­da­des. Atu­al­mente, redes neurais são uti­li­za­das em sistemas mul­ti­mo­dais, capazes de combinar texto, imagem, áudio e vídeo.

Como funciona uma rede neural?

Redes neurais são ins­pi­ra­das na estrutura do cérebro humano, que processa in­for­ma­ções por meio de uma rede de neurônios.

s-Ue8SdQy3I.jpg Para exibir esse vídeo pre­ci­sa­mos usar cookies de terceiros. Você pode acessar e mudar suas con­fi­gu­ra­ções de cookies here.

Redes neurais ar­ti­fi­ci­ais podem ser descritas como modelos compostos por pelo menos duas camadas, uma de entrada e uma de saída, assim como por camadas in­ter­me­diá­rias, chamadas de camadas ocultas (hidden layers). Modelos modernos como de redes neurais con­vo­lu­ci­o­nais (CNN) baseadas em trans­for­mers ge­ral­mente requerem muitas camadas, mesmo para tarefas simples, já que a pro­fun­di­dade do modelo contribui para a efi­ci­ên­cia deste. Em cada uma das camadas existem vários neurônios ar­ti­fi­ci­ais es­pe­ci­a­li­za­dos.

Soluções de IA
Mais poder digital com In­te­li­gên­cia Ar­ti­fi­cial
  • Online em segundos
  • Aumente seu cres­ci­mento com marketing de IA
  • Economize tempo e recursos

Pro­ces­sa­mento de in­for­ma­ções por uma rede neural

O pro­ces­sa­mento de dados em uma rede neural segue sempre o mesmo princípio: as in­for­ma­ções chegam aos neurônios da camada de entrada na forma de padrões ou sinais, e são pro­ces­sa­das. Cada neurônio tem um peso associado, o que confere di­fe­ren­tes níveis de im­por­tân­cia a eles. Esse peso, jun­ta­mente com uma função de trans­fe­rên­cia, determina como os dados de entrada devem ser pro­ces­sa­dos e en­ca­mi­nha­dos.

Em seguida, uma função de ativação e um limiar são uti­li­za­dos para calcular e ponderar o valor de saída do neurônio. De­pen­dendo da avaliação e pon­de­ra­ção das in­for­ma­ções, di­fe­ren­tes neurônios são co­nec­ta­dos e ativados, com maior ou menor in­ten­si­dade.

Por meio dessas conexões e pon­de­ra­ções forma-se um algoritmo, que gera um resultado es­pe­cí­fico para cada entrada de dados. Os pesos são ajustados a cada trei­na­mento, apri­mo­rando o algoritmo e per­mi­tindo que a rede forneça re­sul­ta­dos cada vez mais precisos e eficazes.

Exemplo de aplicação de uma rede neural

Redes neurais podem ser usadas, por exemplo, para o re­co­nhe­ci­mento de imagens. Di­fe­ren­te­mente dos humanos, um com­pu­ta­dor não consegue iden­ti­fi­car ime­di­a­ta­mente se uma imagem mostra uma pessoa, uma planta ou um objeto: ele precisa analisar a imagem em busca de ca­rac­te­rís­ti­cas es­pe­cí­fi­cas para fazer esse re­co­nhe­ci­mento. As ca­rac­te­rís­ti­cas re­le­van­tes podem ser pré-definidas pelo algoritmo im­ple­men­tado ou des­co­berto pela máquina por meio de análises de dados.

Em cada camada da rede, o sistema avalia os sinais de entrada (neste caso as imagens) segundo critérios como cor, contornos e formas. A cada nova análise, o com­pu­ta­dor se torna mais preciso ao iden­ti­fi­car elementos presentes na imagem.

Ini­ci­al­mente, os re­sul­ta­dos ainda apre­sen­ta­rão erros. Quando a rede neural recebe feedback de um treinador humano e ajusta seu algoritmo de acordo, ocorre o apren­di­zado de máquina. No deep learning, o trei­na­mento humano pode ser dis­pen­sado. Nesse caso, o sistema aprende por ex­pe­ri­ên­cia própria. Assim, quanto mais imagens forem for­ne­ci­das, melhor será o de­sem­pe­nho.

Por fim, o ideal é que o algoritmo consiga iden­ti­fi­car cor­re­ta­mente o conteúdo das imagens, in­de­pen­den­te­mente de elas estarem em preto e branco, da posição ou do ângulo em que os objetos foram fo­to­gra­fa­dos.

Tipos de redes neurais

A estrutura das redes neurais varia conforme o tipo de apren­di­zado utilizado e a fi­na­li­dade da aplicação.

Per­cep­tron

A forma mais simples de rede neural, conhecida ini­ci­al­mente como per­cep­tron, era composta por um único neurônio, cuja resposta era mo­di­fi­cada com base em pesos e um valor de limiar. Hoje em dia, o termo também é utilizado para designar redes do tipo fe­ed­forward com apenas uma camada.

Redes fe­ed­forward

Redes neurais ar­ti­fi­ci­ais do tipo fe­ed­forward trans­mi­tem in­for­ma­ções em apenas uma direção: da entrada para a saída. Elas podem ter uma única camada (apenas entrada e saída) ou múltiplas camadas in­ter­me­diá­rias, chamadas de hidden layers.

Nota

Saiba mais sobre redes fe­ed­forward neste artigo es­pe­ci­a­li­zado do nosso Digital Guide.

Redes neurais re­cor­ren­tes

Em redes neurais re­cor­ren­tes, as in­for­ma­ções podem passar por laços de re­tro­a­li­men­ta­ção e retornar a camadas an­te­ri­o­res. Essas re­tro­a­li­men­ta­ções permitem que o sistema de­sen­volva uma espécie de memória. Redes re­cor­ren­tes são uti­li­za­das, por exemplo, em re­co­nhe­ci­mento de fala, na tradução au­to­má­tica e no re­co­nhe­ci­mento de escrita manual.

Nota

O nosso Digital Guide também tem mais detalhes sobre redes neurais re­cor­ren­tes.

Redes neurais con­vo­lu­ci­o­nais

São uma sub­ca­te­go­ria das redes neurais mul­ti­ca­ma­das. Redes neurais con­vo­lu­ci­o­nais são compostas por no mínimo cinco camadas. Em cada camada realiza-se uma detecção de padrões, sendo o resultado de uma camada repassado para a seguinte. Esse tipo de rede neural é am­pla­mente utilizado no re­co­nhe­ci­mento de imagens.

Nota

Acesse o nosso artigo es­pe­ci­a­li­zado em redes neurais con­vo­lu­ci­o­nais para obter in­for­ma­ções mais de­ta­lha­das.

Técnicas de apren­di­zado

Para que as conexões dentro de redes neurais ar­ti­fi­ci­ais sejam formadas de forma adequada à tarefa proposta, é ne­ces­sá­rio treiná-las. Existem dois métodos fun­da­men­tais de apren­di­zado:

Apren­di­zado su­per­vi­si­o­nado

No apren­di­zado su­per­vi­si­o­nado, define-se um resultado es­pe­cí­fico para cada entrada. Se, por exemplo, você deseja que o sistema reconheça imagens de gatos, humanos verificam e corrigem as clas­si­fi­ca­ções feitas pelo sistema, in­for­mando quais imagens foram cor­re­ta­mente ou in­cor­re­ta­mente re­co­nhe­ci­das. Com isso, os pesos das conexões dentro da rede são ajustados e o algoritmo é apri­mo­rado.

Apren­di­zado não su­per­vi­si­o­nado

No apren­di­zado não su­per­vi­si­o­nado, não se define pre­vi­a­mente qual deve ser o resultado da tarefa. Em vez disso, o sistema aprende apenas com base nas in­for­ma­ções de entrada. Técnicas como a Lei de Hebb e a Teoria da Res­so­nân­cia Adap­ta­tiva são usadas nesse contexto.

Apli­ca­bi­li­dade das redes neurais

Redes neurais são es­pe­ci­al­mente eficazes quando há uma grande quan­ti­dade de dados a serem ana­li­sa­dos, mas pouco co­nhe­ci­mento sis­te­má­tico sobre como resolver o problema. Casos clássicos de aplicação incluem o re­co­nhe­ci­mento de texto, imagem e voz, em que com­pu­ta­do­res analisam dados em busca de padrões para clas­si­ficá-los.

Redes neurais ar­ti­fi­ci­ais, como as con­vo­lu­ci­o­nais, permitem que com­pu­ta­do­res iden­ti­fi­quem o conteúdo de uma imagem. Essa tec­no­lo­gia é usada na análise de imagens médicas e também no controle de qualidade au­to­ma­ti­zado da indústria. Em alguns casos, redes neurais também são em­pre­ga­das na automação de controle, mo­ni­to­rando valores de re­fe­rên­cia e reagindo au­to­ma­ti­ca­mente à detecção de desvios, ou mesmo definindo valores com base em análises de dados.

Modelos de linguagem como o ChatGPT, baseados em redes neurais, geram textos de aparência natural, respondem perguntas e analisam grandes volumes de dados textuais.

As redes neurais ar­ti­fi­ci­ais também podem ser usadas para gerar previsões e si­mu­la­ções, previsões do tempo ou di­ag­nós­ti­cos médicos. Redes neurais con­vo­lu­ci­o­nais, por exemplo, permitem que com­pu­ta­do­res iden­ti­fi­quem conteúdos em imagens. A tec­no­lo­gia é empregada na análise de imagens médicas para detectar, por exemplo, tumores em ra­di­o­gra­fias.

Os avanços no apren­di­zado não su­per­vi­si­o­nado têm ampliado con­si­de­ra­vel­mente o campo de aplicação e o de­sem­pe­nho das redes neurais. Um dos casos mais em­ble­má­ti­cos é a síntese de voz de as­sis­ten­tes virtuais. Sistemas como Alexa, Siri e Google As­sis­tente utilizam redes neurais para converter fala em texto e responder de forma adequada. Modelos do tipo trans­for­mer, como o GPT e o BERT, re­vo­lu­ci­o­na­ram a qualidade da tradução au­to­má­tica.

História das redes neurais e pers­pec­ti­vas para o futuro

Redes neurais ganharam no­to­ri­e­dade pública nos últimos dez anos, jun­ta­mente com o avanço da in­te­li­gên­cia ar­ti­fi­cial, mas a tec­no­lo­gia em si já existe há décadas.

As primeiras ideias sobre redes neurais ar­ti­fi­ci­ais datam do início dos anos 1940. Warren McCulloch e Walter Pitts des­cre­ve­ram um modelo composto por unidades ele­men­ta­res co­nec­ta­das entre si, inspirado na estrutura do cérebro humano. Esse modelo era capaz de realizar pra­ti­ca­mente qualquer função arit­mé­tica. Em 1949, Donald Hebb de­sen­vol­veu a já men­ci­o­nada Lei de Hebb, ainda hoje aplicada em muitos modelos.

Em 1960, foi criada uma rede neural mun­di­al­mente utilizada para fins co­mer­ci­ais, com a função de filtrar ecos em telefones ana­ló­gi­cos. Depois disso, a pesquisa na área estagnou, porque ci­en­tis­tas con­cluí­ram que as redes neurais não con­se­guiam resolver problemas es­sen­ci­ais. Também se chegou à conclusão de que eram ne­ces­sá­rios grandes volumes de dados digitais para que os sistemas apren­des­sem de forma eficaz, o que não era viável na época.

Foi apenas com o sur­gi­mento do conceito de big data que o cenário começou a mudar. A in­tro­du­ção do algoritmo de re­tro­pro­pa­ga­ção (back­pro­pa­ga­tion) pos­si­bi­li­tou o trei­na­mento de redes neurais mul­ti­ca­ma­das, lançando as bases para os modelos modernos de deep learning. A com­bi­na­ção de grandes volumes de dados com o poder com­pu­ta­ci­o­nal das GPUs modernas levou a uma revolução na década de 2010. Fra­meworks como Ten­sor­Flow e PyTorch tornaram o de­sen­vol­vi­mento de redes neurais muito mais acessível.

O interesse pela in­te­li­gên­cia ar­ti­fi­cial e por redes neurais ressurgiu, e a vitória de uma CNN na com­pe­ti­ção ImageNet em 2012 marcou o início da era moderna do deep learning. Desde então, a tec­no­lo­gia evoluiu ra­pi­da­mente e passou a impactar pra­ti­ca­mente todos os campos da in­for­má­tica.

Hoje, o ritmo de de­sen­vol­vi­mento de redes neurais continua acelerado. Apesar de re­sul­ta­dos pro­mis­so­res, elas não são a única tec­no­lo­gia dis­po­ní­vel para im­ple­men­tar in­te­li­gên­cia ar­ti­fi­cial em com­pu­ta­do­res, sendo apenas uma das abor­da­gens possíveis — ainda que fre­quen­te­mente sejam vistas como a única opção viável no debate público. Pesquisas atuais vão além das redes neurais tra­di­ci­o­nais: modelos mul­ti­mo­dais, que integram texto, imagem e som, além de ini­ci­a­ti­vas voltadas à redução do consumo ener­gé­tico começam a ganhar destaque. Ao mesmo tempo, redes neurais estão cada vez mais presentes no nosso cotidiano, in­te­gra­das a smartpho­nes e ele­tro­do­més­ti­cos in­te­li­gen­tes.

Ir para o menu principal