O que é Unsupervised Learning: Aprendizagem não supervisionada
Na aprendizagem não supervisionada (Unsupervised Learning), um modelo de inteligência artificial (IA) é treinado com dados não rotulados para descobrir padrões ocultos, conexões e semelhanças. Conheça o processo em detalhes.
O que é Unsupervised Learning?
Unsupervised Learning é um método de análise de dados do campo da inteligência artificial no qual algoritmos de aprendizado de máquina procuram similaridades entre vários valores de entrada. No aprendizado não supervisionado, um computador tenta reconhecer padrões e estruturas nos dados de entrada por conta própria.
Esse método é o oposto da aprendizagem supervisionada, em que desenvolvedores mantêm controle total e definem claramente o objetivo de aprendizagem. No entanto, na aprendizagem supervisionada, os dados de treinamento precisam ser rotulados ou categorizados manualmente antes do treinamento, o que exige muito mais tempo.
- Online em segundos
- Aumente seu crescimento com marketing de IA
- Economize tempo e recursos
Como funciona a aprendizagem não supervisionada?
Em poucas palavras, essa técnica de aprendizado envolve uma rede neural artificial que analisa uma grande quantidade de informações para identificar conexões, padrões e semelhanças nos dados. O processo é baseado em diferentes métodos: um deles é o clustering, também conhecido como método de agrupamento. Nele, algoritmos formam clusters (agrupamentos) de maneira autônoma, aos quais os dados são atribuídos posteriormente.
Por exemplo, se os dados consistirem de fotos de cães e gatos, o programa, ao realizar aprendizagem não supervisionada, compararia e agruparia essas fotos com base em características. Embora a tarefa de distinguir entre cães e gatos não seja predefinida, o algoritmo consegue fazer essa diferenciação. Na aprendizagem não supervisionada, algoritmos tomam decisões com base em similaridades e diferenças entre imagens, como a cor da pelagem dos animais.
Outro método é a associação. Nele, dados que compartilham algum atributo são categorizados. A tarefa dos algoritmos é encontrar objetos relacionados, mesmo que esses objetos não sejam iguais ou semelhantes. De volta ao exemplo das fotos de cães, no caso da associação, o algoritmo de aprendizagem não supervisionada não agruparia todos os cães, mas associaria, por exemplo, uma coleira ao próprio cão.
Para exibir esse vídeo precisamos usar cookies de terceiros. Você pode acessar e mudar suas configurações de cookies here. Em que contextos a aprendizagem não supervisionada é utilizada?
Na prática, diferentes exemplos de Unsupervised Learning podem ser apresentados. Como essa técnica permite que programas aprendam as regras do jogo e estratégias vencedoras, ela pode ser utilizada para otimizar resultados na bolsa de valores. Nesse caso, os dados brutos dos preços podem ser apresentados ao programa, que preverá atividades de mercado e tendências.
A inteligência artificial, especialmente a aprendizagem não supervisionada, também é aplicada em várias outras áreas. Agrupamentos permitem a criação de grupos de pessoas, o que é particularmente relevante no marketing. Nesse campo, o público-alvo é o centro e a base para o desenvolvimento de uma estratégia publicitária. Algoritmos conseguem aprender a agrupar pessoas em uma determinada categoria, de forma independente.
Um dos campos em que o princípio da aprendizagem não supervisionada já está amplamente estabelecido é o do reconhecimento de voz. O funcionamento de assistentes virtuais como Siri, Alexa e Google Assistant só é possível graças ao reconhecimento de voz. Esses programas aprendem os hábitos de fala dos usuários e, com o tempo, são capazes de interpretar comandos de voz de maneira cada vez mais precisa, mesmo em situações em que usuários têm algum problema de fala ou usam um dialeto específico.
Muitos smartphones já aplicam Unsupervised Learning para organizar automaticamente galerias de fotos. Essa aprendizagem autônoma permite que dispositivos reconheçam a mesma pessoa em várias fotos ou identificar locais semelhantes por meio dos metadados. Assim, fotos podem ser organizadas de acordo com o local onde foram tiradas ou pelas pessoas presentes nas imagens.
A aprendizagem não supervisionada também prova ser útil para chatbots. Eles desempenham funções de moderação em conversas virtuais, reconhecendo insultos, discurso de ódio, racismo e discriminação de forma autônoma, removendo ou advertindo os usuários infratores – a inteligência artificial é essencial nesse processo. De forma similar, chats automatizados de atendimento ao cliente e de serviços de pedidos online operam de maneira independente e parcialmente não supervisionada, seja por mensagens de texto ou chamadas telefônicas. Esses bots aprendem de forma autônoma.
Exemplo negativo de Unsupervised Learning: Chatbot em redes sociais
A aprendizagem não supervisionada, no entanto, pode trazer impactos negativos, como demonstrado pela Microsoft em 2016. Sua IA, chamada Tay, foi conectada ao Twitter e aprendeu interagindo com os usuários da plataforma. Inicialmente, o programa era bastante básico, mas logo começou a usar emoticons e a formar frases completas.
Essa IA, contudo, não filtrava comentários, por isso passou a difundir discurso de ódio, atacar estrangeiros e feministas e espalhar teorias da conspiração. Tudo isso aconteceu em menos de 24 horas. O programa em si não era racista nem possuía motivações políticas; ele simplesmente aprendeu com o comportamento dos usuários. Não se sabe quantos internautas contribuíram para alimentar Tay com esses dados.
Exemplo positivo de Unsupervised Learning: Pesquisas genéticas
A aprendizagem não supervisionada tem impactos positivos significativos na pesquisa genética. A técnica de agrupamento, por exemplo, é amplamente utilizada na análise de material genético, permitindo identificar padrões e correlações entre genes. Graças à inteligência artificial e a essas metodologias de aprendizado, o setor médico e técnico têm avançado em conjunto, o que acelera consideravelmente as pesquisas na área. Doenças hereditárias, como anemia falciforme e cegueira hereditária, poderão ser tratadas e possivelmente curadas no futuro.
Vantagens da aprendizagem não supervisionada
O aprendizado de máquina não representa apenas progresso técnico, mas também facilita e alivia diversas atividades do cotidiano. Ele é um recurso valioso para o dia a dia, para a economia e para pesquisas. Diferentemente das outras duas metodologias (aprendizagem supervisionada e aprendizagem por reforço), desenvolvedores não intervêm diretamente no processo de treinamento, trazendo uma vantagem extra além da economia de tempo: a capacidade de detectar padrões sutis, invisíveis ao olhar humano. Dessa forma, algoritmos baseados em aprendizagem não supervisionada têm a capacidade de desenvolver ideias criativas.
Diferença entre aprendizagem supervisionada e semi-supervisionada
Além da aprendizagem não supervisionada, existem também a aprendizagem supervisionada e a aprendizagem semi-supervisionada, cada uma com suas particularidades. A seguir, abordaremos brevemente as diferenças entre os processos.
Aprendizagem não supervisionada vs. aprendizagem supervisionada
Diferentemente da aprendizagem não supervisionada, na aprendizagem supervisionada tanto os dados de entrada quanto as saídas correspondentes são conhecidos desde o início. A aprendizagem supervisionada também possui objetivos distintos dos da aprendizagem não supervisionada: Na aprendizagem supervisionada, existe uma resposta “correta” para cada ponto de dados, sendo seu objetivo emitir somente respostas corretas após o treinamento.
Além dos diferentes objetivos e aplicações, a aprendizagem supervisionada e a não supervisionada também variam em termos de eficiência e clareza. A aprendizagem não supervisionada requer apenas dados brutos para o treinamento e a identificação de padrões, mas os resultados costumam ser muito abstratos e, em alguns casos, precisam de análise manual posterior. Os custos iniciais da aprendizagem supervisionada são mais altos, por outro lado, pois seu treinamento exige dados totalmente etiquetados. No entanto, essa preparação garante que os objetivos do treinamento sejam bem definidos e os resultados finais mais claros e compreensíveis.
Aprendizagem não supervisionada vs. aprendizagem semi-supervisionada
Na aprendizagem semi-supervisionada, utilizam-se tanto dados etiquetados quanto não etiquetados para o treinamento. Inicialmente, o modelo aprende a partir dos dados etiquetados para formar um modelo básico de classificação. Em seguida, esse modelo é usado para fazer previsões nos dados não etiquetados. Posteriormente, o modelo é treinado novamente, desta vez usando usando tanto os dados etiquetados quanto as previsões como se fossem etiquetas confiáveis. Esse processo pode ser repetido de forma iterativa.
Como a aprendizagem semi-supervisionada, assim como a aprendizagem supervisionada, é mais indicado para problemas de classificação, ele se diferencia da Unsupervised Learning, voltada principalmente para clusterings e associações. Contudo, a aprendizagem semi-supervisionada compartilha, com a aprendizagem não supervisionada, o fato de ter baixos custos iniciais.
Outro método: Aprendizagem por reforço
Além dos dois métodos anteriores, existe uma terceira técnica de aprendizado: a aprendizagem por reforço. Nela, desenvolvedores oferecem estímulos somente para orientar o treinamento dos algoritmos. Nesse caso, o computador aprende quais decisões são as mais acertadas por tentativa e erro. Cada decisão gera um feedback positivo ou negativo de sua interação com o ambiente de treinamento. Assim, a inteligência artificial pode, ao longo do tempo, identificar padrões e desenvolver estratégias para obter o máximo de feedback positivo.
Um exemplo seria treinar um robô, por aprendizagem por reforço, para encontrar um objeto em uma sala, que cada vez é colocado em um local diferente. O robô receberia feedback negativo ao colidir com obstáculos ou desperdiçar tempo. A longo prazo, ele desenvolveria estratégias para otimizar o processo de busca.

