No apren­di­zado su­per­vi­si­o­nado (Su­per­vi­sed Learning), um modelo de IA é treinado com dados rotulados, com o objetivo de fazer previsões ou clas­si­fi­ca­ções para dados des­co­nhe­ci­dos. Continue lendo para entender melhor o método.

Su­per­vi­sed Learning em resumo

No apren­di­zado de máquina (Machine Learning), o objetivo é que os com­pu­ta­do­res re­co­nhe­çam padrões e aprendam regras. Em vez de apenas reagir à entrada de um usuário humano, máquinas devem ser capazes de tomar decisões de forma autônoma – com base nas regras que apren­de­ram. Assim, al­go­rit­mos podem aprender, por exemplo, a re­co­nhe­cer cor­re­ta­mente spam ou entender o conteúdo de uma imagem. Para o apren­di­zado, os de­sen­vol­ve­do­res utilizam di­fe­ren­tes métodos. O mais comum pro­va­vel­mente é o Su­per­vi­sed Learning.

No Su­per­vi­sed Learning, de­sen­vol­ve­do­res fornecem aos al­go­rit­mos um conjunto de dados já preparado como fonte de trei­na­mento. O resultado já é, portanto, conhecido. A tarefa dos al­go­rit­mos é apenas re­co­nhe­cer o padrão: por que essa in­for­ma­ção pertence à categoria A e não à categoria B?

O apren­di­zado su­per­vi­si­o­nado é aplicado a al­go­rit­mos que precisam ca­te­go­ri­zar dados naturais (fotos, ca­li­gra­fias, fala etc.). Além disso, problemas de regressão também costumam aplicar o método de apren­di­zado su­per­vi­si­o­nado, pois os al­go­rit­mos devem ser capazes de fazer previsões, como sobre variações de preços ou cres­ci­mento de clientes.

O Semi-su­per­vi­sed Learning mistura Su­per­vi­sed e Un­su­per­vi­sed Learning. Na abordagem, apenas uma parte do conjunto de dados é rotulada. O restante permanece sem ca­te­go­ri­za­ção e deve ser atribuído pelos al­go­rit­mos de forma autônoma. Um exemplo pode ser en­con­trado no re­co­nhe­ci­mento facial do Facebook: basta rotular algumas imagens com os nomes dos amigos e o algoritmo encontra as demais por conta própria.

Ex­pli­ca­ção e exemplo de apren­di­zado su­per­vi­si­o­nado

Vamos supor que queremos treinar al­go­rit­mos para dis­tin­guir imagens de gatos de imagens de cachorros. Os de­sen­vol­ve­do­res pre­pa­ra­riam um conjunto de dados muito grande, contendo imagens que já têm rótulos, ou seja, pertencem a uma categoria. Podemos imaginar três grupos di­fe­ren­tes: cachorro, gato, outros. O im­por­tante é que o conjunto de dados tenha uma grande variedade. Em termos simples: se você tiver apenas imagens de gatos pretos no seu conjunto de trei­na­mento, o algoritmo vai achar que todos os gatos têm pelagem preta. O conjunto de dados deve refletir ade­qua­da­mente a di­ver­si­dade real de variações.

Durante o trei­na­mento, o algoritmo recebe ini­ci­al­mente os conteúdos (de forma de­sor­de­nada), toma uma decisão por conta própria e depois compara à saída fornecida pelos de­sen­vol­ve­do­res. O sistema verifica o próprio resultado com o correto e tira con­clu­sões que afetam suas próximas ava­li­a­ções durante o trei­na­mento. O trei­na­mento continua até que a máquina chegue o mais próximo possível dos re­sul­ta­dos corretos.

JDDqP6IZ4NQ.jpg Para exibir esse vídeo pre­ci­sa­mos usar cookies de terceiros. Você pode acessar e mudar suas con­fi­gu­ra­ções de cookies here.

Vantagens e des­van­ta­gens do Su­per­vi­sed Learning

A escolha do método de apren­di­zado depende muito das tarefas que os al­go­rit­mos deverão realizar. Para problemas de ca­te­go­ri­za­ção e regressão, o Su­per­vi­sed Learning é mais indicado do que outros métodos. De maneira geral, com o apren­di­zado su­per­vi­si­o­nado, é possível treinar al­go­rit­mos de forma que fiquem per­fei­ta­mente pre­pa­ra­dos para a aplicação desejada. Como o controle sobre o material de trei­na­mento é total, basta ter dados su­fi­ci­en­tes e tempo para ajustar cor­re­ta­mente os al­go­rit­mos. A ênfase aqui é no Input: a coleta de dados precisa ser extensa. Como no Su­per­vi­sed Learning cada elemento precisa ser rotulado, há um esforço con­si­de­rá­vel por parte dos de­sen­vol­ve­do­res.

Embora o esforço seja re­la­ti­va­mente alto, também é possível entender fa­cil­mente o que está acon­te­cendo. Enquanto no Un­su­per­vi­sed Learning muitos aspectos ficam obscuros, já que os al­go­rit­mos operam sem ins­tru­ções claras, no Su­per­vi­sed Learning o que a máquina faz está bem definido. No entanto, isso também pode ser uma des­van­ta­gem: os al­go­rit­mos treinados operam dentro das res­tri­ções impostas, o que limita a pos­si­bi­li­dade de soluções criativas.

Soluções de IA
Mais poder digital com In­te­li­gên­cia Ar­ti­fi­cial
  • Online em segundos
  • Aumente seu cres­ci­mento com marketing de IA
  • Economize tempo e recursos

Su­per­vi­sed Learning vs. Un­su­per­vi­sed Learning vs. Semi-su­per­vi­sed Learning

Além de Su­per­vi­sed Learning, existem também Un­su­per­vi­sed Learning (apren­di­zado não su­per­vi­si­o­nado) e Semi-su­per­vi­sed Learning (apren­di­zado se­mis­su­per­vi­si­o­nado). A seguir, apre­sen­ta­re­mos as di­fe­ren­ças entre esses três métodos.

Su­per­vi­sed Learning vs. Un­su­per­vi­sed Learning

Enquanto o Su­per­vi­sed Learning utiliza conjuntos de dados em que tanto as entradas quanto as saídas as­so­ci­a­das são co­nhe­ci­das, no Un­su­per­vi­sed Learning apenas as entradas são co­nhe­ci­das. O Un­su­per­vi­sed Learning, portanto, busca descobrir padrões ou es­tru­tu­ras des­co­nhe­ci­das nos dados. Esse tipo de apren­di­zado também é adequado para outras tarefas, como Clus­te­ring (agru­pa­mento de pontos de dados sem clas­si­ficá-los em ca­te­go­rias).

Como as saídas do conjunto de trei­na­mento não são rotuladas no Un­su­per­vi­sed Learning, o esforço ne­ces­sá­rio para os de­sen­vol­ve­do­res é bem menor do que no Su­per­vi­sed Learning. No entanto, o processo de trei­na­mento e o resultado final são muito mais difíceis de in­ter­pre­tar. Assim, fica mais com­pli­cado avaliar o de­sem­pe­nho e a precisão dos modelos treinados.

Su­per­vi­sed Learning vs. Semi-su­per­vi­sed Learning

Uma grande des­van­ta­gem do Su­per­vi­sed Learning é o grande tempo ne­ces­sá­rio para que os de­sen­vol­ve­do­res rotulem os dados. O Semi-su­per­vi­sed Learning usa tanto dados rotulados quanto não rotulados para tentar minimizar essa des­van­ta­gem. Nesse caso, o modelo aprende ini­ci­al­mente com os dados rotulados e se aprimora uti­li­zando os dados não rotulados, iden­ti­fi­cando por conta própria padrões e es­tru­tu­ras nos dados não rotulados.

A principal vantagem do Semi-su­per­vi­sed Learning está na efi­ci­ên­cia, pois menos dados precisam ser rotulados, enquanto o método ainda pode apre­sen­tar uma precisão re­la­ti­va­mente alta. O Semi-su­per­vi­sed Learning pode ser usado para problemas de clas­si­fi­ca­ção se­me­lhan­tes ao Su­per­vi­sed Learning, mas busca otimizar o esforço de trei­na­mento. No entanto, a com­ple­xi­dade da cons­tru­ção do modelo e o equi­lí­brio entre dados rotulados e não rotulados pode ser um desafio.

Outros métodos de apren­di­zado de máquina

Su­per­vi­sed, Un­su­per­vi­sed e Semi-su­per­vi­sed Learning não são os únicos métodos de apren­di­zado de máquina (Machine Learning) uti­li­za­dos para treinar in­te­li­gên­cias ar­ti­fi­ci­ais.

O Deep Learning é um método de apren­di­zado onde modelos já treinados aprendem com base em suas entradas e continuam se de­sen­vol­vendo. Esses modelos são baseados em redes neurais, que são ins­pi­ra­das no cérebro humano.

Existe ainda o Rein­for­ce­ment Learning, no qual um com­pu­ta­dor aprende, por tentativa e erro, tomar as melhores decisões. O objetivo é de­sen­vol­ver uma es­tra­té­gia (policy) que tome as melhores decisões para alcançar o melhor resultado a longo prazo. Um exemplo seria uma IA que aprende a jogar um videogame, recebendo feedback do ambiente de trei­na­mento sobre cada decisão e de­sen­vol­vendo es­tra­té­gias de jogo.

Resumo

O apren­di­zado su­per­vi­si­o­nado é um método popular para treinar al­go­rit­mos, porque de­sen­vol­ve­do­res conseguem obter controle total sobre o processo. Enquanto em outros métodos de apren­di­zado os re­sul­ta­dos muitas vezes per­ma­ne­cem incertos, no Su­per­vi­sed Learning fica claro desde o início o que se espera alcançar no final do processo de apren­di­zado. Porém, o esforço exigido dos de­sen­vol­ve­do­res é con­si­de­ra­vel­mente maior.

Ir para o menu principal