Nesta aula, o professor aprofunda a distinção entre a Inteligência Artificial Tradicional (ou Preditiva) e a IA Generativa. O objetivo é solidificar o entendimento de que elas operam de maneiras fundamentalmente diferentes e servem a propósitos distintos. A principal analogia utilizada é a de um “juiz” versus um “criador”.
A IA Tradicional como um “Juiz” (Modelo Discriminativo)
A IA tradicional é comparada a um juiz ou a um classificador. Seu papel é analisar um conjunto de dados de entrada e tomar uma decisão ou aplicar um rótulo com base em um conjunto de regras e padrões que aprendeu durante o treinamento. Ela opera dentro de limites bem definidos.
-
Função principal: Discriminar, classificar, prever um valor específico ou escolher entre opções existentes.
-
Como opera: Ela aprende a mapear características (features) de uma entrada para uma saída específica. Por exemplo, ao analisar dados de um cliente, ela aprende quais características (renda, idade, histórico de crédito) se correlacionam com a probabilidade de inadimplência.
-
Exemplo prático da aula: Um modelo de análise de crédito. Ele não cria um novo perfil de cliente; ele julga se o perfil existente deve ser aprovado ou negado. Da mesma forma, um sistema de reconhecimento de imagem classifica uma foto como “gato” ou “cachorro”, mas não cria uma nova imagem.
-
Resultado: A saída é geralmente um valor numérico (probabilidade, preço) ou uma categoria (sim/não, fraude/não fraude).
A IA Generativa como um “Criador” (Modelo Generativo)
Em contraste, a IA Generativa é comparada a um artista, um escritor ou um compositor. Seu papel não é julgar, mas sim criar algo novo. Ela aprende as distribuições de probabilidade e os padrões subjacentes dos dados para gerar artefatos novos e originais que se assemelham aos dados com os quais foi treinada.
-
Função principal: Gerar, criar, sintetizar novos dados.
-
Como opera: Em vez de mapear entrada para uma saída, ela aprende a distribuição dos dados e a usa para gerar novas amostras. Ela entende a “essência” do que constitui um gato para poder desenhar um gato que nunca existiu antes.
-
Exemplo prático da aula: Ao receber o prompt “desenhe um astronauta cavalgando um cavalo”, o modelo não busca uma imagem existente na internet. Ele utiliza seu entendimento dos conceitos “astronauta” e “cavalo” e das regras de composição de imagem para gerar uma cena completamente nova.
-
Resultado: A saída é um novo artefato de dados: um texto, uma imagem, um áudio, um trecho de código, etc.
Recapitulação dos Modelos Fundacionais e do GPT
A aula reforça que a tecnologia por trás da IA Generativa são os Modelos Fundacionais (Foundation Models). O professor relembra que esses modelos são pré-treinados em uma quantidade massiva de dados, o que lhes confere uma compreensão ampla e generalizada do mundo.
O GPT (Generative Pre-trained Transformer) é novamente citado como o principal exemplo. A sigla é “desmontada” para explicar seu funcionamento:
-
Generative: Sua função primária é gerar conteúdo.
-
Pre-trained: Ele passa por um treinamento prévio intensivo com dados massivos, antes de ser ajustado para tarefas específicas.
-
Transformer: Refere-se à arquitetura de rede neural que ele utiliza, baseada nos mecanismos de atenção (self-attention), que é o que o torna tão eficaz em entender o contexto em sequências longas de dados.
Em conclusão, a aula estabelece que a escolha entre usar uma IA tradicional ou uma generativa depende inteiramente do problema a ser resolvido. Para tarefas de classificação, previsão e decisão, a IA tradicional continua sendo a ferramenta ideal. Para tarefas que exigem criatividade, originalidade e a geração de novos conteúdos, a IA Generativa é a abordagem correta.
Materiais Extras para Aprofundamento
Para explorar mais a fundo a dualidade entre modelos discriminativos e generativos:
Sobre Modelos Discriminativos vs. Generativos
-
[Artigo] Modelos Generativos vs. Discriminativos: Uma Explicação Simples (Analytics Vidhya): Este artigo oferece uma explicação clara e com exemplos matemáticos simples sobre como cada tipo de modelo aborda a probabilidade e a tomada de decisão. (Artigo em inglês, mas pode ser traduzido pelo navegador).
- Link:
https://www.analyticsvidhya.com/blog/2021/07/generative-vs-discriminative-models-a-simple-explanation/
- Link:
-
[Vídeo] Modelos Generativos e Discriminativos (Canal “StatQuest”): Um vídeo didático que usa ilustrações para explicar a diferença matemática fundamental entre os dois tipos de modelo de forma muito intuitiva. (Vídeo em inglês, com legendas em português).
- Link:
http://googleusercontent.com/youtube.com/2
- Link:
Sobre a Arquitetura Transformer
-
[Artigo] The Illustrated Transformer (Jay Alammar): Considerado um dos melhores guias visuais para entender a arquitetura Transformer. Ele detalha cada componente do modelo (incluindo o mecanismo de atenção) passo a passo. É um material um pouco mais denso, mas fundamental para quem é da área de software. (Artigo em inglês).
- Link:
https://jalammar.github.io/illustrated-transformer/
- Link:
-
[Artigo] O que é a arquitetura Transformer? (Google Cloud): Uma visão geral do Google sobre a arquitetura, seu impacto e por que ela foi um ponto de virada para o processamento de linguagem natural.
- Link:
https://cloud.google.com/discover/transformer-architecture?hl=pt-br
- Link:
Explorando Modelos Generativos de Imagem
-
[Site Interativo] DALL-E 3 (OpenAI): A melhor forma de entender o poder da geração de imagens é experimentando. Crie uma conta gratuita no site da OpenAI para testar o DALL-E 3, que está integrado ao Copilot (antigo Bing Chat).
- Link:
https://openai.com/dall-e-3
- Link:
-
[Comunidade] Midjourney Community Showcase: Explore a galeria do Midjourney para ver o que é possível criar com prompts bem elaborados. É uma excelente fonte de inspiração e para entender o estado da arte em geração de imagens.
- Link:
https://www.midjourney.com/showcase
- Link: