Nesta aula, o professor aprofunda a distinção entre a Inteligência Artificial Tradicional (ou Preditiva) e a IA Generativa. O objetivo é solidificar o entendimento de que elas operam de maneiras fundamentalmente diferentes e servem a propósitos distintos. A principal analogia utilizada é a de um “juiz” versus um “criador”.

A IA Tradicional como um “Juiz” (Modelo Discriminativo)

A IA tradicional é comparada a um juiz ou a um classificador. Seu papel é analisar um conjunto de dados de entrada e tomar uma decisão ou aplicar um rótulo com base em um conjunto de regras e padrões que aprendeu durante o treinamento. Ela opera dentro de limites bem definidos.

  • Função principal: Discriminar, classificar, prever um valor específico ou escolher entre opções existentes.

  • Como opera: Ela aprende a mapear características (features) de uma entrada para uma saída específica. Por exemplo, ao analisar dados de um cliente, ela aprende quais características (renda, idade, histórico de crédito) se correlacionam com a probabilidade de inadimplência.

  • Exemplo prático da aula: Um modelo de análise de crédito. Ele não cria um novo perfil de cliente; ele julga se o perfil existente deve ser aprovado ou negado. Da mesma forma, um sistema de reconhecimento de imagem classifica uma foto como “gato” ou “cachorro”, mas não cria uma nova imagem.

  • Resultado: A saída é geralmente um valor numérico (probabilidade, preço) ou uma categoria (sim/não, fraude/não fraude).

A IA Generativa como um “Criador” (Modelo Generativo)

Em contraste, a IA Generativa é comparada a um artista, um escritor ou um compositor. Seu papel não é julgar, mas sim criar algo novo. Ela aprende as distribuições de probabilidade e os padrões subjacentes dos dados para gerar artefatos novos e originais que se assemelham aos dados com os quais foi treinada.

  • Função principal: Gerar, criar, sintetizar novos dados.

  • Como opera: Em vez de mapear entrada para uma saída, ela aprende a distribuição dos dados e a usa para gerar novas amostras. Ela entende a “essência” do que constitui um gato para poder desenhar um gato que nunca existiu antes.

  • Exemplo prático da aula: Ao receber o prompt “desenhe um astronauta cavalgando um cavalo”, o modelo não busca uma imagem existente na internet. Ele utiliza seu entendimento dos conceitos “astronauta” e “cavalo” e das regras de composição de imagem para gerar uma cena completamente nova.

  • Resultado: A saída é um novo artefato de dados: um texto, uma imagem, um áudio, um trecho de código, etc.

Recapitulação dos Modelos Fundacionais e do GPT

A aula reforça que a tecnologia por trás da IA Generativa são os Modelos Fundacionais (Foundation Models). O professor relembra que esses modelos são pré-treinados em uma quantidade massiva de dados, o que lhes confere uma compreensão ampla e generalizada do mundo.

O GPT (Generative Pre-trained Transformer) é novamente citado como o principal exemplo. A sigla é “desmontada” para explicar seu funcionamento:

  • Generative: Sua função primária é gerar conteúdo.

  • Pre-trained: Ele passa por um treinamento prévio intensivo com dados massivos, antes de ser ajustado para tarefas específicas.

  • Transformer: Refere-se à arquitetura de rede neural que ele utiliza, baseada nos mecanismos de atenção (self-attention), que é o que o torna tão eficaz em entender o contexto em sequências longas de dados.

Em conclusão, a aula estabelece que a escolha entre usar uma IA tradicional ou uma generativa depende inteiramente do problema a ser resolvido. Para tarefas de classificação, previsão e decisão, a IA tradicional continua sendo a ferramenta ideal. Para tarefas que exigem criatividade, originalidade e a geração de novos conteúdos, a IA Generativa é a abordagem correta.


Materiais Extras para Aprofundamento

Para explorar mais a fundo a dualidade entre modelos discriminativos e generativos:

Sobre Modelos Discriminativos vs. Generativos

  • [Artigo] Modelos Generativos vs. Discriminativos: Uma Explicação Simples (Analytics Vidhya): Este artigo oferece uma explicação clara e com exemplos matemáticos simples sobre como cada tipo de modelo aborda a probabilidade e a tomada de decisão. (Artigo em inglês, mas pode ser traduzido pelo navegador).

    • Link: https://www.analyticsvidhya.com/blog/2021/07/generative-vs-discriminative-models-a-simple-explanation/
  • [Vídeo] Modelos Generativos e Discriminativos (Canal “StatQuest”): Um vídeo didático que usa ilustrações para explicar a diferença matemática fundamental entre os dois tipos de modelo de forma muito intuitiva. (Vídeo em inglês, com legendas em português).

    • Link: http://googleusercontent.com/youtube.com/2

Sobre a Arquitetura Transformer

  • [Artigo] The Illustrated Transformer (Jay Alammar): Considerado um dos melhores guias visuais para entender a arquitetura Transformer. Ele detalha cada componente do modelo (incluindo o mecanismo de atenção) passo a passo. É um material um pouco mais denso, mas fundamental para quem é da área de software. (Artigo em inglês).

    • Link: https://jalammar.github.io/illustrated-transformer/
  • [Artigo] O que é a arquitetura Transformer? (Google Cloud): Uma visão geral do Google sobre a arquitetura, seu impacto e por que ela foi um ponto de virada para o processamento de linguagem natural.

    • Link: https://cloud.google.com/discover/transformer-architecture?hl=pt-br

Explorando Modelos Generativos de Imagem

  • [Site Interativo] DALL-E 3 (OpenAI): A melhor forma de entender o poder da geração de imagens é experimentando. Crie uma conta gratuita no site da OpenAI para testar o DALL-E 3, que está integrado ao Copilot (antigo Bing Chat).

    • Link: https://openai.com/dall-e-3
  • [Comunidade] Midjourney Community Showcase: Explore a galeria do Midjourney para ver o que é possível criar com prompts bem elaborados. É uma excelente fonte de inspiração e para entender o estado da arte em geração de imagens.

    • Link: https://www.midjourney.com/showcase