Lance-se na Gestão de Projetos de IA: seu primeiro passo concreto hoje

Gestão de Projetos de IA: o essencial em um artigo — código real, diagramas e etapas concretas, extratos de um curso de 35 lições.

Lance-se na Gestão de Projetos de IA: seu primeiro passo concreto hoje

A melhor forma de aprender Gestão de Projetos IA é fazendo. Este artigo te dá o pontapé inicial com trechos práticos extraídos de um curso de 35 lições — o suficiente para obter um primeiro resultado já hoje.

tl;dr
  • Introdução ao PM IA
  • Ciclo de vida de um projeto IA
  • Definição e business case
  • Constituição de equipe IA
  • Métodos ágeis para IA
~$ cat ./parcours.md # Gestão de Projetos IA — 10 capítulos
01
Introdução ao PM IA
→ Apresentação do curso→ Quem faz o quê? Panorama dos papéis IA+ 1 mais lições
02
Ciclo de vida de um projeto IA
→ Da ideia à produção→ MLOps vs DevOps clássico+ 1 mais lições
03
Escopo e caso de negócio
→ Encontrar o problema certo→ ROI e medição de valor+ 1 mais lições
04
Constituição da equipe IA
→ Papéis Data Scientist, ML Engineer, PM→ Organizar uma equipe multidisciplinar+ 1 mais lições
05
Métodos ágeis para IA
→ Scrum aplicado à IA→ Sprints de pesquisa vs sprints de entrega+ 1 mais lições
06
Gestão de dados
→ Governança de dados e RGPD→ Qualidade e versionamento de dados+ 1 mais lições
07
MLOps do lado do PM
→ O pipeline ML visto por um PM→ Monitoramento dos modelos em produção+ 1 mais lições
08
KPIs e medição de valor
→ KPIs técnicos vs business→ A/B testing para modelos IA+ 1 mais lições
🏁
Projeto final (+ 2 capítulos no caminho)
→ Você sai com um projeto concreto e demonstrável

Catálogo de dados e acessos controlados

NOTEObjetivo — Compreender o que é um Data Catalog, por que ele salva projetos de IA em grandes empresas e como gerenciar acessos aos dados de forma segura sem se tornar um gargalo.

O problema: onde estão os dados?

Em uma empresa com mais de 500 pessoas, é fácil contar entre 50 e 500 tabelas críticas espalhadas entre: data warehouse central, data lakes S3, bases relacionais de negócio, Salesforce, arquivos Excel no SharePoint, exportações manual do SI… Um novo Data Scientist leva em média 2 a 4 semanas para encontrar e obter acesso aos dados corretos.

WARNINGCusto oculto — Uma equipe de 4 DS a 75 k€/ano que perde 3 semanas procurando dados representa ~ 17 k€ por projeto. Em 10 projetos, o Data Catalog se paga sozinho.

O que é um Data Catalog

Um Data Catalog é um diretório centralizado e pesquisável dos dados da empresa. Ele responde às perguntas: onde está este dado, quem é o dono, ele está atualizado, qual a qualidade, quem tem acesso, como solicitá-lo?

O que um catálogo contém

Ferramentas do mercado

O modelo padrão de um dataset no catálogo

NOTEDataset : fct_transactions_clients
Descrição : Todas as transações de clientes desde 2018, agregadas por dia.
Owner : Equipe Data Finance (data-finance@compagnie.com)
Steward de negócio : Marie Dupont (Direção CRM)
Sensibilidade : Sensível (dados pessoais)
Frescor : Atualizado diariamente às 2h
Qualidade (set 2025) : 99,2 % completude, 0,3 % duplicados
Acesso : Sob demanda via formulário ServiceNow, validação DPO + owner em até 5 dias
Lineage upstream : SAP, Salesforce
Lineage downstream : Modelos fraud_v3, churn_v2, dashboard finance

Gestão de acessos: 4 níveis de sensibilidade

Nível Exemplo Acesso Prazo
Público Catálogo de produtos, números divulgados Todos Imediato
Interno Métricas internas não sensíveis Todo funcionário sob demanda < 24h
Sensível Dados pessoais de clientes Gestor + DPO 3-5 dias
Secreto Estratégia, M&A, dados de saúde CODIR + auditoria retrospectiva Caso a caso
TIPDica de PM — Já na ficha de definição, identifique a sensibilidade de cada dataset alvo e antecipe os prazos. Se precisar de um dataset “secreto” e só descobrir no sprint 5, você perde 2 meses.

Anonimização e pseudonimização

Pseudonimização

Substituir identificadores por pseudônimos. Reversível se houver a tabela de correspondência.

Ex: customer_id 12345 → HASH_a3f8b2c

Anonimização

Tornar qualquer reidentificação impossível. Irreversível.

Ex: agregação por decil de idade + arredondamento de valores para 100€

Fora do RGPD se bem feita (k-anonymity, etc).

WARNINGArmadilha — Muitas equipes acham que estão anonimizando ao fazer hash de um e-mail. Isso é apenas pseudonimizar. A verdadeira anonimização é mais difícil (k-anonymity, differential privacy).

A dica do sandbox de dados

Em vez de dar acesso aos dados de produção, muitas empresas criam um sandbox:

TIPResultado — Os DS prototipam no sandbox e só solicitam acesso à produção na fase final. Aceleração clara: de 4 semanas para 4 dias para iniciar um POC.

Caso real: Carrefour e seu Unity Catalog

Frameworks CRISP-DM, TDSP e alternativas modernas

NOTEObjetivo — Conhecer os 3 frameworks mais usados para estruturar um projeto de IA, entender seus pontos fortes e fracos e saber qual adotar conforme seu contexto (grande empresa, startup, agência).

Por que um framework metodológico

Um framework não é um Gantt fixo. É uma grade de leitura comum entre todas as partes interessadas: você, a equipe de dados, o sponsor, o auditor. Sem framework, cada um chama de “fase 2” o que o outro chama de “fase 4”. Com um framework, todos falam a mesma língua.

TIPDica — Escolher um framework e segui-lo, mesmo que imperfeito, é mil vezes melhor do que improvisar. A disciplina do caminho importa mais que a escolha exata.

Framework 1 — CRISP-DM (o clássico)

CRISP-DM (Cross Industry Standard Process for Data Mining), publicado em 1999 por um consórcio europeu (IBM, Daimler, NCR, OHRA), continua sendo o framework mais usado no mundo em 2026 (pesquisa KDnuggets).

As 6 fases

NOTEForça do CRISP-DM — Muito explícito sobre o loop de retorno: se a avaliação falhar, volta-se ao Business Understanding. É intelectualmente honesto.
WARNINGFraqueza — Não foi pensado para o MLOps moderno (monitoramento contínuo, retreinamento automático). A palavra “produção” quase não aparece. É preciso complementá-lo com uma camada de MLOps.

Framework 2 — TDSP da Microsoft

TDSP (Team Data Science Process), lançado pela Microsoft em 2017, é o CRISP-DM modernizado com visão de equipe e foco em entregáveis.

As 5 fases

O que muda em relação ao CRISP-DM

TIPPara quem — Excelente para grandes empresas que já possuem PMO e querem padronizar entregáveis entre equipes.

Framework 3 — Google ML Lifecycle (o moderno)

O Google publicou em 2019 um ciclo orientado a MLOps de ponta a ponta, que hoje é referência na tech moderna (e muito usado em startups de IA).

As fases

NOTEForçaMonitor é uma fase completa, não apenas um “polo de manutenção”. Isso obriga o PM a orçar o run, não apenas o build.

Tabela comparativa

Critério CRISP-DM TDSP Google ML Lifecycle
Ano 1999 2017 2019
Foco Data mining Equipe + entregáveis MLOps
MLOps integrado Não Parcial Sim
Fases 6 5 6
Templates fornecidos Poucos Muitos Médios
Funções especificadas Não Sim Parcial
Adaptado à nuvem moderna Não Azure ML Vertex AI / agnóstico
Público ideal Aprendizado, agências Grandes empresas Startups tech, FAANG

Qual framework escolher? Nossa recomendação

Startup tech (< 30 pessoas)

Google ML Lifecycle: agilidade e foco em MLOps. Você consegue implantar rapidamente e iterar sem burocracia.

Grande empresa tradicional

TDSP: estrutura e entregáveis, perfeito para tranquilizar PMO e auditores internos.

Agência de consultoria / formação

Apresentação do curso

NOTEObjetivo — Compreender o que torna o gerenciamento de um projeto de IA tão diferente de um projeto de software clássico, por que 80 % desses projetos falham e o que você vai aprender a fazer concretamente neste curso.

Objetivos pedagógicos

TIPAo final deste módulo — Você saberá explicar em 2 minutos o que é Product Management de IA, identificará as 5 grandes diferenças em relação a um projeto de software e terá uma visão clara das competências que vai desenvolver nos 10 capítulos.

O problema concreto que você vai resolver

Imagine a seguinte situação. Você é Product Manager em um banco ou startup. Uma manhã, seu diretor-geral entra na sua sala e diz:

WARNING«Precisamos de IA. O conselho de administração aprovou um orçamento de 800 000 €. Queremos algo que funcione em 6 meses. Você lidera.»

Aqui estão as perguntas que vão surgir na mesma semana:

Perguntas de negócio que vão te fazer

O que você vai aprender a fazer

NOTEO trabalho do PM IA em uma frase — É a ponte entre a incerteza científica (os modelos erram) e a certeza de negócio (o sponsor quer um resultado mensurável). Todo o seu valor agregado está nessa tradução.

Por que um projeto de IA não é um projeto de software clássico

Muitos gestores iniciantes acham que um projeto de IA é apenas “um projeto de software com um modelo dentro”. Isso é falso, e é exatamente por isso que eles falham. Aqui estão as 5 grandes diferenças:

Aspecto Projeto de software clássico Projeto de IA
Resultado Determinístico (mesma entrada ⇒ mesma saída) Probabilístico (mesma entrada ⇒ resultado com margem de erro)
Especificações Caderno de encargos preciso Hipóteses a validar experimentalmente
Ciclo de vida Dev ⇒ Teste ⇒ Deploy ⇒ Manutenção Dados ⇒ Modelo ⇒ Aval ⇒ Deploy ⇒ Monitoramento ⇒ Retreinamento
Dependência de dados Marginal (arquivos de config) Vital (sem dados, não há produto)
Deriva em produção O código não se deteriora sozinho O modelo degrada naturalmente (data drift)
WARNINGConsequência direta — Você não pode aplicar um Scrum padrão, um Gantt fixo ou um caderno de encargos funcional detalhado. É preciso um modelo adaptado, que este curso vai fornecer.

O diagnóstico brutal: 80 % dos projetos de IA falham

Segundo a Gartner (2024) e um relatório da McKinsey de 2025, entre 70 % e 85 % dos projetos de IA em empresas nunca passam do proof of concept. Por quê? Aqui estão as 3 principais causas:

1. Má definição

O projeto é lançado “porque é preciso fazer IA”, sem um problema de negócio claro. Resultado: um modelo que funciona tecnicamente, mas não gera valor.

~ 35 % das falhas

2. Dados insuficientes

Após 3 meses de POC descobre-se que os dados estão incompletos, enviesados ou inacessíveis juridicamente. O projeto morre antes da produção.

~ 30 % das falhas

3. Sem colocação em produção

O modelo fica no notebook Jupyter do cientista de dados. Ninguém pensou no deployment, no monitoramento nem na integração com o SI.

~ 20 % das falhas

TIPA boa notícia — Essas 3 causas estão totalmente sob responsabilidade do Product Manager. Definir bem, validar os dados cedo e prever o MLOps desde o início são competências que se aprendem — e é exatamente o programa deste curso.
va-plus-loin

Este artigo cobre os trechos mais úteis — o curso completo Gestão de Projetos IA (11 capítulos, 35 lições, exercícios corrigidos e projeto final) leva você até o fim.

./acceder-au-cours-complet curso gratuito : Claude Cowork

FAQ

Quanto tempo leva para aprender Gestão de Projetos IA?
Com uma progressão estruturada (11 capítulos, 35 lições curtas e práticas), é possível atingir um nível operacional em algumas semanas dedicando 30 a 60 minutos por dia. O importante é praticar cada conceito imediatamente.
É preciso ter pré-requisitos?
Básicos de informática são suficientes. Se você sabe usar um terminal e ler código simples, está pronto.
Por onde começar na prática?
Reproduza os comandos deste artigo e depois siga o curso completo Gestão de Projetos IA: ele encadeia as 35 lições em ordem, com exercícios e projeto final.

📬 Quer receber este tipo de guia toda semana? Inscreva-se gratuitamente — código real, zero enrolação.