Lance-se na Gestão de Projetos de IA: seu primeiro passo concreto hoje
Gestão de Projetos de IA: o essencial em um artigo — código real, diagramas e etapas concretas, extratos de um curso de 35 lições.
A melhor forma de aprender Gestão de Projetos IA é fazendo. Este artigo te dá o pontapé inicial com trechos práticos extraídos de um curso de 35 lições — o suficiente para obter um primeiro resultado já hoje.
- Introdução ao PM IA
- Ciclo de vida de um projeto IA
- Definição e business case
- Constituição de equipe IA
- Métodos ágeis para IA
Catálogo de dados e acessos controlados
O problema: onde estão os dados?
Em uma empresa com mais de 500 pessoas, é fácil contar entre 50 e 500 tabelas críticas espalhadas entre: data warehouse central, data lakes S3, bases relacionais de negócio, Salesforce, arquivos Excel no SharePoint, exportações manual do SI… Um novo Data Scientist leva em média 2 a 4 semanas para encontrar e obter acesso aos dados corretos.
O que é um Data Catalog
Um Data Catalog é um diretório centralizado e pesquisável dos dados da empresa. Ele responde às perguntas: onde está este dado, quem é o dono, ele está atualizado, qual a qualidade, quem tem acesso, como solicitá-lo?
O que um catálogo contém
Ferramentas do mercado
O modelo padrão de um dataset no catálogo
fct_transactions_clientsDescrição : Todas as transações de clientes desde 2018, agregadas por dia.
Owner : Equipe Data Finance (data-finance@compagnie.com)
Steward de negócio : Marie Dupont (Direção CRM)
Sensibilidade : Sensível (dados pessoais)
Frescor : Atualizado diariamente às 2h
Qualidade (set 2025) : 99,2 % completude, 0,3 % duplicados
Acesso : Sob demanda via formulário ServiceNow, validação DPO + owner em até 5 dias
Lineage upstream : SAP, Salesforce
Lineage downstream : Modelos fraud_v3, churn_v2, dashboard finance
Gestão de acessos: 4 níveis de sensibilidade
| Nível | Exemplo | Acesso | Prazo |
|---|---|---|---|
| Público | Catálogo de produtos, números divulgados | Todos | Imediato |
| Interno | Métricas internas não sensíveis | Todo funcionário sob demanda | < 24h |
| Sensível | Dados pessoais de clientes | Gestor + DPO | 3-5 dias |
| Secreto | Estratégia, M&A, dados de saúde | CODIR + auditoria retrospectiva | Caso a caso |
Anonimização e pseudonimização
Pseudonimização
Substituir identificadores por pseudônimos. Reversível se houver a tabela de correspondência.
Ex: customer_id 12345 → HASH_a3f8b2c
Anonimização
Tornar qualquer reidentificação impossível. Irreversível.
Ex: agregação por decil de idade + arredondamento de valores para 100€
Fora do RGPD se bem feita (k-anonymity, etc).
A dica do sandbox de dados
Em vez de dar acesso aos dados de produção, muitas empresas criam um sandbox:
Caso real: Carrefour e seu Unity Catalog
Frameworks CRISP-DM, TDSP e alternativas modernas
Por que um framework metodológico
Um framework não é um Gantt fixo. É uma grade de leitura comum entre todas as partes interessadas: você, a equipe de dados, o sponsor, o auditor. Sem framework, cada um chama de “fase 2” o que o outro chama de “fase 4”. Com um framework, todos falam a mesma língua.
Framework 1 — CRISP-DM (o clássico)
CRISP-DM (Cross Industry Standard Process for Data Mining), publicado em 1999 por um consórcio europeu (IBM, Daimler, NCR, OHRA), continua sendo o framework mais usado no mundo em 2026 (pesquisa KDnuggets).
As 6 fases
Framework 2 — TDSP da Microsoft
TDSP (Team Data Science Process), lançado pela Microsoft em 2017, é o CRISP-DM modernizado com visão de equipe e foco em entregáveis.
As 5 fases
O que muda em relação ao CRISP-DM
Framework 3 — Google ML Lifecycle (o moderno)
O Google publicou em 2019 um ciclo orientado a MLOps de ponta a ponta, que hoje é referência na tech moderna (e muito usado em startups de IA).
As fases
Tabela comparativa
| Critério | CRISP-DM | TDSP | Google ML Lifecycle |
|---|---|---|---|
| Ano | 1999 | 2017 | 2019 |
| Foco | Data mining | Equipe + entregáveis | MLOps |
| MLOps integrado | Não | Parcial | Sim |
| Fases | 6 | 5 | 6 |
| Templates fornecidos | Poucos | Muitos | Médios |
| Funções especificadas | Não | Sim | Parcial |
| Adaptado à nuvem moderna | Não | Azure ML | Vertex AI / agnóstico |
| Público ideal | Aprendizado, agências | Grandes empresas | Startups tech, FAANG |
Qual framework escolher? Nossa recomendação
Startup tech (< 30 pessoas)
Google ML Lifecycle: agilidade e foco em MLOps. Você consegue implantar rapidamente e iterar sem burocracia.
Grande empresa tradicional
TDSP: estrutura e entregáveis, perfeito para tranquilizar PMO e auditores internos.
Agência de consultoria / formação
Apresentação do curso
Objetivos pedagógicos
O problema concreto que você vai resolver
Imagine a seguinte situação. Você é Product Manager em um banco ou startup. Uma manhã, seu diretor-geral entra na sua sala e diz:
Aqui estão as perguntas que vão surgir na mesma semana:
Perguntas de negócio que vão te fazer
O que você vai aprender a fazer
Por que um projeto de IA não é um projeto de software clássico
Muitos gestores iniciantes acham que um projeto de IA é apenas “um projeto de software com um modelo dentro”. Isso é falso, e é exatamente por isso que eles falham. Aqui estão as 5 grandes diferenças:
| Aspecto | Projeto de software clássico | Projeto de IA |
|---|---|---|
| Resultado | Determinístico (mesma entrada ⇒ mesma saída) | Probabilístico (mesma entrada ⇒ resultado com margem de erro) |
| Especificações | Caderno de encargos preciso | Hipóteses a validar experimentalmente |
| Ciclo de vida | Dev ⇒ Teste ⇒ Deploy ⇒ Manutenção | Dados ⇒ Modelo ⇒ Aval ⇒ Deploy ⇒ Monitoramento ⇒ Retreinamento |
| Dependência de dados | Marginal (arquivos de config) | Vital (sem dados, não há produto) |
| Deriva em produção | O código não se deteriora sozinho | O modelo degrada naturalmente (data drift) |
O diagnóstico brutal: 80 % dos projetos de IA falham
Segundo a Gartner (2024) e um relatório da McKinsey de 2025, entre 70 % e 85 % dos projetos de IA em empresas nunca passam do proof of concept. Por quê? Aqui estão as 3 principais causas:
1. Má definição
O projeto é lançado “porque é preciso fazer IA”, sem um problema de negócio claro. Resultado: um modelo que funciona tecnicamente, mas não gera valor.
~ 35 % das falhas
2. Dados insuficientes
Após 3 meses de POC descobre-se que os dados estão incompletos, enviesados ou inacessíveis juridicamente. O projeto morre antes da produção.
~ 30 % das falhas
3. Sem colocação em produção
O modelo fica no notebook Jupyter do cientista de dados. Ninguém pensou no deployment, no monitoramento nem na integração com o SI.
~ 20 % das falhas
Este artigo cobre os trechos mais úteis — o curso completo Gestão de Projetos IA (11 capítulos, 35 lições, exercícios corrigidos e projeto final) leva você até o fim.
./acceder-au-cours-complet curso gratuito : Claude CoworkFAQ
Quanto tempo leva para aprender Gestão de Projetos IA?
É preciso ter pré-requisitos?
Por onde começar na prática?
📬 Quer receber este tipo de guia toda semana? Inscreva-se gratuitamente — código real, zero enrolação.