Lánzate a la Gestión de Proyectos de IA: tu primer paso concreto hoy

Gestión de Proyectos IA: lo esencial en un artículo — código real, diagramas y pasos concretos, extractos de un curso de 35 lecciones.

Lánzate a la Gestión de Proyectos de IA: tu primer paso concreto hoy

La mejor forma de aprender Gestión de Proyectos de IA es practicando. Este artículo te da el empujón inicial con extractos prácticos extraídos de un curso de 35 lecciones — lo suficiente para obtener un primer resultado desde hoy.

tl;dr
  • Introducción a la Gestión de Proyectos de IA
  • Ciclo de vida de un proyecto de IA
  • Definición del alcance y caso de negocio
  • Constitución del equipo de IA
  • Métodos ágiles para IA
~$ cat ./parcours.md # Gestión Proyectos IA — 10 capítulos
01
Introducción al PM IA
→ Presentación del curso→ ¿Quién hace qué? Panorama de los roles IA+ 1 más lecciones
02
Ciclo de vida de un proyecto IA
→ De la idea a la producción→ MLOps vs DevOps clásico+ 1 más lecciones
03
Encuadre y caso de negocio
→ Encontrar el problema correcto→ ROI y medida de valor+ 1 más lecciones
04
Constitución de equipo IA
→ Roles Data Scientist, ML Engineer, PM→ Organizar un equipo pluridisciplinario+ 1 más lecciones
05
Métodos ágiles para IA
→ Scrum aplicado a la IA→ Sprints de investigación vs sprints de entrega+ 1 más lecciones
06
Gestión de datos
→ Gobernanza de datos y RGPD→ Calidad y versionado de datos+ 1 más lecciones
07
MLOps lado PM
→ El pipeline ML visto por un PM→ Monitoreo de los modelos en producción+ 1 más lecciones
08
KPIs y medida de valor
→ KPIs técnicos vs business→ A/B testing para modelos IA+ 1 más lecciones
🏁
Proyecto final (+ 2 capítulos en camino)
→ Te vas con un proyecto concreto y demostrable

Catálogo de datos y accesos controlados

NOTEObjetivo — Comprender qué es un Data Catalog, por qué salva los proyectos de IA en las grandes empresas y cómo gestionar los accesos a los datos de forma segura sin convertirse en un cuello de botella.

El problema: ¿dónde están los datos?

En una empresa de más de 500 personas se cuentan fácilmente entre 50 y 500 tablas críticas dispersas entre: data warehouse central, lagos S3, bases relacionales de negocio, Salesforce, archivos Excel en SharePoint, exportaciones manuales del SI… Un nuevo Data Scientist tarda de media entre 2 y 4 semanas en encontrar y obtener acceso a los datos correctos.

WARNINGCoste oculto — Un equipo de 4 DS con un salario de 75 k€/año que pierde 3 semanas buscando datos supone unos 17 k€ por proyecto. Con 10 proyectos, el Data Catalog se amortiza solo.

¿Qué es un Data Catalog?

Un Data Catalog es un directorio centralizado y searchable de los datos de la empresa. Responde a las preguntas: ¿dónde está este dato, quién lo posee, está actualizado, es de calidad, quién tiene acceso y cómo solicitarlo?

Qué contiene un catálogo

Herramientas del mercado

Ficha tipo de un dataset en el catálogo

NOTEDataset : fct_transactions_clients
Descripción : Todas las transacciones de clientes desde 2018, agregadas por día.
Owner : Equipo Data Finance (data-finance@compagnie.com)
Steward de negocio : Marie Dupont (Dirección CRM)
Sensibilidad : Sensible (datos personales)
Frescura : Actualización diaria a las 2h
Calidad (sept 2025) : 99,2 % completitud, 0,3 % duplicados
Acceso : Bajo solicitud mediante formulario ServiceNow, validación DPO + owner en menos de 5 días
Lineage upstream : SAP, Salesforce
Lineage downstream : Modelos fraud_v3, churn_v2, dashboard finanzas

Gestión de accesos: 4 niveles de sensibilidad

Nivel Ejemplo Acceso Plazo
Público Catálogo de productos, cifras comunicadas Todo el mundo Inmediato
Interno Métricas internas no sensibles Cualquier empleado bajo solicitud < 24h
Sensible Datos personales de clientes Manager + DPO 3-5 días
Secreto Estrategia, M&A, datos de salud CODIR + auditoría retrospectiva Caso por caso
TIPConsejo de PM — Desde la ficha de definición del alcance, identifica la sensibilidad de cada dataset objetivo y anticipa los plazos. Si necesitas un dataset «secreto» y lo descubres en el sprint 5, pierdes 2 meses.

Anonimización y seudonimización

Seudonimización

Sustituir los identificadores por seudónimos. Reversible si se dispone de la tabla de correspondencia.

Ej.: customer_id 12345 → HASH_a3f8b2c

Anonimización

Hacer imposible cualquier reidentificación. Irreversible.

Ej.: agregación por decil de edad + redondeo de importes a 100 €

Fuera del RGPD si se realiza correctamente (k-anonymity, etc.).

WARNINGTrampa — Muchos equipos creen anonimizar al hashear un email. Eso es solo seudonimizar. La verdadera anonimización es más compleja (k-anonymity, differential privacy).

El truco del sandbox de datos

En lugar de conceder acceso a los datos de producción, muchas empresas crean un sandbox:

TIPResultado — Los DS prototipan en el sandbox y solo solicitan acceso a producción para la fase final. Aceleración clara: de 4 semanas a 4 días para iniciar un POC.

Caso real: Carrefour y su Unity Catalog

Marcos CRISP-DM, TDSP y alternativas modernas

NOTEObjetivo — Descubrir los 3 marcos más utilizados para estructurar un proyecto de IA, comprender sus fortalezas y debilidades, y saber cuál adoptar según tu contexto (gran empresa, startup, agencia).

¿Por qué un marco metodológico?

Un marco no es un Gantt fijo. Es una rejilla de lectura común entre todas las partes interesadas: tú, el equipo de datos, el sponsor y el auditor. Sin marco, cada uno llama «fase 2» a lo que para otro es la «fase 4». Con un marco, todos hablan el mismo idioma.

TIPConsejo — Elegir un marco y mantenerlo, aunque sea imperfecto, es mil veces mejor que improvisar. La disciplina del camino importa más que la elección exacta.

Marco 1 — CRISP-DM (el clásico)

CRISP-DM (Cross Industry Standard Process for Data Mining), publicado en 1999 por un consorcio europeo (IBM, Daimler, NCR, OHRA), sigue siendo el marco más utilizado en el mundo en 2026 (encuesta KDnuggets).

Las 6 fases

NOTEFortaleza de CRISP-DM — Muy explícito en el bucle de retorno: si la evaluación falla, se vuelve a Business Understanding. Es intelectualmente honesto.
WARNINGDebilidad — No está pensado en absoluto para el MLOps moderno (monitorización continua, reentrenamiento automático). La palabra «producción» apenas aparece. Hay que completarlo con una capa MLOps.

Marco 2 — TDSP de Microsoft

TDSP (Team Data Science Process), lanzado por Microsoft en 2017, es un CRISP-DM modernizado con una visión de equipo y un enfoque en entregables.

Las 5 fases

Qué cambia respecto a CRISP-DM

TIPPara quién — Excelente para las grandes empresas que ya tienen una PMO y quieren estandarizar los entregables entre equipos.

Marco 3 — Google ML Lifecycle (el moderno)

Google publicó en 2019 un ciclo orientado a MLOps de extremo a extremo, que hoy es la referencia en la tecnología moderna (y muy utilizado en startups de IA).

Las fases

NOTEFortalezaMonitor es una fase completa, no un «área de mantenimiento». Obliga al PM a presupuestar el run, no solo el build.

Tabla comparativa

Criterio CRISP-DM TDSP Google ML Lifecycle
Año 1999 2017 2019
Enfoque Data mining Equipo + entregables MLOps
MLOps integrado No Parcial
Fases 6 5 6
Plantillas incluidas Pocas Muchas Medias
Roles especificados No Parcial
Adaptado a la nube moderna No Azure ML Vertex AI / agnóstico
Público ideal Aprendizaje, agencias Grandes empresas Startups tech, FAANG

¿Qué marco elegir? Nuestra recomendación

Startup tech (< 30 personas)

Google ML Lifecycle: agilidad y enfoque MLOps. Puedes desplegar rápidamente e iterar sin burocracia.

Gran empresa tradicional

TDSP: estructura y entregables, perfecto para tranquilizar a la PMO y a los auditores internos.

Agencia de consultoría / formación

Presentación del curso

NOTEObjetivo — Comprender qué hace que la gestión de un proyecto de IA sea tan diferente de un proyecto de software clásico, por qué el 80 % de estos proyectos fracasan y qué aprenderás a hacer de forma concreta en este curso.

Objetivos pedagógicos

TIPAl finalizar este módulo — Sabrás explicar en 2 minutos qué es el Product Management de IA, identificarás las 5 grandes diferencias con un proyecto de software y tendrás una visión clara de las competencias que desarrollarás en los 10 capítulos.

El problema concreto que vas a resolver

Imagina la siguiente situación. Eres Product Manager en un banco o una startup. Una mañana, tu director general entra en tu despacho y dice:

WARNING«Necesitamos IA. El consejo de administración ha aprobado un presupuesto de 800 000 €. Queremos algo que funcione en 6 meses. Tú lo pilotas.»

Estas son las preguntas que te llegarán durante la semana:

Preguntas de negocio que te harán

Qué aprenderás a hacer

NOTEEl oficio de PM de IA en una frase — Es el puente entre la incertidumbre científica (los modelos se equivocan) y la certeza de negocio (el sponsor quiere un resultado medible). Todo tu valor añadido está en esa traducción.

Por qué un proyecto de IA no es un proyecto de software clásico

Muchos jefes de proyecto principiantes piensan que un proyecto de IA es simplemente «un proyecto de software con un modelo dentro». Es falso, y es exactamente por eso por lo que fracasan. Estas son las 5 grandes diferencias:

Aspecto Proyecto de software clásico Proyecto de IA
Resultado Determinista (misma entrada ⇒ misma salida) Probabilístico (misma entrada ⇒ resultado con margen de error)
Especificaciones Pliego de condiciones preciso Hipótesis que validar experimentalmente
Ciclo de vida Desarrollo ⇒ Pruebas ⇒ Despliegue ⇒ Mantenimiento Datos ⇒ Modelo ⇒ Evaluación ⇒ Despliegue ⇒ Monitorización ⇒ Reentrenamiento
Dependencia de datos Marginal (archivos de configuración) Vital (sin datos, no hay producto)
Deriva en producción El código no se deteriora solo El modelo se degrada de forma natural (data drift)
WARNINGConsecuencia directa — No puedes aplicar un Scrum estándar, un Gantt fijo ni un pliego de condiciones funcionales detallado. Necesitas un modelo adaptado, que este curso te proporcionará.

El dato brutal: el 80 % de los proyectos de IA fracasan

Según Gartner (2024) y un informe de McKinsey de 2025, entre el 70 % y el 85 % de los proyectos de IA en empresas nunca superan la fase de prueba de concepto. ¿Por qué? Estas son las 3 causas principales:

1. Mal definición del alcance

Se lanza un proyecto de IA «porque hay que hacer IA», sin un problema de negocio claro detrás. Resultado: un modelo que funciona técnicamente pero no aporta ningún valor.

~ 35 % de los fracasos

2. Datos insuficientes

Se descubre tras 3 meses de POC que los datos están incompletos, sesgados o son inaccesibles jurídicamente. El proyecto muere antes de llegar a producción.

~ 30 % de los fracasos

3. No se lleva a producción

El modelo se queda en un notebook Jupyter del data scientist. Nadie pensó en el despliegue, la monitorización ni la integración con el SI.

~ 20 % de los fracasos

TIPLa buena noticia — Estas 3 causas están todas en manos del Product Manager. Definir bien el alcance, validar los datos pronto y prever el MLOps desde el principio son competencias que se aprenden, y es exactamente el programa de este curso.
va-plus-loin

Este artículo cubre los extractos más útiles: el curso completo Gestión de Proyectos de IA (11 capítulos, 35 lecciones, ejercicios corregidos y proyecto final) te lleva hasta el final.

./acceder-al-curso-completo curso gratuito: Claude Cowork

FAQ

¿Cuánto tiempo se necesita para aprender Gestión de Proyectos de IA?
Con una progresión estructurada (11 capítulos, 35 lecciones cortas y prácticas), se alcanza un nivel operativo en unas semanas dedicando entre 30 y 60 minutos al día. Lo importante es practicar cada concepto de inmediato.
¿Se necesitan requisitos previos?
Con nociones básicas de informática basta. Si sabes usar un terminal y leer código sencillo, estás listo.
¿Por dónde empezar de forma concreta?
Reproduce los comandos de este artículo y sigue el curso completo Gestión de Proyectos de IA: encadena las 35 lecciones en orden, con ejercicios y proyecto final.

📬 ¿Quieres recibir este tipo de guía cada semana? Suscríbete gratis — código real, cero relleno.