Productivité & Carrière

Lánzate a la Gestión de Proyectos de IA: tu primer paso concreto hoy

Gestión de Proyectos IA: lo esencial en un artículo — código real, diagramas y pasos concretos, extractos de un curso de 35 lecciones.

REHOUMA Haythem

12 Jun 2026 • 13 min read

La mejor forma de aprender Gestión de Proyectos de IA es practicando. Este artículo te da el empujón inicial con extractos prácticos extraídos de un curso de 35 lecciones — lo suficiente para obtener un primer resultado desde hoy.

tl;dr

Introducción a la Gestión de Proyectos de IA
Ciclo de vida de un proyecto de IA
Definición del alcance y caso de negocio
Constitución del equipo de IA
Métodos ágiles para IA

~$ cat ./parcours.md # Gestión Proyectos IA — 10 capítulos

Introducción al PM IA

→ Presentación del curso→ ¿Quién hace qué? Panorama de los roles IA+ 1 más lecciones

Ciclo de vida de un proyecto IA

→ De la idea a la producción→ MLOps vs DevOps clásico+ 1 más lecciones

Encuadre y caso de negocio

→ Encontrar el problema correcto→ ROI y medida de valor+ 1 más lecciones

Constitución de equipo IA

→ Roles Data Scientist, ML Engineer, PM→ Organizar un equipo pluridisciplinario+ 1 más lecciones

Métodos ágiles para IA

→ Scrum aplicado a la IA→ Sprints de investigación vs sprints de entrega+ 1 más lecciones

Gestión de datos

→ Gobernanza de datos y RGPD→ Calidad y versionado de datos+ 1 más lecciones

MLOps lado PM

→ El pipeline ML visto por un PM→ Monitoreo de los modelos en producción+ 1 más lecciones

KPIs y medida de valor

→ KPIs técnicos vs business→ A/B testing para modelos IA+ 1 más lecciones

🏁

Proyecto final (+ 2 capítulos en camino)

→ Te vas con un proyecto concreto y demostrable

Catálogo de datos y accesos controlados

NOTEObjetivo — Comprender qué es un Data Catalog, por qué salva los proyectos de IA en las grandes empresas y cómo gestionar los accesos a los datos de forma segura sin convertirse en un cuello de botella.

El problema: ¿dónde están los datos?

En una empresa de más de 500 personas se cuentan fácilmente entre 50 y 500 tablas críticas dispersas entre: data warehouse central, lagos S3, bases relacionales de negocio, Salesforce, archivos Excel en SharePoint, exportaciones manuales del SI… Un nuevo Data Scientist tarda de media entre 2 y 4 semanas en encontrar y obtener acceso a los datos correctos.

WARNINGCoste oculto — Un equipo de 4 DS con un salario de 75 k€/año que pierde 3 semanas buscando datos supone unos 17 k€ por proyecto. Con 10 proyectos, el Data Catalog se amortiza solo.

¿Qué es un Data Catalog?

Un Data Catalog es un directorio centralizado y searchable de los datos de la empresa. Responde a las preguntas: ¿dónde está este dato, quién lo posee, está actualizado, es de calidad, quién tiene acceso y cómo solicitarlo?

Qué contiene un catálogo

Herramientas del mercado

Ficha tipo de un dataset en el catálogo

NOTEDataset : fct_transactions_clients
Descripción : Todas las transacciones de clientes desde 2018, agregadas por día.
Owner : Equipo Data Finance (data-finance@compagnie.com)
Steward de negocio : Marie Dupont (Dirección CRM)
Sensibilidad : Sensible (datos personales)
Frescura : Actualización diaria a las 2h
Calidad (sept 2025) : 99,2 % completitud, 0,3 % duplicados
Acceso : Bajo solicitud mediante formulario ServiceNow, validación DPO + owner en menos de 5 días
Lineage upstream : SAP, Salesforce
Lineage downstream : Modelos fraud_v3, churn_v2, dashboard finanzas

Gestión de accesos: 4 niveles de sensibilidad

Nivel	Ejemplo	Acceso	Plazo
Público	Catálogo de productos, cifras comunicadas	Todo el mundo	Inmediato
Interno	Métricas internas no sensibles	Cualquier empleado bajo solicitud	< 24h
Sensible	Datos personales de clientes	Manager + DPO	3-5 días
Secreto	Estrategia, M&A, datos de salud	CODIR + auditoría retrospectiva	Caso por caso

TIPConsejo de PM — Desde la ficha de definición del alcance, identifica la sensibilidad de cada dataset objetivo y anticipa los plazos. Si necesitas un dataset «secreto» y lo descubres en el sprint 5, pierdes 2 meses.

Anonimización y seudonimización

Seudonimización

Sustituir los identificadores por seudónimos. Reversible si se dispone de la tabla de correspondencia.

Ej.: customer_id 12345 → HASH_a3f8b2c

Anonimización

Hacer imposible cualquier reidentificación. Irreversible.

Ej.: agregación por decil de edad + redondeo de importes a 100 €

Fuera del RGPD si se realiza correctamente (k-anonymity, etc.).

WARNINGTrampa — Muchos equipos creen anonimizar al hashear un email. Eso es solo seudonimizar. La verdadera anonimización es más compleja (k-anonymity, differential privacy).

El truco del sandbox de datos

En lugar de conceder acceso a los datos de producción, muchas empresas crean un sandbox:

TIPResultado — Los DS prototipan en el sandbox y solo solicitan acceso a producción para la fase final. Aceleración clara: de 4 semanas a 4 días para iniciar un POC.

Caso real: Carrefour y su Unity Catalog

Marcos CRISP-DM, TDSP y alternativas modernas

NOTEObjetivo — Descubrir los 3 marcos más utilizados para estructurar un proyecto de IA, comprender sus fortalezas y debilidades, y saber cuál adoptar según tu contexto (gran empresa, startup, agencia).

¿Por qué un marco metodológico?

Un marco no es un Gantt fijo. Es una rejilla de lectura común entre todas las partes interesadas: tú, el equipo de datos, el sponsor y el auditor. Sin marco, cada uno llama «fase 2» a lo que para otro es la «fase 4». Con un marco, todos hablan el mismo idioma.

TIPConsejo — Elegir un marco y mantenerlo, aunque sea imperfecto, es mil veces mejor que improvisar. La disciplina del camino importa más que la elección exacta.

Marco 1 — CRISP-DM (el clásico)

CRISP-DM (Cross Industry Standard Process for Data Mining), publicado en 1999 por un consorcio europeo (IBM, Daimler, NCR, OHRA), sigue siendo el marco más utilizado en el mundo en 2026 (encuesta KDnuggets).

Las 6 fases

NOTEFortaleza de CRISP-DM — Muy explícito en el bucle de retorno: si la evaluación falla, se vuelve a Business Understanding. Es intelectualmente honesto.

WARNINGDebilidad — No está pensado en absoluto para el MLOps moderno (monitorización continua, reentrenamiento automático). La palabra «producción» apenas aparece. Hay que completarlo con una capa MLOps.

Marco 2 — TDSP de Microsoft

TDSP (Team Data Science Process), lanzado por Microsoft en 2017, es un CRISP-DM modernizado con una visión de equipo y un enfoque en entregables.

Las 5 fases

Qué cambia respecto a CRISP-DM

TIPPara quién — Excelente para las grandes empresas que ya tienen una PMO y quieren estandarizar los entregables entre equipos.

Marco 3 — Google ML Lifecycle (el moderno)

Google publicó en 2019 un ciclo orientado a MLOps de extremo a extremo, que hoy es la referencia en la tecnología moderna (y muy utilizado en startups de IA).

Las fases

NOTEFortaleza — Monitor es una fase completa, no un «área de mantenimiento». Obliga al PM a presupuestar el run, no solo el build.

Tabla comparativa

Criterio	CRISP-DM	TDSP	Google ML Lifecycle
Año	1999	2017	2019
Enfoque	Data mining	Equipo + entregables	MLOps
MLOps integrado	No	Parcial	Sí
Fases	6	5	6
Plantillas incluidas	Pocas	Muchas	Medias
Roles especificados	No	Sí	Parcial
Adaptado a la nube moderna	No	Azure ML	Vertex AI / agnóstico
Público ideal	Aprendizaje, agencias	Grandes empresas	Startups tech, FAANG

¿Qué marco elegir? Nuestra recomendación

Startup tech (< 30 personas)

Google ML Lifecycle: agilidad y enfoque MLOps. Puedes desplegar rápidamente e iterar sin burocracia.

Gran empresa tradicional

TDSP: estructura y entregables, perfecto para tranquilizar a la PMO y a los auditores internos.

Agencia de consultoría / formación

Presentación del curso

NOTEObjetivo — Comprender qué hace que la gestión de un proyecto de IA sea tan diferente de un proyecto de software clásico, por qué el 80 % de estos proyectos fracasan y qué aprenderás a hacer de forma concreta en este curso.

Objetivos pedagógicos

TIPAl finalizar este módulo — Sabrás explicar en 2 minutos qué es el Product Management de IA, identificarás las 5 grandes diferencias con un proyecto de software y tendrás una visión clara de las competencias que desarrollarás en los 10 capítulos.

El problema concreto que vas a resolver

Imagina la siguiente situación. Eres Product Manager en un banco o una startup. Una mañana, tu director general entra en tu despacho y dice:

WARNING«Necesitamos IA. El consejo de administración ha aprobado un presupuesto de 800 000 €. Queremos algo que funcione en 6 meses. Tú lo pilotas.»

Estas son las preguntas que te llegarán durante la semana:

Preguntas de negocio que te harán

Qué aprenderás a hacer

NOTEEl oficio de PM de IA en una frase — Es el puente entre la incertidumbre científica (los modelos se equivocan) y la certeza de negocio (el sponsor quiere un resultado medible). Todo tu valor añadido está en esa traducción.

Por qué un proyecto de IA no es un proyecto de software clásico

Muchos jefes de proyecto principiantes piensan que un proyecto de IA es simplemente «un proyecto de software con un modelo dentro». Es falso, y es exactamente por eso por lo que fracasan. Estas son las 5 grandes diferencias:

Aspecto	Proyecto de software clásico	Proyecto de IA
Resultado	Determinista (misma entrada ⇒ misma salida)	Probabilístico (misma entrada ⇒ resultado con margen de error)
Especificaciones	Pliego de condiciones preciso	Hipótesis que validar experimentalmente
Ciclo de vida	Desarrollo ⇒ Pruebas ⇒ Despliegue ⇒ Mantenimiento	Datos ⇒ Modelo ⇒ Evaluación ⇒ Despliegue ⇒ Monitorización ⇒ Reentrenamiento
Dependencia de datos	Marginal (archivos de configuración)	Vital (sin datos, no hay producto)
Deriva en producción	El código no se deteriora solo	El modelo se degrada de forma natural (data drift)

WARNINGConsecuencia directa — No puedes aplicar un Scrum estándar, un Gantt fijo ni un pliego de condiciones funcionales detallado. Necesitas un modelo adaptado, que este curso te proporcionará.

El dato brutal: el 80 % de los proyectos de IA fracasan

Según Gartner (2024) y un informe de McKinsey de 2025, entre el 70 % y el 85 % de los proyectos de IA en empresas nunca superan la fase de prueba de concepto. ¿Por qué? Estas son las 3 causas principales:

1. Mal definición del alcance

Se lanza un proyecto de IA «porque hay que hacer IA», sin un problema de negocio claro detrás. Resultado: un modelo que funciona técnicamente pero no aporta ningún valor.

~ 35 % de los fracasos

2. Datos insuficientes

Se descubre tras 3 meses de POC que los datos están incompletos, sesgados o son inaccesibles jurídicamente. El proyecto muere antes de llegar a producción.

~ 30 % de los fracasos

3. No se lleva a producción

El modelo se queda en un notebook Jupyter del data scientist. Nadie pensó en el despliegue, la monitorización ni la integración con el SI.

~ 20 % de los fracasos

TIPLa buena noticia — Estas 3 causas están todas en manos del Product Manager. Definir bien el alcance, validar los datos pronto y prever el MLOps desde el principio son competencias que se aprenden, y es exactamente el programa de este curso.

va-plus-loin

Este artículo cubre los extractos más útiles: el curso completo Gestión de Proyectos de IA (11 capítulos, 35 lecciones, ejercicios corregidos y proyecto final) te lleva hasta el final.

./acceder-al-curso-completo curso gratuito: Claude Cowork

FAQ

¿Cuánto tiempo se necesita para aprender Gestión de Proyectos de IA?

Con una progresión estructurada (11 capítulos, 35 lecciones cortas y prácticas), se alcanza un nivel operativo en unas semanas dedicando entre 30 y 60 minutos al día. Lo importante es practicar cada concepto de inmediato.

¿Se necesitan requisitos previos?

Con nociones básicas de informática basta. Si sabes usar un terminal y leer código sencillo, estás listo.

¿Por dónde empezar de forma concreta?

Reproduce los comandos de este artículo y sigue el curso completo Gestión de Proyectos de IA: encadena las 35 lecciones en orden, con ejercicios y proyecto final.

./a-leer-también

→ Lánzate con Excel Copilot: tu primer paso concreto hoy → Toolbox IA Imprescindible: los 9 pasos clave para pasar de cero a operativo → Carrera IA Oportunidades explicado de forma sencilla (con esquemas y código real)

📬 ¿Quieres recibir este tipo de guía cada semana? Suscríbete gratis — código real, cero relleno.

Catálogo de datos y accesos controlados

El problema: ¿dónde están los datos?

¿Qué es un Data Catalog?

Qué contiene un catálogo

Herramientas del mercado

Ficha tipo de un dataset en el catálogo

Gestión de accesos: 4 niveles de sensibilidad

Anonimización y seudonimización

Seudonimización

Anonimización

El truco del sandbox de datos

Caso real: Carrefour y su Unity Catalog

Marcos CRISP-DM, TDSP y alternativas modernas

¿Por qué un marco metodológico?

Marco 1 — CRISP-DM (el clásico)

Las 6 fases

Marco 2 — TDSP de Microsoft

Las 5 fases

Qué cambia respecto a CRISP-DM

Marco 3 — Google ML Lifecycle (el moderno)

Las fases

Tabla comparativa

¿Qué marco elegir? Nuestra recomendación

Startup tech (< 30 personas)

Gran empresa tradicional

Agencia de consultoría / formación

Presentación del curso

Objetivos pedagógicos

El problema concreto que vas a resolver

Preguntas de negocio que te harán

Qué aprenderás a hacer

Por qué un proyecto de IA no es un proyecto de software clásico

El dato brutal: el 80 % de los proyectos de IA fracasan

1. Mal definición del alcance

2. Datos insuficientes

3. No se lleva a producción

FAQ

Stay up to date