Lánzate a la Gestión de Proyectos de IA: tu primer paso concreto hoy
Gestión de Proyectos IA: lo esencial en un artículo — código real, diagramas y pasos concretos, extractos de un curso de 35 lecciones.
La mejor forma de aprender Gestión de Proyectos de IA es practicando. Este artículo te da el empujón inicial con extractos prácticos extraídos de un curso de 35 lecciones — lo suficiente para obtener un primer resultado desde hoy.
- Introducción a la Gestión de Proyectos de IA
- Ciclo de vida de un proyecto de IA
- Definición del alcance y caso de negocio
- Constitución del equipo de IA
- Métodos ágiles para IA
Catálogo de datos y accesos controlados
El problema: ¿dónde están los datos?
En una empresa de más de 500 personas se cuentan fácilmente entre 50 y 500 tablas críticas dispersas entre: data warehouse central, lagos S3, bases relacionales de negocio, Salesforce, archivos Excel en SharePoint, exportaciones manuales del SI… Un nuevo Data Scientist tarda de media entre 2 y 4 semanas en encontrar y obtener acceso a los datos correctos.
¿Qué es un Data Catalog?
Un Data Catalog es un directorio centralizado y searchable de los datos de la empresa. Responde a las preguntas: ¿dónde está este dato, quién lo posee, está actualizado, es de calidad, quién tiene acceso y cómo solicitarlo?
Qué contiene un catálogo
Herramientas del mercado
Ficha tipo de un dataset en el catálogo
fct_transactions_clientsDescripción : Todas las transacciones de clientes desde 2018, agregadas por día.
Owner : Equipo Data Finance (data-finance@compagnie.com)
Steward de negocio : Marie Dupont (Dirección CRM)
Sensibilidad : Sensible (datos personales)
Frescura : Actualización diaria a las 2h
Calidad (sept 2025) : 99,2 % completitud, 0,3 % duplicados
Acceso : Bajo solicitud mediante formulario ServiceNow, validación DPO + owner en menos de 5 días
Lineage upstream : SAP, Salesforce
Lineage downstream : Modelos fraud_v3, churn_v2, dashboard finanzas
Gestión de accesos: 4 niveles de sensibilidad
| Nivel | Ejemplo | Acceso | Plazo |
|---|---|---|---|
| Público | Catálogo de productos, cifras comunicadas | Todo el mundo | Inmediato |
| Interno | Métricas internas no sensibles | Cualquier empleado bajo solicitud | < 24h |
| Sensible | Datos personales de clientes | Manager + DPO | 3-5 días |
| Secreto | Estrategia, M&A, datos de salud | CODIR + auditoría retrospectiva | Caso por caso |
Anonimización y seudonimización
Seudonimización
Sustituir los identificadores por seudónimos. Reversible si se dispone de la tabla de correspondencia.
Ej.: customer_id 12345 → HASH_a3f8b2c
Anonimización
Hacer imposible cualquier reidentificación. Irreversible.
Ej.: agregación por decil de edad + redondeo de importes a 100 €
Fuera del RGPD si se realiza correctamente (k-anonymity, etc.).
El truco del sandbox de datos
En lugar de conceder acceso a los datos de producción, muchas empresas crean un sandbox:
Caso real: Carrefour y su Unity Catalog
Marcos CRISP-DM, TDSP y alternativas modernas
¿Por qué un marco metodológico?
Un marco no es un Gantt fijo. Es una rejilla de lectura común entre todas las partes interesadas: tú, el equipo de datos, el sponsor y el auditor. Sin marco, cada uno llama «fase 2» a lo que para otro es la «fase 4». Con un marco, todos hablan el mismo idioma.
Marco 1 — CRISP-DM (el clásico)
CRISP-DM (Cross Industry Standard Process for Data Mining), publicado en 1999 por un consorcio europeo (IBM, Daimler, NCR, OHRA), sigue siendo el marco más utilizado en el mundo en 2026 (encuesta KDnuggets).
Las 6 fases
Marco 2 — TDSP de Microsoft
TDSP (Team Data Science Process), lanzado por Microsoft en 2017, es un CRISP-DM modernizado con una visión de equipo y un enfoque en entregables.
Las 5 fases
Qué cambia respecto a CRISP-DM
Marco 3 — Google ML Lifecycle (el moderno)
Google publicó en 2019 un ciclo orientado a MLOps de extremo a extremo, que hoy es la referencia en la tecnología moderna (y muy utilizado en startups de IA).
Las fases
Tabla comparativa
| Criterio | CRISP-DM | TDSP | Google ML Lifecycle |
|---|---|---|---|
| Año | 1999 | 2017 | 2019 |
| Enfoque | Data mining | Equipo + entregables | MLOps |
| MLOps integrado | No | Parcial | Sí |
| Fases | 6 | 5 | 6 |
| Plantillas incluidas | Pocas | Muchas | Medias |
| Roles especificados | No | Sí | Parcial |
| Adaptado a la nube moderna | No | Azure ML | Vertex AI / agnóstico |
| Público ideal | Aprendizaje, agencias | Grandes empresas | Startups tech, FAANG |
¿Qué marco elegir? Nuestra recomendación
Startup tech (< 30 personas)
Google ML Lifecycle: agilidad y enfoque MLOps. Puedes desplegar rápidamente e iterar sin burocracia.
Gran empresa tradicional
TDSP: estructura y entregables, perfecto para tranquilizar a la PMO y a los auditores internos.
Agencia de consultoría / formación
Presentación del curso
Objetivos pedagógicos
El problema concreto que vas a resolver
Imagina la siguiente situación. Eres Product Manager en un banco o una startup. Una mañana, tu director general entra en tu despacho y dice:
Estas son las preguntas que te llegarán durante la semana:
Preguntas de negocio que te harán
Qué aprenderás a hacer
Por qué un proyecto de IA no es un proyecto de software clásico
Muchos jefes de proyecto principiantes piensan que un proyecto de IA es simplemente «un proyecto de software con un modelo dentro». Es falso, y es exactamente por eso por lo que fracasan. Estas son las 5 grandes diferencias:
| Aspecto | Proyecto de software clásico | Proyecto de IA |
|---|---|---|
| Resultado | Determinista (misma entrada ⇒ misma salida) | Probabilístico (misma entrada ⇒ resultado con margen de error) |
| Especificaciones | Pliego de condiciones preciso | Hipótesis que validar experimentalmente |
| Ciclo de vida | Desarrollo ⇒ Pruebas ⇒ Despliegue ⇒ Mantenimiento | Datos ⇒ Modelo ⇒ Evaluación ⇒ Despliegue ⇒ Monitorización ⇒ Reentrenamiento |
| Dependencia de datos | Marginal (archivos de configuración) | Vital (sin datos, no hay producto) |
| Deriva en producción | El código no se deteriora solo | El modelo se degrada de forma natural (data drift) |
El dato brutal: el 80 % de los proyectos de IA fracasan
Según Gartner (2024) y un informe de McKinsey de 2025, entre el 70 % y el 85 % de los proyectos de IA en empresas nunca superan la fase de prueba de concepto. ¿Por qué? Estas son las 3 causas principales:
1. Mal definición del alcance
Se lanza un proyecto de IA «porque hay que hacer IA», sin un problema de negocio claro detrás. Resultado: un modelo que funciona técnicamente pero no aporta ningún valor.
~ 35 % de los fracasos
2. Datos insuficientes
Se descubre tras 3 meses de POC que los datos están incompletos, sesgados o son inaccesibles jurídicamente. El proyecto muere antes de llegar a producción.
~ 30 % de los fracasos
3. No se lleva a producción
El modelo se queda en un notebook Jupyter del data scientist. Nadie pensó en el despliegue, la monitorización ni la integración con el SI.
~ 20 % de los fracasos
Este artículo cubre los extractos más útiles: el curso completo Gestión de Proyectos de IA (11 capítulos, 35 lecciones, ejercicios corregidos y proyecto final) te lleva hasta el final.
./acceder-al-curso-completo curso gratuito: Claude CoworkFAQ
¿Cuánto tiempo se necesita para aprender Gestión de Proyectos de IA?
¿Se necesitan requisitos previos?
¿Por dónde empezar de forma concreta?
📬 ¿Quieres recibir este tipo de guía cada semana? Suscríbete gratis — código real, cero relleno.