Lánzate al Machine Learning para principiantes: tu primer paso concreto hoy

Machine Learning para Principiantes: lo esencial en un artículo — código real, diagramas y pasos concretos, extractos de un curso de 44 lecciones.

Lánzate al Machine Learning para principiantes: tu primer paso concreto hoy

La mejor forma de aprender Machine Learning para Principiantes es practicando. Este artículo te pone en marcha con extractos prácticos extraídos de un curso de 44 lecciones, para que obtengas un primer resultado ya hoy.

tl;dr
  • Introducción y Primeros Pasos
  • Aprender de los Datos
  • Las Tres Grandes Familias de ML
  • Clasificación vs Regresión
  • Primer Modelo con Orange
~$ cat ./parcours.md # Machine Learning Principiantes — 10 capítulos
01
Introducción y Primeros Pasos
→ Presentación del curso y ¿qué es el ML?→ El ML a tu alrededor — 10 ejemplos del día a día+ 1 más lecciones
02
Aprender de los Datos
→ Datos, ejemplos y etiquetas→ Encontrar patrones — intuición visual+ 2 más lecciones
03
Las Tres Grandes Familias de ML
→ Aprendizaje supervisado — predecir con ejemplos→ Aprendizaje no supervisado — encontrar grupos+ 2 más lecciones
04
Clasificación vs Regresión
→ Clasificación — categorizar cosas→ Regresión — predecir un número+ 2 más lecciones
05
Primer Modelo con Orange
→ Instalar Orange y recorrido de la interfaz→ Cargar un dataset Titanic y explorarlo+ 2 más lecciones
06
Evaluar un Modelo
→ Precisión (accuracy) — útil pero engañosa→ Matriz de confusión — leer los errores+ 2 más lecciones
07
Sobreajuste y Subajuste
→ Underfitting — el modelo demasiado tonto→ Overfitting — el modelo que aprende de memoria+ 2 más lecciones
08
Casos de Uso Empresariales
→ Marketing — segmentación y anti-churn→ Finanzas — scoring de crédito y fraude+ 1 más lecciones
🏁
Proyecto final (+ 2 capítulos en camino)
→ Te vas con un proyecto concreto y demostrable

Entrenamiento vs prueba — ¿por qué separar?

NOTEObjetivo — Comprender por qué siempre hay que separar los datos en dos conjuntos (entrenamiento y prueba), cómo esto permite evaluar la verdadera capacidad de generalización de un modelo y evitar la trampa principal de probar sobre los datos de entrenamiento.

Objetivos pedagógicos

TIPAl finalizar este módulo
  • Comprender la diferencia entre memorizar y generalizar
  • Conocer las proporciones clásicas de separación (80/20, 70/30)
  • Distinguir entre conjunto de entrenamiento, validación y prueba
  • Comprender la validación cruzada (cross-validation)
  • Identificar la trampa del 'data leakage'

La trampa: probar sobre los datos de entrenamiento

Imagina un estudiante que prepara un examen. El profesor le entrega 50 ejercicios con sus soluciones y le dice "estúdialos bien". El día del examen, el profesor plantea los mismos 50 ejercicios. El estudiante puede sacar un 100 % sin entender nada: solo ha memorizado.

Es exactamente lo que ocurre si pruebas un modelo de ML con los datos con los que fue entrenado. Un modelo sobreajustado puede "aprender de memoria" los ejemplos y obtener un 100 % en el entrenamiento, pero ser completamente inútil con datos nuevos.

WARNINGRegla absoluta: los datos utilizados para entrenar un modelo nunca deben servir para evaluarlo. Sin separación, tus métricas son engañosas.

La solución: la división train/test

La solución es sencilla: se divide el dataset en 2 paquetes aleatoriamente antes del entrenamiento.

Conjunto de entrenamiento (train)

70 a 80 % de los datos. Sirve para entrenar el modelo. Es el "cuaderno de ejercicios con soluciones" que estudia el alumno.

Conjunto de prueba (test)

20 a 30 % de los datos. Sirve para evaluar el modelo tras el entrenamiento. Es el examen final con ejercicios nunca vistos.

ConjuntoProporciónRol
Train60–70%Entrenar los parámetros del modelo
Validation15–20%Ajustar hiperparámetros, comparar varios modelos
Test15–20%Evaluación final, una sola vez, al final

¿Por qué 3 paquetes? Porque si ajustas tu modelo observando los resultados del test, terminas "sobreoptimizando" para ese test concreto: se convierte en una forma de entrenamiento indirecto.

TIPRegla de oro: el conjunto de prueba solo debe tocarse una vez, al final del proyecto, para obtener la cifra oficial. Todos los experimentos intermedios se realizan sobre el conjunto de validación.

La validación cruzada (k-fold cross-validation)

Problema de la división simple train/test: el resultado depende de qué datos hayan caído en el conjunto de prueba. Una mala selección = métrica pesimista u optimista.

La validación cruzada de k pliegues resuelve esto promediando varios splits:

El data leakage: la trampa invisible

El data leakage (fuga de datos) es el error más sutil y frecuente. Se produce cuando información del test "filtra" al entrenamiento, lo que da resultados artificialmente buenos en validación pero catastróficos en producción.

Ejemplos típicos

Cómo evitarlo

WARNINGSíntoma característico: modelo al 99 % en validación, 60 % en producción. Casi siempre se trata de data leakage.

Visualizar el modelo y sus predicciones

NOTEObjetivo — Visualizar el árbol de decisión entrenado y observar sus predicciones sobre nuevos pasajeros, para comprender concretamente qué ha aprendido el modelo.

Objetivos pedagógicos

TIPAl finalizar este módulo
  • Visualizar un árbol con el widget Tree Viewer
  • Leer las reglas aprendidas por el modelo
  • Realizar predicciones con el widget Predictions
  • Cerrar el primer flujo de trabajo completo

Ver el árbol: el widget Tree Viewer

La gran ventaja del árbol de decisión es que se puede ver. El widget Tree Viewer dibuja el árbol rama por rama, con sus preguntas y respuestas.

TIPConsejo: esta transparencia es una gran ventaja. En un contexto profesional, poder explicar por qué decide el modelo suele ser tan importante como su precisión.

Realizar predicciones: el widget Predictions

Para aplicar el modelo a nuevos casos se utiliza el widget Predictions. Recibe dos entradas: el modelo entrenado y los datos a predecir.

Encontrar patrones — intuición visual

NOTEObjetivo — Comprender de forma intuitiva qué es un 'pattern' (patrón recurrente) en los datos, cómo una máquina puede detectarlos visualmente y por qué esta detección permite luego realizar predicciones sobre nuevos casos.

Objetivos pedagógicos

TIPAl finalizar este módulo
  • Definir qué es un pattern en ML
  • Visualizar un pattern en un diagrama de dispersión
  • Comprender la noción de frontera de decisión
  • Distinguir un pattern simple (lineal) de uno complejo (no lineal)
  • Entender el vínculo entre el pattern detectado y la generalización

¿Qué es un pattern?

Un pattern (en español: patrón recurrente) es una regularidad estadística en los datos. Es lo que la máquina busca detectar para poder realizar predicciones.

NOTEEl desafío fundamental: si el modelo encuentra un pattern real (que se repite en la realidad), puede reutilizarlo con datos nuevos. Esto se denomina generalización: aplicar lo aprendido a casos nunca vistos.

Visualización: un diagrama de dispersión y su frontera

La forma más sencilla de visualizar un pattern: un gráfico de 2 features. Imaginemos un dataset de flores con 2 características (longitud del pétalo, anchura del pétalo) y 2 especies (A y B).

TIPEs la esencia del ML supervisado: encontrar una frontera (o una función) que separe o prediga correctamente los ejemplos observados, esperando que funcione también con los ejemplos futuros.

Patrones lineales vs no lineales

No todos los patrones tienen la misma complejidad.

Patrón lineal

La frontera es una línea recta (o un plano en 3D, un hiperplano en N dimensiones).

Ejemplo: "cuanto más aumenta la dosis de azúcar, mayor es el riesgo de diabetes" (relación directa).

Algoritmos adecuados: regresión lineal, regresión logística, SVM lineal.

Patrón no lineal

La frontera es curva, en espiral o con formas complejas.

Ejemplo: "el riesgo de cáncer aumenta con la edad, pero también depende de combinaciones complejas (genética, estilo de vida)".

Algoritmos adecuados: árboles de decisión, bosques aleatorios, redes neuronales, XGBoost.

WARNINGTrampa clásica: usar un modelo lineal en un problema no lineal = subajuste (el modelo es demasiado simple). A la inversa, usar un modelo muy complejo en un problema simple = sobreajuste (el modelo aprende ruido). Lo veremos en detalle en el capítulo 06.

El pattern no es la regla definitiva: solo una aproximación

Importante: un pattern de ML nunca es una regla absoluta. Es una tendencia estadística. El modelo proporciona probabilidades, no certezas.

Pattern detectadoCasos en los que funcionaCasos en los que falla
"Email con 'ganado 1M€' = spam"95 % de los casosLotería oficial realmente ganada
"Joven + saldo bajo = se da de baja"70 % de los casosEstudiante que seguirá siendo cliente 30 años
"Píxeles rojos redondos = manzana"80 % de los casosTomate, fresa, balón

Por eso todo modelo de ML se evalúa con métricas (precisión, recall, etc.). No se busca la perfección, sino el mejor rendimiento posible, sabiendo que siempre habrá errores.

Por qué la dimensión lo cambia todo: la maldición de la dimensionalidad

Con 2 features se puede dibujar un gráfico 2D y ver los patterns. Con 3 features aún es posible (3D). Pero en la práctica los datasets suelen tener 10, 100 o incluso 1000 features. Visualizar se vuelve imposible.

va-más-lejos

Este artículo cubre los extractos más útiles: el curso completo Machine Learning para Principiantes (11 capítulos, 44 lecciones, ejercicios resueltos y proyecto final) te lleva hasta el final.

./acceder-al-curso-completo curso gratuito: Dominar Claude Code

FAQ

¿Cuánto tiempo se necesita para aprender Machine Learning para Principiantes?
Con una progresión estructurada (11 capítulos, 44 lecciones cortas y prácticas) se alcanza un nivel operativo en unas semanas dedicando 30-60 minutos al día. Lo importante es practicar cada concepto de inmediato.
¿Se necesitan requisitos previos?
Ningún requisito previo: el curso parte de cero y cada concepto se introduce antes de utilizarlo.
¿Por dónde empezar de forma concreta?
Reproduce los comandos de este artículo y sigue el curso completo Machine Learning para Principiantes: encadena las 44 lecciones en orden, con ejercicios y proyecto final.

📬 ¿Quieres recibir este tipo de guía cada semana? Suscríbete gratis — código real, cero palabrería.