Machine & Deep Learning

Lánzate al Machine Learning para principiantes: tu primer paso concreto hoy

Machine Learning para Principiantes: lo esencial en un artículo — código real, diagramas y pasos concretos, extractos de un curso de 44 lecciones.

REHOUMA Haythem

12 Jun 2026 • 12 min read

La mejor forma de aprender Machine Learning para Principiantes es practicando. Este artículo te pone en marcha con extractos prácticos extraídos de un curso de 44 lecciones, para que obtengas un primer resultado ya hoy.

tl;dr

Introducción y Primeros Pasos
Aprender de los Datos
Las Tres Grandes Familias de ML
Clasificación vs Regresión
Primer Modelo con Orange

~$ cat ./parcours.md # Machine Learning Principiantes — 10 capítulos

Introducción y Primeros Pasos

→ Presentación del curso y ¿qué es el ML?→ El ML a tu alrededor — 10 ejemplos del día a día+ 1 más lecciones

Aprender de los Datos

→ Datos, ejemplos y etiquetas→ Encontrar patrones — intuición visual+ 2 más lecciones

Las Tres Grandes Familias de ML

→ Aprendizaje supervisado — predecir con ejemplos→ Aprendizaje no supervisado — encontrar grupos+ 2 más lecciones

Clasificación vs Regresión

→ Clasificación — categorizar cosas→ Regresión — predecir un número+ 2 más lecciones

Primer Modelo con Orange

→ Instalar Orange y recorrido de la interfaz→ Cargar un dataset Titanic y explorarlo+ 2 más lecciones

Evaluar un Modelo

→ Precisión (accuracy) — útil pero engañosa→ Matriz de confusión — leer los errores+ 2 más lecciones

Sobreajuste y Subajuste

→ Underfitting — el modelo demasiado tonto→ Overfitting — el modelo que aprende de memoria+ 2 más lecciones

Casos de Uso Empresariales

→ Marketing — segmentación y anti-churn→ Finanzas — scoring de crédito y fraude+ 1 más lecciones

🏁

Proyecto final (+ 2 capítulos en camino)

→ Te vas con un proyecto concreto y demostrable

Entrenamiento vs prueba — ¿por qué separar?

NOTEObjetivo — Comprender por qué siempre hay que separar los datos en dos conjuntos (entrenamiento y prueba), cómo esto permite evaluar la verdadera capacidad de generalización de un modelo y evitar la trampa principal de probar sobre los datos de entrenamiento.

Objetivos pedagógicos

TIPAl finalizar este módulo

Comprender la diferencia entre memorizar y generalizar
Conocer las proporciones clásicas de separación (80/20, 70/30)
Distinguir entre conjunto de entrenamiento, validación y prueba
Comprender la validación cruzada (cross-validation)
Identificar la trampa del 'data leakage'

La trampa: probar sobre los datos de entrenamiento

Imagina un estudiante que prepara un examen. El profesor le entrega 50 ejercicios con sus soluciones y le dice "estúdialos bien". El día del examen, el profesor plantea los mismos 50 ejercicios. El estudiante puede sacar un 100 % sin entender nada: solo ha memorizado.

Es exactamente lo que ocurre si pruebas un modelo de ML con los datos con los que fue entrenado. Un modelo sobreajustado puede "aprender de memoria" los ejemplos y obtener un 100 % en el entrenamiento, pero ser completamente inútil con datos nuevos.

WARNINGRegla absoluta: los datos utilizados para entrenar un modelo nunca deben servir para evaluarlo. Sin separación, tus métricas son engañosas.

La solución: la división train/test

La solución es sencilla: se divide el dataset en 2 paquetes aleatoriamente antes del entrenamiento.

Conjunto de entrenamiento (train)

70 a 80 % de los datos. Sirve para entrenar el modelo. Es el "cuaderno de ejercicios con soluciones" que estudia el alumno.

Conjunto de prueba (test)

20 a 30 % de los datos. Sirve para evaluar el modelo tras el entrenamiento. Es el examen final con ejercicios nunca vistos.

Conjunto	Proporción	Rol
Train	60–70%	Entrenar los parámetros del modelo
Validation	15–20%	Ajustar hiperparámetros, comparar varios modelos
Test	15–20%	Evaluación final, una sola vez, al final

¿Por qué 3 paquetes? Porque si ajustas tu modelo observando los resultados del test, terminas "sobreoptimizando" para ese test concreto: se convierte en una forma de entrenamiento indirecto.

TIPRegla de oro: el conjunto de prueba solo debe tocarse una vez, al final del proyecto, para obtener la cifra oficial. Todos los experimentos intermedios se realizan sobre el conjunto de validación.

La validación cruzada (k-fold cross-validation)

Problema de la división simple train/test: el resultado depende de qué datos hayan caído en el conjunto de prueba. Una mala selección = métrica pesimista u optimista.

La validación cruzada de k pliegues resuelve esto promediando varios splits:

El data leakage: la trampa invisible

El data leakage (fuga de datos) es el error más sutil y frecuente. Se produce cuando información del test "filtra" al entrenamiento, lo que da resultados artificialmente buenos en validación pero catastróficos en producción.

Ejemplos típicos

Cómo evitarlo

WARNINGSíntoma característico: modelo al 99 % en validación, 60 % en producción. Casi siempre se trata de data leakage.

Visualizar el modelo y sus predicciones

NOTEObjetivo — Visualizar el árbol de decisión entrenado y observar sus predicciones sobre nuevos pasajeros, para comprender concretamente qué ha aprendido el modelo.

Objetivos pedagógicos

TIPAl finalizar este módulo

Visualizar un árbol con el widget Tree Viewer
Leer las reglas aprendidas por el modelo
Realizar predicciones con el widget Predictions
Cerrar el primer flujo de trabajo completo

Ver el árbol: el widget Tree Viewer

La gran ventaja del árbol de decisión es que se puede ver. El widget Tree Viewer dibuja el árbol rama por rama, con sus preguntas y respuestas.

TIPConsejo: esta transparencia es una gran ventaja. En un contexto profesional, poder explicar por qué decide el modelo suele ser tan importante como su precisión.

Realizar predicciones: el widget Predictions

Para aplicar el modelo a nuevos casos se utiliza el widget Predictions. Recibe dos entradas: el modelo entrenado y los datos a predecir.

Encontrar patrones — intuición visual

NOTEObjetivo — Comprender de forma intuitiva qué es un 'pattern' (patrón recurrente) en los datos, cómo una máquina puede detectarlos visualmente y por qué esta detección permite luego realizar predicciones sobre nuevos casos.

Objetivos pedagógicos

TIPAl finalizar este módulo

Definir qué es un pattern en ML
Visualizar un pattern en un diagrama de dispersión
Comprender la noción de frontera de decisión
Distinguir un pattern simple (lineal) de uno complejo (no lineal)
Entender el vínculo entre el pattern detectado y la generalización

¿Qué es un pattern?

Un pattern (en español: patrón recurrente) es una regularidad estadística en los datos. Es lo que la máquina busca detectar para poder realizar predicciones.

NOTEEl desafío fundamental: si el modelo encuentra un pattern real (que se repite en la realidad), puede reutilizarlo con datos nuevos. Esto se denomina generalización: aplicar lo aprendido a casos nunca vistos.

Visualización: un diagrama de dispersión y su frontera

La forma más sencilla de visualizar un pattern: un gráfico de 2 features. Imaginemos un dataset de flores con 2 características (longitud del pétalo, anchura del pétalo) y 2 especies (A y B).

TIPEs la esencia del ML supervisado: encontrar una frontera (o una función) que separe o prediga correctamente los ejemplos observados, esperando que funcione también con los ejemplos futuros.

Patrones lineales vs no lineales

No todos los patrones tienen la misma complejidad.

Patrón lineal

La frontera es una línea recta (o un plano en 3D, un hiperplano en N dimensiones).

Ejemplo: "cuanto más aumenta la dosis de azúcar, mayor es el riesgo de diabetes" (relación directa).

Algoritmos adecuados: regresión lineal, regresión logística, SVM lineal.

Patrón no lineal

La frontera es curva, en espiral o con formas complejas.

Ejemplo: "el riesgo de cáncer aumenta con la edad, pero también depende de combinaciones complejas (genética, estilo de vida)".

Algoritmos adecuados: árboles de decisión, bosques aleatorios, redes neuronales, XGBoost.

WARNINGTrampa clásica: usar un modelo lineal en un problema no lineal = subajuste (el modelo es demasiado simple). A la inversa, usar un modelo muy complejo en un problema simple = sobreajuste (el modelo aprende ruido). Lo veremos en detalle en el capítulo 06.

El pattern no es la regla definitiva: solo una aproximación

Importante: un pattern de ML nunca es una regla absoluta. Es una tendencia estadística. El modelo proporciona probabilidades, no certezas.

Pattern detectado	Casos en los que funciona	Casos en los que falla
"Email con 'ganado 1M€' = spam"	95 % de los casos	Lotería oficial realmente ganada
"Joven + saldo bajo = se da de baja"	70 % de los casos	Estudiante que seguirá siendo cliente 30 años
"Píxeles rojos redondos = manzana"	80 % de los casos	Tomate, fresa, balón

Por eso todo modelo de ML se evalúa con métricas (precisión, recall, etc.). No se busca la perfección, sino el mejor rendimiento posible, sabiendo que siempre habrá errores.

Por qué la dimensión lo cambia todo: la maldición de la dimensionalidad

Con 2 features se puede dibujar un gráfico 2D y ver los patterns. Con 3 features aún es posible (3D). Pero en la práctica los datasets suelen tener 10, 100 o incluso 1000 features. Visualizar se vuelve imposible.

va-más-lejos

Este artículo cubre los extractos más útiles: el curso completo Machine Learning para Principiantes (11 capítulos, 44 lecciones, ejercicios resueltos y proyecto final) te lleva hasta el final.

./acceder-al-curso-completo curso gratuito: Dominar Claude Code

FAQ

¿Cuánto tiempo se necesita para aprender Machine Learning para Principiantes?

Con una progresión estructurada (11 capítulos, 44 lecciones cortas y prácticas) se alcanza un nivel operativo en unas semanas dedicando 30-60 minutos al día. Lo importante es practicar cada concepto de inmediato.

¿Se necesitan requisitos previos?

Ningún requisito previo: el curso parte de cero y cada concepto se introduce antes de utilizarlo.

¿Por dónde empezar de forma concreta?

Reproduce los comandos de este artículo y sigue el curso completo Machine Learning para Principiantes: encadena las 44 lecciones en orden, con ejercicios y proyecto final.

./leer-también

→ Machine Learning Simplificado en la práctica: el código y los comandos que realmente importan → Aprendizaje Automático con Python: los 9 pasos clave para pasar de cero a operativo → Lánzate con Python scikit-learn: tu primer paso concreto hoy

📬 ¿Quieres recibir este tipo de guía cada semana? Suscríbete gratis — código real, cero palabrería.

Entrenamiento vs prueba — ¿por qué separar?

Objetivos pedagógicos

La trampa: probar sobre los datos de entrenamiento

La solución: la división train/test

Conjunto de entrenamiento (train)

Conjunto de prueba (test)

La validación cruzada (k-fold cross-validation)

El data leakage: la trampa invisible

Ejemplos típicos

Cómo evitarlo

Visualizar el modelo y sus predicciones

Objetivos pedagógicos

Ver el árbol: el widget Tree Viewer

Realizar predicciones: el widget Predictions

Encontrar patrones — intuición visual

Objetivos pedagógicos

¿Qué es un pattern?

Visualización: un diagrama de dispersión y su frontera

Patrones lineales vs no lineales

Patrón lineal

Patrón no lineal

El pattern no es la regla definitiva: solo una aproximación

Por qué la dimensión lo cambia todo: la maldición de la dimensionalidad

FAQ

Stay up to date