Machine Learning Simplificado en la práctica: el código y los comandos que realmente importan

Machine Learning Simplificado: lo esencial en un artículo — código real, diagramas y pasos concretos, extraídos de un curso de 42 lecciones.

Machine Learning Simplificado en la práctica: el código y los comandos que realmente importan

Sin teoría interminable aquí: abrimos la terminal y practicamos. Aquí lo esencial de Machine Learning Simplificado, extraído directamente de un curso completo de 42 lecciones — con código real que puedes copiar y pegar ahora.

tl;dr
  • Introducción e Instalación
  • Pandas y NumPy
  • Preprocesamiento de Datos
  • Algoritmos de Clasificación
  • Algoritmos de Regresión
~$ cat ./parcours.md # Machine Learning Simplificado — 10 capítulos
01
Introducción e Instalación
→ Presentación del curso y ecosistema Python ML→ Instalar Anaconda, Jupyter y Scikit-learn+ 1 más lecciones
02
Pandas y NumPy
→ NumPy : arrays y operaciones vectorizadas→ Pandas : DataFrames y Series+ 2 más lecciones
03
Preprocesamiento de los Datos
→ Valores faltantes : estrategias de imputación→ Codificación : OneHot, Label, Target+ 2 más lecciones
04
Algoritmos de Clasificación
→ KNN : K vecinos más cercanos→ Regresión logística+ 2 más leçons
05
Algoritmos de Regresión
→ Regresión lineal e interpretación→ Regresión polinomial+ 2 más leçons
06
Algoritmos Ensamblados
→ Bagging y Random Forest→ Boosting : AdaBoost y Gradient Boosting+ 2 más leçons
07
Aprendizaje No Supervisado
→ K-Means : clustering centroidal→ DBSCAN y clustering por densidad+ 2 más leçons
08
Pipeline Cross-Validation y Tuning
→ Pipeline Scikit-learn : preprocesamiento + modelo→ Validación cruzada : k-fold y estratificado+ 2 más leçons
🏁
Proyecto final (+ 2 capítulos en camino)
→ Sales con un proyecto concreto y demostrable

Visualización rápida con Matplotlib y Seaborn

NOTEObjetivo — Visualizar tus datos para comprenderlos antes del ML. Dominar los gráficos esenciales: histograma, scatter, boxplot, heatmap.

Objetivos pedagógicos

TIPAl finalizar este módulo
  • Crear gráficos con matplotlib.pyplot
  • Distinguir histograma, scatter, line plot, boxplot
  • Usar Seaborn para gráficos estadísticos rápidos
  • Personalizar títulos, ejes, leyendas
  • Trazar una matriz de correlación (heatmap)

Matplotlib: la navaja suiza de la visualización

Primer clasificador Iris en 30 minutos

NOTEObjetivo — Construir tu primer modelo de ML completo con el famoso dataset Iris: carga, entrenamiento, predicción y evaluación, en menos de 30 minutos.

Objetivos pedagógicos

TIPAl finalizar este módulo
  • Cargar un dataset estándar desde sklearn
  • Comprender la estructura X (features) e y (objetivos)
  • Dividir los datos en train y test
  • Entrenar un modelo KNN en una línea
  • Evaluar la precisión con accuracy_score

El dataset Iris: el "Hello World" del ML

El conjunto de datos Iris contiene 150 flores de iris pertenecientes a 3 especies (Setosa, Versicolor, Virginica). Para cada flor se tienen 4 medidas: longitud y anchura de pétalos y sépalos. El objetivo es predecir la especie a partir de las medidas.

150 muestras

50 flores por especie. Dataset pequeño ideal para aprender e iterar rápidamente.

4 features numéricas

Longitud del sépalo, anchura del sépalo, longitud del pétalo, anchura del pétalo (en centímetros).

3 clases

Setosa (0), Versicolor (1), Virginica (2). Problema de clasificación multiclase.

NOTEHistoria: este dataset fue recolectado en 1936 por el botánico Edgar Anderson y popularizado por el estadístico Ronald Fisher. Se convirtió en el estándar de aprendizaje del ML porque sus clases son visualmente separables y de tamaño reducido.

Paso 1: cargar los datos

Scikit-learn incluye el dataset Iris internamente, no es necesario descargar nada externo:

Paso 4: predecir y evaluar

Predecir sobre una flor nueva

Una vez entrenado, se puede predecir la especie de una flor desconocida pasando sus 4 medidas:

API REST con FastAPI

NOTEObjetivo — Exponer un modelo de ML como una API web que cualquier aplicación pueda llamar. Construir un endpoint de predicción con FastAPI, validar las entradas con Pydantic y probar localmente.

Objetivos pedagógicos

TIPAl finalizar este módulo
  • Comprender por qué exponer un modelo mediante una API
  • Crear una aplicación FastAPI mínima
  • Cargar el modelo al inicio y usarlo en un endpoint
  • Validar los datos de entrada con Pydantic
  • Lanzar y probar la API con Uvicorn y la documentación Swagger

¿Por qué una API?

Un modelo en un notebook solo es útil para ti. Al exponerlo mediante una API REST, cualquier aplicación (sitio web, móvil, otro servicio) puede enviar datos y recibir una predicción con una simple petición HTTP. Es el estándar para poner un modelo en producción.

va-plus-loin

Este artículo cubre los extractos más útiles — el curso completo Machine Learning Simplificado (11 capítulos, 42 lecciones, ejercicios resueltos y proyecto final) te lleva hasta el final.

./acceder-al-curso-completo curso gratuito: Dominar Claude Code

FAQ

¿Cuánto tiempo se necesita para aprender Machine Learning Simplificado?
Con una progresión estructurada (11 capítulos, 42 lecciones cortas y prácticas), se alcanza un nivel operativo en unas semanas dedicando 30 a 60 minutos al día. Lo importante es practicar cada concepto de inmediato.
¿Se necesitan requisitos previos?
Ningún requisito previo: el curso parte de cero y cada concepto se introduce antes de utilizarlo.
¿Por dónde empezar concretamente?
Reproduce los comandos de este artículo y sigue el curso completo Machine Learning Simplificado: encadena las 42 lecciones en orden, con ejercicios y proyecto final.

📬 ¿Quieres recibir este tipo de guía cada semana? Suscríbete gratis — código real, cero palabrería.