Fine-Tuning de LLMs explicado de forma sencilla (con diagramas y código real)

Fine Tuning LLMs: lo esencial en un artículo — código real, diagramas y pasos concretos, extractos de un curso de 37 lecciones.

Fine-Tuning de LLMs explicado de forma sencilla (con diagramas y código real)

Una guía que va al grano: Fine Tuning LLMs desglosada con diagramas, ejemplos concretos y comandos probados. Todo proviene de un curso estructurado de 11 capítulos — aquí lo mejor.

tl;dr
  • Introducción e Instalación
  • Fundamentos de los LLMs
  • Preparación de los Datos
  • Fine-Tuning Completo
  • LoRA y QLoRA PEFT
~$ cat ./parcours.md # Fine Tuning LLMs — 9 capítulos
01
Introducción e Instalación
→ Presentación del curso y por qué fine-tuner ?→ Instalar Python, PyTorch y Hugging Face+ 1 más lecciones
02
Fundamentos de los LLMs
→ Arquitectura Transformer en breve→ Pre-entrenamiento, SFT, RLHF, DPO+ 2 más lecciones
03
Preparación de los Datos
→ Recopilación y limpieza de datos→ Formatos Alpaca, ChatML, ShareGPT, JSONL+ 2 más lecciones
04
Fine-Tuning Completo
→ Conceptos del full fine-tuning→ Hugging Face Trainer y TrainingArguments+ 2 más lecciones
05
LoRA y QLoRA PEFT
→ Principio de LoRA low-rank adaptation→ QLoRA cuantización 4-bit y NF4+ 2 más leçons
06
Entrenamiento e Hiperparámetros
→ Learning rate, batch size y épocas→ Schedulers cosine, linear, warmup+ 2 más leçons
07
Alineamiento Avanzado DPO RLHF
→ DPO Direct Preference Optimization→ ORPO y KTO alternativas modernas+ 1 más leçons
08
Despliegue e Inferencia
→ Cuantización GGUF con llama.cpp→ Servir con vLLM o TGI (alto rendimiento)+ 1 más leçons
🏁
Proyecto final (+ 1 capítulos en camino)
→ Te vas con un proyecto concreto y demostrable

Ollama e integración local

NOTEObjetivo — Desplegar tu modelo fine-tuneado mediante Ollama, la herramienta más sencilla para ejecutar un LLM localmente (macOS, Windows, Linux) con una API REST en 30 segundos.

Objetivos pedagógicos

TIPAl finalizar este módulo
  • Instalar Ollama y ejecutar un modelo preexistente
  • Importar tu modelo GGUF personalizado mediante un Modelfile
  • Usar la API REST de Ollama desde cualquier lenguaje
  • Integrar Ollama en una app Python / Node / Rust
  • Optimizar para el hardware (CPU, M2, RTX)

Instalar Ollama

Ejecutar un modelo existente

API nativa

HardwareModeloTokens/seg
M2 16 GBMistral 7B Q4_K_M40
M3 Max 64 GBMistral 7B Q4_K_M80
M3 Max 64 GBLlama 3 70B Q4_K_M10
RTX 4090 24 GBMistral 7B Q4_K_M100+
RTX 3060 12 GBMistral 7B Q4_K_M35

Casos de uso de Ollama en producción

POC interno

Hacer que los equipos de negocio descubran el modelo sin infraestructura en la nube.

App de escritorio

Incluida en Tauri / Electron / Swift app para análisis local.

Edge / on-prem

Datos sensibles que no deben salir de la red interna.

Limitaciones de Ollama

Subir tu modelo a ollama.com

Puedes compartir tu modelo personalizado en el registro público de Ollama:

Formatos Alpaca, ChatML, ShareGPT, JSONL

NOTEObjetivo — Conocer los formatos estándar de datasets para el fine-tuning de LLMs y saber convertirlos entre sí. Comprender la importancia de la plantilla de chat específica de cada modelo.

Objetivos pedagógicos

TIPAl finalizar este módulo
  • Identificar los 4 formatos más usados en 2026
  • Convertir un dataset entre Alpaca, ChatML y ShareGPT
  • Aplicar la plantilla de chat correcta según el modelo objetivo
  • Guardar tu dataset en JSONL streamable
  • Detectar errores de formato antes del entrenamiento

Formato 1: Alpaca (el más sencillo)

Proveniente del proyecto Stanford Alpaca (2023). Tres campos: instruction, input (opcional) y output.

Convertir entre formatos

Alpaca → ChatML

Hugging Face lo gestiona automáticamente mediante tokenizer.apply_chat_template(). Nunca debes escribir estas plantillas a mano.

Instalar Python, PyTorch y Hugging Face

NOTEObjetivo — Configurar un entorno Python limpio para el fine-tuning: Python 3.11, PyTorch con CUDA y toda la pila de Hugging Face (Transformers, PEFT, Datasets, TRL).

Objetivos pedagógicos

TIPAl finalizar este módulo
  • Instalar Python 3.11 y un entorno virtual dedicado
  • Elegir e instalar la versión correcta de PyTorch (CPU vs CUDA)
  • Instalar la pila completa de Hugging Face con versiones compatibles
  • Verificar que PyTorch detecta correctamente la GPU
  • Crear tu cuenta de Hugging Face y configurar tu token

Requisitos del sistema

ComponenteRecomendadoMínimo
Python3.113.10
RAM32 GB16 GB
GPU NVIDIARTX 4090 (24 GB)RTX 3060 (12 GB) o Colab T4
Espacio en disco200 GB SSD50 GB
CUDA Toolkit12.111.8
WARNINGAtención Python 3.12: En 2026, algunas dependencias (en especial bitsandbytes en Windows) todavía no admiten perfectamente Python 3.12. Quédate en 3.11 para este curso.

Paso 1: Instalar Python 3.11 y un entorno virtual

Crea una carpeta de trabajo y luego un entorno virtual dedicado al curso. Esto evita cualquier conflicto con otros proyectos de Python.

GPU NVIDIA con CUDA 12.1

peft

Parameter-Efficient Fine-Tuning. Imprescindible para LoRA y QLoRA.

bitsandbytes

Cuantización de 8 bits y 4 bits. Permite QLoRA. Debe coincidir con tu versión de CUDA.

Paso 4: Crear una cuenta y un token de Hugging Face

va-plus-loin

Este artículo cubre los extractos más útiles — el curso completo Fine Tuning LLMs (11 capítulos, 37 lecciones, ejercicios resueltos y proyecto final) te lleva hasta el final.

./acceder-al-curso-completo curso gratuito: Ingeniería de prompts

FAQ

¿Cuánto tiempo se necesita para aprender Fine Tuning LLMs?
Con una progresión estructurada (11 capítulos, 37 lecciones cortas y prácticas), se alcanza un nivel operativo en unas semanas dedicando entre 30 y 60 minutos al día. Lo importante es practicar cada concepto de inmediato.
¿Se necesitan requisitos previos?
Con nociones básicas de informática basta. Si sabes usar una terminal y leer código sencillo, estás listo.
¿Por dónde empezar en la práctica?
Reproduce los comandos de este artículo y luego sigue el curso completo Fine Tuning LLMs: encadena las 37 lecciones en orden, con ejercicios y proyecto final.

📬 ¿Quieres recibir este tipo de guía cada semana? Suscríbete gratis — código real, cero palabrería.