IA & LLM

Fine-Tuning de LLMs explicado de forma sencilla (con diagramas y código real)

Fine Tuning LLMs: lo esencial en un artículo — código real, diagramas y pasos concretos, extractos de un curso de 37 lecciones.

REHOUMA Haythem

12 Jun 2026 • 10 min read

Una guía que va al grano: Fine Tuning LLMs desglosada con diagramas, ejemplos concretos y comandos probados. Todo proviene de un curso estructurado de 11 capítulos — aquí lo mejor.

tl;dr

Introducción e Instalación
Fundamentos de los LLMs
Preparación de los Datos
Fine-Tuning Completo
LoRA y QLoRA PEFT

~$ cat ./parcours.md # Fine Tuning LLMs — 9 capítulos

Introducción e Instalación

→ Presentación del curso y por qué fine-tuner ?→ Instalar Python, PyTorch y Hugging Face+ 1 más lecciones

Fundamentos de los LLMs

→ Arquitectura Transformer en breve→ Pre-entrenamiento, SFT, RLHF, DPO+ 2 más lecciones

Preparación de los Datos

→ Recopilación y limpieza de datos→ Formatos Alpaca, ChatML, ShareGPT, JSONL+ 2 más lecciones

Fine-Tuning Completo

→ Conceptos del full fine-tuning→ Hugging Face Trainer y TrainingArguments+ 2 más lecciones

LoRA y QLoRA PEFT

→ Principio de LoRA low-rank adaptation→ QLoRA cuantización 4-bit y NF4+ 2 más leçons

Entrenamiento e Hiperparámetros

→ Learning rate, batch size y épocas→ Schedulers cosine, linear, warmup+ 2 más leçons

Alineamiento Avanzado DPO RLHF

→ DPO Direct Preference Optimization→ ORPO y KTO alternativas modernas+ 1 más leçons

Despliegue e Inferencia

→ Cuantización GGUF con llama.cpp→ Servir con vLLM o TGI (alto rendimiento)+ 1 más leçons

🏁

Proyecto final (+ 1 capítulos en camino)

→ Te vas con un proyecto concreto y demostrable

Ollama e integración local

NOTEObjetivo — Desplegar tu modelo fine-tuneado mediante Ollama, la herramienta más sencilla para ejecutar un LLM localmente (macOS, Windows, Linux) con una API REST en 30 segundos.

Objetivos pedagógicos

TIPAl finalizar este módulo

Instalar Ollama y ejecutar un modelo preexistente
Importar tu modelo GGUF personalizado mediante un Modelfile
Usar la API REST de Ollama desde cualquier lenguaje
Integrar Ollama en una app Python / Node / Rust
Optimizar para el hardware (CPU, M2, RTX)

Instalar Ollama

Ejecutar un modelo existente

API nativa

Hardware	Modelo	Tokens/seg
M2 16 GB	Mistral 7B Q4_K_M	40
M3 Max 64 GB	Mistral 7B Q4_K_M	80
M3 Max 64 GB	Llama 3 70B Q4_K_M	10
RTX 4090 24 GB	Mistral 7B Q4_K_M	100+
RTX 3060 12 GB	Mistral 7B Q4_K_M	35

Casos de uso de Ollama en producción

POC interno

Hacer que los equipos de negocio descubran el modelo sin infraestructura en la nube.

App de escritorio

Incluida en Tauri / Electron / Swift app para análisis local.

Edge / on-prem

Datos sensibles que no deben salir de la red interna.

Limitaciones de Ollama

Subir tu modelo a ollama.com

Puedes compartir tu modelo personalizado en el registro público de Ollama:

Formatos Alpaca, ChatML, ShareGPT, JSONL

NOTEObjetivo — Conocer los formatos estándar de datasets para el fine-tuning de LLMs y saber convertirlos entre sí. Comprender la importancia de la plantilla de chat específica de cada modelo.

Objetivos pedagógicos

TIPAl finalizar este módulo

Identificar los 4 formatos más usados en 2026
Convertir un dataset entre Alpaca, ChatML y ShareGPT
Aplicar la plantilla de chat correcta según el modelo objetivo
Guardar tu dataset en JSONL streamable
Detectar errores de formato antes del entrenamiento

Formato 1: Alpaca (el más sencillo)

Proveniente del proyecto Stanford Alpaca (2023). Tres campos: instruction, input (opcional) y output.

Convertir entre formatos

Alpaca → ChatML

Hugging Face lo gestiona automáticamente mediante tokenizer.apply_chat_template(). Nunca debes escribir estas plantillas a mano.

Instalar Python, PyTorch y Hugging Face

NOTEObjetivo — Configurar un entorno Python limpio para el fine-tuning: Python 3.11, PyTorch con CUDA y toda la pila de Hugging Face (Transformers, PEFT, Datasets, TRL).

Objetivos pedagógicos

TIPAl finalizar este módulo

Instalar Python 3.11 y un entorno virtual dedicado
Elegir e instalar la versión correcta de PyTorch (CPU vs CUDA)
Instalar la pila completa de Hugging Face con versiones compatibles
Verificar que PyTorch detecta correctamente la GPU
Crear tu cuenta de Hugging Face y configurar tu token

Requisitos del sistema

Componente	Recomendado	Mínimo
Python	3.11	3.10
RAM	32 GB	16 GB
GPU NVIDIA	RTX 4090 (24 GB)	RTX 3060 (12 GB) o Colab T4
Espacio en disco	200 GB SSD	50 GB
CUDA Toolkit	12.1	11.8

WARNINGAtención Python 3.12: En 2026, algunas dependencias (en especial bitsandbytes en Windows) todavía no admiten perfectamente Python 3.12. Quédate en 3.11 para este curso.

Paso 1: Instalar Python 3.11 y un entorno virtual

Crea una carpeta de trabajo y luego un entorno virtual dedicado al curso. Esto evita cualquier conflicto con otros proyectos de Python.

GPU NVIDIA con CUDA 12.1

peft

Parameter-Efficient Fine-Tuning. Imprescindible para LoRA y QLoRA.

bitsandbytes

Cuantización de 8 bits y 4 bits. Permite QLoRA. Debe coincidir con tu versión de CUDA.

Paso 4: Crear una cuenta y un token de Hugging Face

va-plus-loin

Este artículo cubre los extractos más útiles — el curso completo Fine Tuning LLMs (11 capítulos, 37 lecciones, ejercicios resueltos y proyecto final) te lleva hasta el final.

./acceder-al-curso-completo curso gratuito: Ingeniería de prompts

FAQ

¿Cuánto tiempo se necesita para aprender Fine Tuning LLMs?

Con una progresión estructurada (11 capítulos, 37 lecciones cortas y prácticas), se alcanza un nivel operativo en unas semanas dedicando entre 30 y 60 minutos al día. Lo importante es practicar cada concepto de inmediato.

¿Se necesitan requisitos previos?

Con nociones básicas de informática basta. Si sabes usar una terminal y leer código sencillo, estás listo.

¿Por dónde empezar en la práctica?

Reproduce los comandos de este artículo y luego sigue el curso completo Fine Tuning LLMs: encadena las 37 lecciones en orden, con ejercicios y proyecto final.

./a-lire-aussi

→ Prompts de IA eficaces: los 9 pasos clave para pasar de cero a operativo → Lánzate a la Ingeniería de Prompts Avanzada: tu primer paso concreto hoy → Asistentes de IA personalizados en la práctica: el código y los comandos que realmente importan

📬 ¿Quieres recibir este tipo de guía cada semana? Suscríbete gratis — código real, cero palabrería.

Ollama e integración local

Objetivos pedagógicos

Instalar Ollama

Ejecutar un modelo existente

API nativa

Casos de uso de Ollama en producción

POC interno

App de escritorio

Edge / on-prem

Limitaciones de Ollama

Subir tu modelo a ollama.com

Formatos Alpaca, ChatML, ShareGPT, JSONL

Objetivos pedagógicos

Formato 1: Alpaca (el más sencillo)

Convertir entre formatos

Alpaca → ChatML

Instalar Python, PyTorch y Hugging Face

Objetivos pedagógicos

Requisitos del sistema

Paso 1: Instalar Python 3.11 y un entorno virtual

GPU NVIDIA con CUDA 12.1

peft

bitsandbytes

Paso 4: Crear una cuenta y un token de Hugging Face

FAQ

Stay up to date