IA & LLM

Introducción a LLMs y SLMs explicada simplemente (con diagramas y código real)

Introducción LLMs SLMs: lo esencial en un artículo — código real, diagramas y pasos concretos, extractos de un curso de 44 lecciones.

REHOUMA Haythem

12 Jun 2026 • 10 min read

Una guía que va al grano: Introduction LLMs SLMs analizada con diagramas, ejemplos concretos y comandos probados. Todo proviene de un curso estructurado de 11 capítulos —aquí tienes lo mejor.

tl;dr

Introducción e Instalación
Cómo funciona un LLM
Arquitectura Transformer
Panorama de los LLMs en 2026
Los SLMs Small Language Models

~$ cat ./parcours.md # Introduction LLMs SLMs — 10 capítulos

Introducción e Instalación

→ Presentación del curso y breve historia de los LLMs→ Instalar Ollama y lanzar su primer modelo+ 1 más lecciones

Cómo Funciona un LLM

→ Tokens : cómo el modelo ve el texto→ Ventana de contexto (context window)+ 2 más lecciones

Arquitectura Transformer

→ El paper "Attention is All You Need" explicado→ Encoder vs Decoder vs Encoder-Decoder+ 2 más lecciones

Panorama de los LLMs en 2026

→ LLMs propietarios : OpenAI, Anthropic, Google→ Modelos open-weights : Llama, Mistral, Qwen, Gemma+ 2 más lecciones

Los SLMs Small Language Models

→ SLM vs LLM : definición y umbral→ Panorama : Phi-3, Gemma, TinyLlama, Qwen-small+ 2 más lecciones

Inferencia Local Con Ollama

→ Comandos Ollama esenciales→ Cuantización : Q4, Q5, Q8 explicadas+ 2 más lecciones

Hugging Face Transformers

→ Instalación y primer pipeline→ AutoModel y AutoTokenizer+ 2 más lecciones

Elegir el Modelo Correcto

→ Criterios : costo, latencia, privacidad, calidad→ Matriz de decisión LLM cloud / open / SLM+ 1 más lecciones

🏁

Proyecto final (+ 2 capítulos en camino)

→ Te vas con un proyecto concreto y demostrable

Instalar Ollama y ejecutar tu primer modelo

NOTEObjetivo — Instalar Ollama en Windows, macOS o Linux, descargar tu primer modelo y mantener una conversación completa con un LLM que se ejecuta totalmente en local en tu máquina, sin ninguna conexión a Internet después de la descarga inicial.

Objetivos pedagógicos

TIPAl finalizar este módulo

Instalar Ollama en tu sistema operativo
Verificar que el servicio funciona correctamente
Descargar un modelo desde la biblioteca de Ollama
Iniciar una conversación con un modelo local
Comprender dónde se almacenan los modelos en tu máquina
Conocer los comandos básicos de Ollama

¿Por qué Ollama?

Ollama es una herramienta de código abierto que simplifica radicalmente el uso de LLMs en local. Donde antes era necesario gestionar manualmente la cuantización, los bindings de GPU y las dependencias de Python, Ollama te ofrece un único binario y un comando tan simple como ollama run llama3. En 2026 se ha convertido en la referencia para ejecutar un LLM en tu portátil.

Simplicidad

Un solo comando para descargar y ejecutar un modelo. Sin configuración manual de GPU.

Multiplataforma

Windows, macOS (Apple Silicon) y Linux. Optimizado automáticamente para CPU y GPU.

API REST integrada

Ollama expone una API local en http://localhost:11434 para integrarla en tus aplicaciones.

Instalación paso a paso

Visita https://ollama.com/download y elige tu sistema. La instalación tarda menos de dos minutos.

Windows

TIPConsejo: escribe /bye para salir de la conversación y /? para ver todos los comandos disponibles en el modo interactivo de Ollama.

¿Dónde se almacenan los modelos?

Los modelos pueden ocupar mucho espacio. Saber dónde se guardan te evita sorpresas desagradables de almacenamiento.

SO	Ubicación por defecto
Windows	`C:\Users\<tu-nombre>\.ollama\models`
macOS	`~/.ollama/models`
Linux	`/usr/share/ollama/.ollama/models`

Para cambiar esta ubicación (por ejemplo, a un disco externo), define la variable de entorno OLLAMA_MODELS antes de iniciar el servicio.

API de Ollama e integración con Python

NOTEObjetivo — Descubrir la API local de Ollama y llamarla desde Python, para integrar un LLM local en tus propios scripts y aplicaciones.

Objetivos pedagógicos

TIPAl finalizar este módulo

Comprender que Ollama expone una API HTTP local
Llamar a la API con curl y desde Python
Usar la biblioteca oficial de Python
Pasar un system prompt y opciones
Integrar un LLM local en una aplicación

Ollama también es un servidor

Además de la línea de comandos, Ollama se ejecuta en segundo plano como un servidor HTTP local, accesible en http://localhost:11434. Todo lo que hace la CLI, puedes hacerlo mediante una petición HTTP, por lo tanto desde cualquier lenguaje.

El puente hacia el código

Del chat en la terminal a la API de Python, ahora sabes integrar un LLM local en cualquier programa.

Instalación y primer pipeline

NOTEObjetivo — Instalar la biblioteca Transformers de Hugging Face y realizar tu primera inferencia en Python con la abstracción más simple: el pipeline.

Objetivos pedagógicos

TIPAl finalizar este módulo

Instalar Transformers y sus dependencias
Comprender qué es un pipeline
Ejecutar un análisis de sentimiento en 3 líneas
Conocer las tareas disponibles
Cargar un modelo concreto en un pipeline

Hugging Face: el GitHub de los modelos

Hugging Face proporciona la biblioteca Transformers, que se ha convertido en el estándar para usar modelos de código abierto en Python. Ofrece acceso a cientos de miles de modelos a través de una interfaz uniforme.

Tareas listas para usar

Tarea (cadena)	Qué hace
`sentiment-analysis`	Determina si un texto es positivo o negativo.
`text-generation`	Completa o genera texto.
`summarization`	Resume un texto largo.
`translation`	Traduce de un idioma a otro.
`question-answering`	Responde a una pregunta a partir de un contexto proporcionado.
`zero-shot-classification`	Clasifica un texto en las categorías que definas.

Elegir un modelo concreto

Para el francés o una necesidad específica, indica explícitamente el modelo (su identificador de Hugging Face).

WARNINGAtención: Los pipelines de generación por defecto usan modelos pequeños y antiguos (como GPT-2). No juzgues la calidad de los LLMs modernos por ellos: son herramientas pedagógicas, no modelos de producción.

va-plus-loin

Este artículo cubre los extractos más útiles —el curso completo Introduction LLMs SLMs (11 capítulos, 44 lecciones, ejercicios resueltos y proyecto final) te lleva hasta el final.

./acceder-al-curso-completo curso gratuito: Ingeniería de prompts

FAQ

¿Cuánto tiempo se necesita para aprender Introduction LLMs SLMs?

Con una progresión estructurada (11 capítulos, 44 lecciones cortas y prácticas), se alcanza un nivel operativo en unas pocas semanas dedicando entre 30 y 60 minutos al día. Lo importante es practicar cada concepto de inmediato.

¿Se necesitan requisitos previos?

Ningún requisito previo: el curso parte de cero y cada concepto se introduce antes de utilizarlo.

¿Por dónde empezar concretamente?

Reproduce los comandos de este artículo y sigue el curso completo Introduction LLMs SLMs: encadena las 44 lecciones en orden, con ejercicios y proyecto final.

./a-lire-aussi

→ Prompts de IA eficaces: los 9 pasos clave para pasar de cero a operativo → Lánzate a la Ingeniería de Prompts Avanzada: tu primer paso concreto hoy → Fine Tuning de LLMs explicado de forma sencilla (con diagramas y código real)

📬 ¿Quieres recibir este tipo de guía cada semana? Suscríbete gratis — código real, cero rodeos.

Instalar Ollama y ejecutar tu primer modelo

Objetivos pedagógicos

¿Por qué Ollama?

Simplicidad

Multiplataforma

API REST integrada

Instalación paso a paso

Windows

¿Dónde se almacenan los modelos?

API de Ollama e integración con Python

Objetivos pedagógicos

Ollama también es un servidor

El puente hacia el código

Instalación y primer pipeline

Objetivos pedagógicos

Hugging Face: el GitHub de los modelos

Tareas listas para usar

Elegir un modelo concreto

FAQ

Stay up to date