Introducción a LLMs y SLMs explicada simplemente (con diagramas y código real)

Introducción LLMs SLMs: lo esencial en un artículo — código real, diagramas y pasos concretos, extractos de un curso de 44 lecciones.

Introducción a LLMs y SLMs explicada simplemente (con diagramas y código real)

Una guía que va al grano: Introduction LLMs SLMs analizada con diagramas, ejemplos concretos y comandos probados. Todo proviene de un curso estructurado de 11 capítulos —aquí tienes lo mejor.

tl;dr
  • Introducción e Instalación
  • Cómo funciona un LLM
  • Arquitectura Transformer
  • Panorama de los LLMs en 2026
  • Los SLMs Small Language Models
~$ cat ./parcours.md # Introduction LLMs SLMs — 10 capítulos
01
Introducción e Instalación
→ Presentación del curso y breve historia de los LLMs→ Instalar Ollama y lanzar su primer modelo+ 1 más lecciones
02
Cómo Funciona un LLM
→ Tokens : cómo el modelo ve el texto→ Ventana de contexto (context window)+ 2 más lecciones
03
Arquitectura Transformer
→ El paper "Attention is All You Need" explicado→ Encoder vs Decoder vs Encoder-Decoder+ 2 más lecciones
04
Panorama de los LLMs en 2026
→ LLMs propietarios : OpenAI, Anthropic, Google→ Modelos open-weights : Llama, Mistral, Qwen, Gemma+ 2 más lecciones
05
Los SLMs Small Language Models
→ SLM vs LLM : definición y umbral→ Panorama : Phi-3, Gemma, TinyLlama, Qwen-small+ 2 más lecciones
06
Inferencia Local Con Ollama
→ Comandos Ollama esenciales→ Cuantización : Q4, Q5, Q8 explicadas+ 2 más lecciones
07
Hugging Face Transformers
→ Instalación y primer pipeline→ AutoModel y AutoTokenizer+ 2 más lecciones
08
Elegir el Modelo Correcto
→ Criterios : costo, latencia, privacidad, calidad→ Matriz de decisión LLM cloud / open / SLM+ 1 más lecciones
🏁
Proyecto final (+ 2 capítulos en camino)
→ Te vas con un proyecto concreto y demostrable

Instalar Ollama y ejecutar tu primer modelo

NOTEObjetivo — Instalar Ollama en Windows, macOS o Linux, descargar tu primer modelo y mantener una conversación completa con un LLM que se ejecuta totalmente en local en tu máquina, sin ninguna conexión a Internet después de la descarga inicial.

Objetivos pedagógicos

TIPAl finalizar este módulo
  • Instalar Ollama en tu sistema operativo
  • Verificar que el servicio funciona correctamente
  • Descargar un modelo desde la biblioteca de Ollama
  • Iniciar una conversación con un modelo local
  • Comprender dónde se almacenan los modelos en tu máquina
  • Conocer los comandos básicos de Ollama

¿Por qué Ollama?

Ollama es una herramienta de código abierto que simplifica radicalmente el uso de LLMs en local. Donde antes era necesario gestionar manualmente la cuantización, los bindings de GPU y las dependencias de Python, Ollama te ofrece un único binario y un comando tan simple como ollama run llama3. En 2026 se ha convertido en la referencia para ejecutar un LLM en tu portátil.

Simplicidad

Un solo comando para descargar y ejecutar un modelo. Sin configuración manual de GPU.

Multiplataforma

Windows, macOS (Apple Silicon) y Linux. Optimizado automáticamente para CPU y GPU.

API REST integrada

Ollama expone una API local en http://localhost:11434 para integrarla en tus aplicaciones.

Instalación paso a paso

Visita https://ollama.com/download y elige tu sistema. La instalación tarda menos de dos minutos.

Windows

TIPConsejo: escribe /bye para salir de la conversación y /? para ver todos los comandos disponibles en el modo interactivo de Ollama.

¿Dónde se almacenan los modelos?

Los modelos pueden ocupar mucho espacio. Saber dónde se guardan te evita sorpresas desagradables de almacenamiento.

SOUbicación por defecto
WindowsC:\Users\<tu-nombre>\.ollama\models
macOS~/.ollama/models
Linux/usr/share/ollama/.ollama/models

Para cambiar esta ubicación (por ejemplo, a un disco externo), define la variable de entorno OLLAMA_MODELS antes de iniciar el servicio.

API de Ollama e integración con Python

NOTEObjetivo — Descubrir la API local de Ollama y llamarla desde Python, para integrar un LLM local en tus propios scripts y aplicaciones.

Objetivos pedagógicos

TIPAl finalizar este módulo
  • Comprender que Ollama expone una API HTTP local
  • Llamar a la API con curl y desde Python
  • Usar la biblioteca oficial de Python
  • Pasar un system prompt y opciones
  • Integrar un LLM local en una aplicación

Ollama también es un servidor

Además de la línea de comandos, Ollama se ejecuta en segundo plano como un servidor HTTP local, accesible en http://localhost:11434. Todo lo que hace la CLI, puedes hacerlo mediante una petición HTTP, por lo tanto desde cualquier lenguaje.

El puente hacia el código

Del chat en la terminal a la API de Python, ahora sabes integrar un LLM local en cualquier programa.

Instalación y primer pipeline

NOTEObjetivo — Instalar la biblioteca Transformers de Hugging Face y realizar tu primera inferencia en Python con la abstracción más simple: el pipeline.

Objetivos pedagógicos

TIPAl finalizar este módulo
  • Instalar Transformers y sus dependencias
  • Comprender qué es un pipeline
  • Ejecutar un análisis de sentimiento en 3 líneas
  • Conocer las tareas disponibles
  • Cargar un modelo concreto en un pipeline

Hugging Face: el GitHub de los modelos

Hugging Face proporciona la biblioteca Transformers, que se ha convertido en el estándar para usar modelos de código abierto en Python. Ofrece acceso a cientos de miles de modelos a través de una interfaz uniforme.

Tareas listas para usar

Tarea (cadena)Qué hace
sentiment-analysisDetermina si un texto es positivo o negativo.
text-generationCompleta o genera texto.
summarizationResume un texto largo.
translationTraduce de un idioma a otro.
question-answeringResponde a una pregunta a partir de un contexto proporcionado.
zero-shot-classificationClasifica un texto en las categorías que definas.

Elegir un modelo concreto

Para el francés o una necesidad específica, indica explícitamente el modelo (su identificador de Hugging Face).

WARNINGAtención: Los pipelines de generación por defecto usan modelos pequeños y antiguos (como GPT-2). No juzgues la calidad de los LLMs modernos por ellos: son herramientas pedagógicas, no modelos de producción.
va-plus-loin

Este artículo cubre los extractos más útiles —el curso completo Introduction LLMs SLMs (11 capítulos, 44 lecciones, ejercicios resueltos y proyecto final) te lleva hasta el final.

./acceder-al-curso-completo curso gratuito: Ingeniería de prompts

FAQ

¿Cuánto tiempo se necesita para aprender Introduction LLMs SLMs?
Con una progresión estructurada (11 capítulos, 44 lecciones cortas y prácticas), se alcanza un nivel operativo en unas pocas semanas dedicando entre 30 y 60 minutos al día. Lo importante es practicar cada concepto de inmediato.
¿Se necesitan requisitos previos?
Ningún requisito previo: el curso parte de cero y cada concepto se introduce antes de utilizarlo.
¿Por dónde empezar concretamente?
Reproduce los comandos de este artículo y sigue el curso completo Introduction LLMs SLMs: encadena las 44 lecciones en orden, con ejercicios y proyecto final.

📬 ¿Quieres recibir este tipo de guía cada semana? Suscríbete gratis — código real, cero rodeos.