Introduction LLMs SLMs expliqué simplement (avec schémas et vrai code)
Introduction LLMs SLMs : l'essentiel en un article — vrai code, schémas et étapes concrètes, extraits d'un cours de 44 leçons.
Un guide qui va droit au but : Introduction LLMs SLMs décortiqué avec des schémas, des exemples concrets et des commandes testées. Tout vient d'un cours structuré de 11 chapitres — en voici le meilleur.
- Introduction et Installation
- Comment Fonctionne un LLM
- Architecture Transformer
- Panorama des LLMs en 2026
- Les SLMs Small Language Models
Installer Ollama et lancer son premier modèle
Objectifs pédagogiques
- Installer Ollama sur votre système d'exploitation
- Vérifier que le service tourne correctement
- Télécharger un modèle depuis la bibliothèque Ollama
- Lancer une conversation avec un modèle local
- Comprendre où sont stockés les modèles sur votre machine
- Connaître les commandes Ollama de base
Pourquoi Ollama ?
Ollama est un outil open-source qui simplifie radicalement l'usage des LLMs en local. Là où il fallait auparavant gérer manuellement la quantisation, les bindings GPU et les dépendances Python, Ollama vous donne un binaire unique et une commande aussi simple que ollama run llama3. C'est devenu en 2026 la référence pour faire tourner un LLM sur son laptop.
Simplicité
Une seule commande pour télécharger et lancer un modèle. Pas de configuration GPU manuelle.
Multi-plateforme
Windows, macOS (Apple Silicon) et Linux. Optimisé pour CPU et GPU automatiquement.
API REST intégrée
Ollama expose une API locale sur http://localhost:11434 pour intégrer dans vos apps.
Installation pas à pas
Rendez-vous sur https://ollama.com/download et choisissez votre système. L'installation prend moins de deux minutes.
Windows
/bye pour quitter la conversation et /? pour voir toutes les commandes disponibles dans le mode interactif d'Ollama.Où sont stockés les modèles ?
Les modèles peuvent être volumineux. Savoir où ils vivent vous évite de mauvaises surprises de stockage.
| OS | Emplacement par défaut |
|---|---|
| Windows | C:\Users\<votre-nom>\.ollama\models |
| macOS | ~/.ollama/models |
| Linux | /usr/share/ollama/.ollama/models |
Pour changer cet emplacement (vers un disque externe par exemple), définissez la variable d'environnement OLLAMA_MODELS avant de lancer le service.
API Ollama et intégration Python
Objectifs pédagogiques
- Comprendre qu'Ollama expose une API HTTP locale
- Appeler l'API avec
curlet en Python - Utiliser la bibliothèque Python officielle
- Passer un system prompt et des options
- Intégrer un LLM local dans une application
Ollama est aussi un serveur
En plus de la ligne de commande, Ollama tourne en arrière-plan comme un serveur HTTP local, accessible sur http://localhost:11434. Tout ce que fait la CLI, vous pouvez le faire par requête HTTP, donc depuis n'importe quel langage.
Le pont vers le code
Du chat dans le terminal à l'API Python, vous savez maintenant intégrer un LLM local dans n'importe quel programme.
Installation et premier pipeline
pipeline.Objectifs pédagogiques
- Installer Transformers et ses dépendances
- Comprendre ce qu'est un pipeline
- Lancer une analyse de sentiment en 3 lignes
- Connaître les tâches disponibles
- Charger un modèle précis dans un pipeline
Hugging Face : le GitHub des modèles
Hugging Face fournit la bibliothèque Transformers, devenue le standard pour utiliser des modèles open-source en Python. Elle donne accès à des centaines de milliers de modèles via une interface uniforme.
Des tâches prêtes à l'emploi
| Tâche (chaîne) | Ce que ça fait |
|---|---|
sentiment-analysis | Détermine si un texte est positif ou négatif. |
text-generation | Complète ou génère du texte. |
summarization | Résume un texte long. |
translation | Traduit d'une langue à une autre. |
question-answering | Répond à une question à partir d'un contexte fourni. |
zero-shot-classification | Classe un texte dans des catégories que vous définissez. |
Choisir un modèle précis
Pour le français ou un besoin spécifique, indiquez explicitement le modèle (son identifiant Hugging Face).
Cet article couvre les extraits les plus utiles — le cours complet Introduction LLMs SLMs (11 chapitres, 44 leçons, exercices corrigés et projet final) t'emmène jusqu'au bout.
./acceder-au-cours-complet cours gratuit : Ingénierie de promptsFAQ
Combien de temps pour apprendre Introduction LLMs SLMs ?
Faut-il des prérequis ?
Par où commencer concrètement ?
📬 Tu veux recevoir ce type de guide chaque semaine ? Abonne-toi gratuitement — code réel, zéro blabla.