LLM
Large Language Model — modèle de deep learning entraîné sur d'immenses corpus de texte.
Définition complète
Un LLM (Large Language Model) est la technologie derrière ChatGPT, Claude, Gemini, Mistral. C'est un modèle de deep learning entraîné sur des centaines de milliards de mots issus d'internet, de livres, d'articles scientifiques, de conversations.
Le principe de base est trompeusement simple : le modèle apprend à prédire le token suivant. "La capitale de la France est…" → il a vu cette phrase des millions de fois → il prédit "Paris" avec une probabilité énorme. "Le code Python pour additionner deux nombres :" → il prédit `def add(a, b): return a + b`. Tout, absolument tout, repose sur la prédiction du prochain token.
Ce qui rend les LLMs modernes si impressionnants, c'est que cette prédiction se fait en s'appuyant sur tout le contexte (pas juste les derniers mots). Et que l'échelle (paramètres × données × calcul) leur a donné des capacités émergentes que personne n'avait prédites : raisonnement mathématique, programmation, traduction, créativité.
État de l'art en 2026 : - **GPT-5** (OpenAI) : généraliste, raisonnement amélioré - **Claude 4.6 Opus** (Anthropic) : excellent en rédaction longue, code, raisonnement - **Gemini 2.5 Pro** (Google) : multimodal natif, contexte 2M tokens - **Llama 4** (Meta, open-source) : rivalise avec les frontières propriétaires - **Mistral Large 3** (Mistral AI, FR) : open-weight, souverain européen
Les LLMs ont aussi des limites importantes : hallucinations, manque de connaissances post-entraînement, raisonnement parfois fragile, biais hérités des données. Comprendre ces limites est aussi important que savoir s'en servir.
Exemples concrets
- ChatGPT, Claude, Gemini sont des interfaces grand public construites autour d'un LLM
- Un LLM ne sait rien faire d'autre que prédire le prochain token — toute la richesse vient de cette tâche unique
- Coût : un appel à GPT-5 sur 1000 tokens coûte environ 0,01€ en 2026
Approfondir
Tu veux maîtriser LLM en pratique ?
Le module "L'IA démystifiée — le socle" couvre llm en profondeur, avec démonstrations interactives et exercices.
Découvrir le module →Termes liés
Architecture de réseau de neurones qui a révolutionné le traitement du langage en 2017.
Mécanisme central des transformers qui permet au modèle de pondérer l'importance de chaque mot du contexte.
Unité de base du traitement textuel dans les LLMs — un mot, une partie de mot, ou un signe.
Phénomène où un LLM génère des informations fausses présentées avec confiance.