LLM

Définition complète

Un LLM (Large Language Model) est la technologie derrière ChatGPT, Claude, Gemini, Mistral. C'est un modèle de deep learning entraîné sur des centaines de milliards de mots issus d'internet, de livres, d'articles scientifiques, de conversations.

Le principe de base est trompeusement simple : le modèle apprend à prédire le token suivant. "La capitale de la France est…" → il a vu cette phrase des millions de fois → il prédit "Paris" avec une probabilité énorme. "Le code Python pour additionner deux nombres :" → il prédit `def add(a, b): return a + b`. Tout, absolument tout, repose sur la prédiction du prochain token.

Ce qui rend les LLMs modernes si impressionnants, c'est que cette prédiction se fait en s'appuyant sur tout le contexte (pas juste les derniers mots). Et que l'échelle (paramètres × données × calcul) leur a donné des capacités émergentes que personne n'avait prédites : raisonnement mathématique, programmation, traduction, créativité.

État de l'art en 2026 : - **GPT-5** (OpenAI) : généraliste, raisonnement amélioré - **Claude 4.6 Opus** (Anthropic) : excellent en rédaction longue, code, raisonnement - **Gemini 2.5 Pro** (Google) : multimodal natif, contexte 2M tokens - **Llama 4** (Meta, open-source) : rivalise avec les frontières propriétaires - **Mistral Large 3** (Mistral AI, FR) : open-weight, souverain européen

Les LLMs ont aussi des limites importantes : hallucinations, manque de connaissances post-entraînement, raisonnement parfois fragile, biais hérités des données. Comprendre ces limites est aussi important que savoir s'en servir.

Définition complète

Exemples concrets

Tu veux maîtriser LLM en pratique ?

Termes liés