Deep Learning
Sous-catégorie du machine learning utilisant des réseaux de neurones à plusieurs couches.
Définition complète
Le deep learning est l'approche du ML qui a tout fait basculer entre 2012 et aujourd'hui. Avant, on programmait des règles : pour reconnaître un chat dans une image, on cherchait "4 pattes + queue + oreilles pointues". Avec le deep learning, on montre 100 000 images étiquetées et le réseau apprend lui-même les patterns visuels.
Le "deep" vient du nombre de couches : un réseau profond a 10, 100, voire 1000 couches successives. Chaque couche apprend une représentation de plus en plus abstraite : les premières couches détectent des contours, les suivantes des formes, puis des parties d'objets, puis des objets entiers.
Moments clés : - 2012 : AlexNet écrase la concurrence sur le benchmark ImageNet (reconnaissance d'images) - 2015 : DeepMind bat le champion de Go avec AlphaGo - 2017 : architecture transformer (papier Attention Is All You Need) - 2020-2022 : explosion des LLMs (GPT-3, ChatGPT) - 2024-2026 : modèles multimodaux capables de raisonner sur texte + image + audio + vidéo
Le deep learning nécessite trois ingrédients : beaucoup de données, beaucoup de puissance de calcul (GPU/TPU), et une bonne architecture. Le coût d'entraînement d'un grand modèle est de l'ordre de plusieurs dizaines à centaines de millions de dollars.
Approfondir
Tu veux maîtriser Deep Learning en pratique ?
Le module "L'IA démystifiée — le socle" couvre deep learning en profondeur, avec démonstrations interactives et exercices.
Découvrir le module →Termes liés
Approche de l'IA où le système apprend à partir d'exemples plutôt que de règles explicites.
Architecture computationnelle inspirée du cerveau, composée de neurones artificiels en couches.
Architecture de réseau de neurones qui a révolutionné le traitement du langage en 2017.
Large Language Model — modèle de deep learning entraîné sur d'immenses corpus de texte.