Deep Learning

Définition complète

Le deep learning est l'approche du ML qui a tout fait basculer entre 2012 et aujourd'hui. Avant, on programmait des règles : pour reconnaître un chat dans une image, on cherchait "4 pattes + queue + oreilles pointues". Avec le deep learning, on montre 100 000 images étiquetées et le réseau apprend lui-même les patterns visuels.

Le "deep" vient du nombre de couches : un réseau profond a 10, 100, voire 1000 couches successives. Chaque couche apprend une représentation de plus en plus abstraite : les premières couches détectent des contours, les suivantes des formes, puis des parties d'objets, puis des objets entiers.

Moments clés : - 2012 : AlexNet écrase la concurrence sur le benchmark ImageNet (reconnaissance d'images) - 2015 : DeepMind bat le champion de Go avec AlphaGo - 2017 : architecture transformer (papier Attention Is All You Need) - 2020-2022 : explosion des LLMs (GPT-3, ChatGPT) - 2024-2026 : modèles multimodaux capables de raisonner sur texte + image + audio + vidéo

Le deep learning nécessite trois ingrédients : beaucoup de données, beaucoup de puissance de calcul (GPU/TPU), et une bonne architecture. Le coût d'entraînement d'un grand modèle est de l'ordre de plusieurs dizaines à centaines de millions de dollars.

Définition complète

Tu veux maîtriser Deep Learning en pratique ?

Termes liés