toute personne intéressée par le Deep Learning et les réseaux de neurones : Ingénieurs, Analystes, Data Scientists, Data Analysts, Data Steward, Développeurs...
Comprendre les apports du deep learning et de l'IA, les principes de fonctionnement et les différents outils disponibles.
avoir une culture informatique générale.
|
| Fondements et positionnement de l'intelligence artificielle |
Durée : 3h Méthodes pédagogiques : alternance de théorie et de travaux pratiques Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux | Définitions et positionnement : IA, apprentissage profond (Deep Learning) et apprentissage automatique. Les apports du deep learning, état de l'art. Outils disponibles. Exemples de projets concrets. Exemples, domaines d'application. Présentation de deepmind Outils DeepLearning de haut niveau : Keras/TensorFlow, Caffe/PyTorch.Atelier : Mise en oeuvre sur cloud AutoML : traitement du langage naturel, traduction, reconnaissance d'images, ...
|
|
| Convergence des réseaux de neurones |
Durée : 3h Méthodes pédagogiques : alternance de théorie et de travaux pratiques Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux | Comprendre la rétropropagation de l'erreur et la convergence. Maîtriser la descente de gradient. Les fonctions d'erreur : MSE (erreur quadratique moyenne), entropie croisée binaire, et les optimiseurs SGD (descente de gradient stochastique), RMSprop, Adam. Définitions : couche, epochs, batch size, itérations, loss, learning rate, momentum. Optimiser un entraînement par découpage d'entraînements progressifs. Comprendre le principe des hyperparamètres. Choix des hyperparamètres.Atelier : construire un réseau capable de reconnaître une courbe.
|
|
| Connaitre les briques de base du Deep Learning : réseaux de neurones simples, convolutifs et récursifs |
Durée : 4h30 Méthodes pédagogiques : alternance de théorie et de travaux pratiques Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux | Les réseaux de neurones : principe, différents types de réseaux de neurones (artificiels, convolutifs, récurrents, ...) Les différentes formes de réseaux : MultiLayer Perceptron FNN/MLP, CNN. Couches d'entrée, de sortie, de calcul. Fonctionnement d'une couche de convolution. Définitions : kernel, padding, stride. Fonctionnement d'une couche de Pooling. APIs standard, modèles d'apprentissage Apprendre à lire une courbe d'apprentissage.Atelier : Comparaison de courbes d'apprentissage avec TensorFlow sur plusieurs paramètres.
Les modèles de DeepLearning pour Keras : Xception, Inception, ResNet, VGG, LeNet.Atelier : Construction d'un réseau de neurones de reconnaissance d'images
|
|
| Modèles avancés : auto-encodeurs, réseaux antagonistes génératifs (gans), apprentissage par renforcement |
Durée : 3h Méthodes pédagogiques : alternance de théorie et de travaux pratiques Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux | Représentations des données. Bruits. Couches d'encodage : codage entier, One-hot, embedding layer. Notion d'autoencodeur. Autoencodeurs empilés, convolutifs, récurrents. Comprendre les réseaux antagonistes génératifs (GANS) et leur limites de convergences. Apprentissage par transfert. Évolutions vers les GRU (Gated Recurrent Units) et LSTM (Long Short Term Memory). Traitement du langage naturel (NLP) : encodage des caractères et des mots, traduction.Atelier : entraînement d'un autoencodeur variationnel sur un jeu d'images
|
|
| Architecture Transformer et mécanisme d'attention |
Durée : 3h Méthodes pédagogiques : alternance de théorie et de travaux pratiques Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux | Limites des RNN et LSTM pour les séquences longues : vanishing gradient, traitement séquentiel. Mécanisme d'attention : principe, scaled dot-product attention, multi-head attention. Architecture Transformer : encodeur-décodeur, positional encoding, normalisation, connexions résiduelles. Variantes : encoder-only (BERT), decoder-only (GPT), encoder-decoder (T5) — cas d'usage respectifs. Tokenization : BPE, WordPiece, SentencePiece — impact sur les performances. Pré-entraînement et transfer learning : masked language modeling, causal language modeling. De Transformer aux LLM : scaling laws, émergence de capacités, limites.Atelier : Implémentation d'un mécanisme d'attention complet avec PyTorch, puis utilisation d'un modèle pré-entraîné Hugging Face pour de la classification de texte — comparaison avec le CNN précédent sur le même jeu de données.
|
|
| Exploitation, création de modèles |
Durée : 3h Méthodes pédagogiques : alternance de théorie et de travaux pratiques Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux | Préparation des données, régularisation, normalisation, extraction des caractéristiques. Optimisation de la politique d'apprentissage. Exploitation des modèles, mise en production. TensorFlow Hub. Serving. Visualiser les reconstructions.Atelier : mise en place d'un serveur de modèles et d'une application tf-lite pour mobile
|
|
| Comprendre les points forts et les limites de ces outils |
Durée : 1h30 Méthodes pédagogiques : exposé/échanges Matériels et moyens : video-projecteur en présentiel, tableau partagé en classe virtuelle | Mise en évidence des problèmes de convergence et du vanishing gradient. Les erreurs d'architecture. Comment distribuer un réseau de neurones? Les limites du DeepLearning : imiter/créer. Cas concrets d'utilisation. Perspectives : Transformers, LLM, modèles multi-modaux, IA embarquée.
|