Formation : IA - Deep Learning : tensorflow, Caffe, Pytorch

Durée	3 jours
Code cours	IA020
Dates	2 au 4 septembre 18 au 20 novembre (cliquez sur une date pour vous inscrire)

Public:

toute personne intéressée par le Deep Learning et les réseaux de neurones : Ingénieurs, Analystes, Data Scientists, Data Analysts, Data Steward, Développeurs...

Objectifs:

Comprendre les apports du deep learning et de l'IA, les principes de fonctionnement et les différents outils disponibles.

Connaissances préalables nécessaires:

avoir une culture informatique générale.

Objectifs pédagogiques:

Comprendre les concepts de Machine Learning et l’évolution vers le Deep Learning (réseaux de neurones profonds)
Connaitre les briques de base du Deep Learning : réseaux de neurones simples, convolutifs et récursifs
Comprendre l'architecture Transformer et son rôle fondamental dans les LLM
Appréhender les modèles plus avancés : auto-encodeurs, gans, apprentissage par renforcement
Appréhender les bases théoriques et pratiques d'architecture et de convergence de réseaux de neurones
Comprendre les méthodologies de mise en place de réseaux de neurones, les points forts et les limites de ces outils

Déroulé pédagogique


	Fondements et positionnement de l'intelligence artificielle
Durée : 3h Méthodes pédagogiques : alternance de théorie et de travaux pratiques Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux	Définitions et positionnement : IA, apprentissage profond (Deep Learning) et apprentissage automatique. Les apports du deep learning, état de l'art. Outils disponibles. Exemples de projets concrets. Exemples, domaines d'application. Présentation de deepmind Outils DeepLearning de haut niveau : Keras/TensorFlow, Caffe/PyTorch. Atelier : Mise en oeuvre sur cloud AutoML : traitement du langage naturel, traduction, reconnaissance d'images, ...

	Convergence des réseaux de neurones
Durée : 3h Méthodes pédagogiques : alternance de théorie et de travaux pratiques Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux	Comprendre la rétropropagation de l'erreur et la convergence. Maîtriser la descente de gradient. Les fonctions d'erreur : MSE (erreur quadratique moyenne), entropie croisée binaire, et les optimiseurs SGD (descente de gradient stochastique), RMSprop, Adam. Définitions : couche, epochs, batch size, itérations, loss, learning rate, momentum. Optimiser un entraînement par découpage d'entraînements progressifs. Comprendre le principe des hyperparamètres. Choix des hyperparamètres. Atelier : construire un réseau capable de reconnaître une courbe.

	Connaitre les briques de base du Deep Learning : réseaux de neurones simples, convolutifs et récursifs
Durée : 4h30 Méthodes pédagogiques : alternance de théorie et de travaux pratiques Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux	Les réseaux de neurones : principe, différents types de réseaux de neurones (artificiels, convolutifs, récurrents, ...) Les différentes formes de réseaux : MultiLayer Perceptron FNN/MLP, CNN. Couches d'entrée, de sortie, de calcul. Fonctionnement d'une couche de convolution. Définitions : kernel, padding, stride. Fonctionnement d'une couche de Pooling. APIs standard, modèles d'apprentissage Apprendre à lire une courbe d'apprentissage. Atelier : Comparaison de courbes d'apprentissage avec TensorFlow sur plusieurs paramètres. Les modèles de DeepLearning pour Keras : Xception, Inception, ResNet, VGG, LeNet. Atelier : Construction d'un réseau de neurones de reconnaissance d'images

	Modèles avancés : auto-encodeurs, réseaux antagonistes génératifs (gans), apprentissage par renforcement
Durée : 3h Méthodes pédagogiques : alternance de théorie et de travaux pratiques Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux	Représentations des données. Bruits. Couches d'encodage : codage entier, One-hot, embedding layer. Notion d'autoencodeur. Autoencodeurs empilés, convolutifs, récurrents. Comprendre les réseaux antagonistes génératifs (GANS) et leur limites de convergences. Apprentissage par transfert. Évolutions vers les GRU (Gated Recurrent Units) et LSTM (Long Short Term Memory). Traitement du langage naturel (NLP) : encodage des caractères et des mots, traduction. Atelier : entraînement d'un autoencodeur variationnel sur un jeu d'images

	Architecture Transformer et mécanisme d'attention
Durée : 3h Méthodes pédagogiques : alternance de théorie et de travaux pratiques Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux	Limites des RNN et LSTM pour les séquences longues : vanishing gradient, traitement séquentiel. Mécanisme d'attention : principe, scaled dot-product attention, multi-head attention. Architecture Transformer : encodeur-décodeur, positional encoding, normalisation, connexions résiduelles. Variantes : encoder-only (BERT), decoder-only (GPT), encoder-decoder (T5) — cas d'usage respectifs. Tokenization : BPE, WordPiece, SentencePiece — impact sur les performances. Pré-entraînement et transfer learning : masked language modeling, causal language modeling. De Transformer aux LLM : scaling laws, émergence de capacités, limites. Atelier : Implémentation d'un mécanisme d'attention complet avec PyTorch, puis utilisation d'un modèle pré-entraîné Hugging Face pour de la classification de texte — comparaison avec le CNN précédent sur le même jeu de données.

	Exploitation, création de modèles
Durée : 3h Méthodes pédagogiques : alternance de théorie et de travaux pratiques Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux	Préparation des données, régularisation, normalisation, extraction des caractéristiques. Optimisation de la politique d'apprentissage. Exploitation des modèles, mise en production. TensorFlow Hub. Serving. Visualiser les reconstructions. Atelier : mise en place d'un serveur de modèles et d'une application tf-lite pour mobile

	Comprendre les points forts et les limites de ces outils
Durée : 1h30 Méthodes pédagogiques : exposé/échanges Matériels et moyens : video-projecteur en présentiel, tableau partagé en classe virtuelle	Mise en évidence des problèmes de convergence et du vanishing gradient. Les erreurs d'architecture. Comment distribuer un réseau de neurones? Les limites du DeepLearning : imiter/créer. Cas concrets d'utilisation. Perspectives : Transformers, LLM, modèles multi-modaux, IA embarquée.

Retour au descriptif
Modalités et délais d'accès
Méthodes mobilisées et modalités d'évaluation

Phirio

+33 1 55 33 52 10
info@phirio.fr

Calendrier
Code cours : IA020

Contenu de la formation
IA - Deep Learning : tensorflow, Caffe, Pytorch:

Fondements et positionnement de l'intelligence artificielle
Convergence des réseaux de neurones
Connaitre les briques de base du Deep Learning : réseaux de neurones simples, convolutifs et récursifs
Modèles avancés : auto-encodeurs, réseaux antagonistes génératifs (gans), apprentissage par renforcement
Architecture Transformer et mécanisme d'attention
Exploitation, création de modèles
Comprendre les points forts et les limites de ces outils

Accès à la liste des cours

Vous pouvez bien entendu composer votre programme personnel à partir de nos descriptifs de cours

Note de satisfaction des participants à la formation IA - Deep Learning : tensorflow, Caffe, Pytorch

4.9/5

Taux d'atteinte des objectifs à la formation IA - Deep Learning : tensorflow, Caffe, Pytorch

100%

Taux de réalisation des exercices à la formation IA - Deep Learning : tensorflow, Caffe, Pytorch

100%

Télécharger le programme

Version du document : T327
Date de mise à jour du document : 2026/04/27

Phirio

Formations