Formation : IA - langage : NLP, traduction, analyse

Durée de la formation

2 jours

Code cours

IA051

Prix de la formation

1 670 € HT

Sessions programmées

1 au 2 septembre 1 au 2 décembre

Public :

toute personne intéressée par le NLP: Ingénieurs, Analystes, Data Scientists, Data Analysts, Data Steward, Développeurs...

Objectifs :

Comprendre les principes du NLP.Savoir les mettre en oeuvre avec Python.

Prérequis :

Connaissances de base de Python et du deep learning.

Pour tester vos connaissances actuelles sur le sujet : Validation des pré-requis
Pour nous préciser vos attentes : Validation des attentes

Programme détaillé de la formation

NLP Introduction

Objectifs : comprendre le langage humain, et savoir générer des réponses
Différentes étapes : reconnaissance de caractères, ou de la voix, conversion des données en texte,
décomposition en éléments de phrase, nettoyage des données, traitement de l'ambiguité d'un mot,
reconnaissance d'une entité nommée (NEM), traitement des multiples références pour une entité,
extraction des informations subjectives, etc ...
Les outils de NLP et historique :
outils statistiques, de machine learning, de deep learning,
Watson NLU, Python et le NLTK.
Applications actuelles : solutions de détection de spam, traduction automatique, assistants virtuels, chatbots, analyses d'opinions, de sentiments, etc ...

Python et le NLTK

Introduction : plate-formes supportées, versions de Python,
Présentation des textes et modèles fournis avec le NLTK

Atelier : installation du package NLTK et des datasets

Traitements de textes

Etude des différentes fonctions fournies par le NLTK.
Découpage d'un texte en mots ou en phrases,avec nltk.tokenize(),
nettoyage de textes avec le filtrage de mots,
stemming avec nltk.stem, alertes sur les risques d'un mauvais usage,
étiquetage des différentes parties d'un texte avec nltk.pos-tag(),
lemmatisation, pour identifier les formes canoniques des mots,
identification de phrases avec le chunking

Atelier : réalisation d'exemples sur des datasets simples

Analyses de textes

Description de nltk.ne_chunk() pour la reconnaissance d'identités nommées,
Présentation des fonctions concordance(), dispersion_plot(), FreqDist

Atelier : Import de corpus de textes, analyse, mise en évidence de l'utilisation de termes caractéristiques

Etude de cas

Analyse de sentiments avec nltk.sentiment
Présentation des fonctions disponibles

Atelier : mise en oeuvre sur un corpus. Utilisation de polarity.scores()

Intégration de scikit-learn

Import des algorithmes de classification de scikit-learn

Atelier : exemple d'utilisation des aglorithmes de scikit-learn depuis nltk

Phirio

+33 1 55 33 52 10
info@phirio.fr

Calendrier
Code cours : IA051

Contenu de la formation
IA - langage : NLP, traduction, analyse:

NLP Introduction
Python et le NLTK
Traitements de textes
Analyses de textes
Etude de cas
Intégration de scikit-learn

Accès à la liste des cours

Vous pouvez bien entendu composer votre programme personnel à partir de nos descriptifs de cours

Version du document : Ra08
Date de mise à jour du document : 2024/11/08