Caractéristiques NoSQL.
Définition de Datalake : présentation, sources des données, intérêt
Les familles de bases NoSQL (Clé/valeur,orientées documents, orientées colonnes, graphes)
Structure de données proches des utilisateurs, développeurs:
sérialisation, tables de hachage, JSON.
Priorité au traitement du côté client.
Protocoles d'accès aux données, interfaces depuis les langages classiques.
Données structurées et non structurées, documents, images,
Stockage réparti : réplication, sharding, protocole gossip, hachage,...
Parallélisation des traitements : implémentation de map/reduce.
Cohérence des données et gestion des accès concurrents :
"eventual consistency" et multi-versions concurrency control.
Atelier : démonstration d'un système de stockage réparti avec MongoDB