Les systèmes BigData permettent de distribuer le stockage et disposent de mécanismes permettant de distribuer les calculs. Les applications sont nombreuses, à commencer par le stockage de gros volumes. Le BigData s'appuie sur :
- du matériel standard : cartes mères de PC, disques standards, ...
- des systèmes d'exploitation standards, sans pilotes spécifiques : Unix, Linux, Windows, ...
- de nombreux outils d'intégration de données hétérogènes
Ils sont capables de suivre facilement la puissance souhaitée :
- ajout/suppression de serveurs,
- déplacements géographiques, ...
Ces produits et cette organisation amènent une nouvelle terminologie :
- Données non structurées
- ETL (Extract, Transform, Load)
- Traitement en temps réel
- Les 3 V (Volume, Variété, Vélocité)
- Analytique prédictive
- Data Scientist
- Machine Learning/Apprentissage automatique
Exemples d'utilisation :
- Décisionnel, prédictif : principalement services financiers
- Énergie : gestion à distance et centralisée des radiateurs et consommateurs
- Recherche médicale : épidémies
- Politique : analyse de sentiments, de comportements
- Lutte contre la fraude, les contrefaçons
- Recherche : en astronomie, le LHC (Grand collisionneur de hadrons) produit environ 70 To de données par jour
- Environnement : étude des tremblements de terre, tectonique des plaques, essais nucléaires, ...
Certains de ces cas d'utilisation sont plus orientés vers le calcul, les statistiques, d'autres plus vers le stockage, d'autres vers la réplication et la disponibilité des données.
Liens