Objectifs
Le cours présente les enjeux et les défis liés à la collecte, au stockage et à l'analyse de données massives. À l'issue du cours, les étudiants devraient être capables de proposer des solutions pour l'analyse de données massives, de connaitre les difficultés et les enjeux particuliers à leur traitement, de comprendre les différentes approches algorithmiques permettant de les traiter et de connaitre les principaux outils logiciels du domaine.
Sommaire du contenu
Définition du contexte. Perspectives éthiques et sécurité des données. Problèmes de passage à l'échelle. Manipulation des données massives. Indexation. Bases de données non relationnelles. Données massives connectées. Principaux algorithmes de fouille et d'apprentissage automatique adaptés au traitement des données massives. Données textuelles et traitement automatique du langage naturel. Étude et utilisation d'outils logiciels.