Science de la donnée en milieu professionnel
STA218


Objectifs pédagogiques :

Maîtriser le processus d'extraction de connaissances à travers des techniques avancées d'analyse des données autour de problématiques professionnelles dans différents domaines d'application :  biologie, environnement, banque, finance, assurance, marketing, etc.

Public et conditions d'accès :

Bonne connaissance des méthodes avancées de fouille de données, connaissance d'au moins un langage de programmation. Niveau recommandé UE STA201, STA211, RCP216

Méthodes de validation :

La validation de l'UE se fera sur la base d'un projet qui pourra donner lieu à une soutenance orale.

Contenu de la formation :
  • Identification des problématiques liées aux données de l'étude
  • Études préalables et mise en place du processus de fouille
    • Prétraitement des données : Analyse de la qualité des données, gestion des valeurs manquantes ou aberrantes
    • identification des techniques de fouille adaptées 
  • Mise en œuvre des méthodes de fouille en intégrant les contraintes métiers (biais, coût d'acquisition des données, etc)

 

 

 

Bibliographie :
  • James, Witten, Hastie, & Tibshirani: An Introduction to Statistical Learning (2021) with applications in R Téléchargeable ici: https://www.statlearning.com/
  • James, Witten, Hastie, Tibshirani & Taylor: An Introduction to Statistical Learning with applications in Python (2023) Téléchargeable ici: https://www.statlearning.com/
  • S.TUFFERY: Etude de cas en statistique décisionnelle (Technip, 2009)

Cette UE apparaît dans les diplômes et certificats suivants :

  • MR12303A : Master Sciences, technologies, santé, mention mathématiques appliquées, statistique parcours Science des données

Prochaines sessions de formation

Recherche en cours