Analyse multivariée approfondie
STA201


Objectifs pédagogiques :

Approfondir les méthodes statistiques d'analyse exploratoire, de régression et de classification

Public et conditions d'accès :

Etre inscrit en M2 du master Statistique MR123 (ancien MR085) ou du master Actuariat MR126000A (ancien MR088) ou être agréé (niveau requis STA101 et STA102) .
 Pour obtenir l'agrément, les auditeurs adresseront par courrier électronique à l'enseignant responsable, Mme Niang (ndeye.niang_keita@cnam.fr ) un CV détaillé et une lettre de motivation indiquant les raisons de la demande et le projet pédagogique dans lequel elle s'inscrit.

Méthodes de validation :

Le travail consistera à rédiger un rapport qui sera présenté et discuté lors d'une soutenance orale. L'étudiant pourra choisir entre deux types de projets : une étude de cas ou une synthèse d'articles.

Contenu de la formation :

Méthodes d'analyse exploratoire et confirmatoire :

  • Analyse factorielle exploratoire et confirmatoire
  • Codage optimal
  • Positionnement Multidimensionnel
  • Classification non supervisée et modèles de mélanges

Méthodes prédictives :

Méthodes de régression

  • Estimation des paramètres par ré-échantillonnage (Bootstrap, Jackknife)
  • Multicolinéarité et stabilité des estimations
  • Complexité du modèle, trade-off biais-variance et précision des prédictions
  • Méthodes de sélection des variables (Best subset regression, méthodes pas à pas)
  • Méthodes de régularisation par composantes : Régression sur Composantes Principales, Régression PLS
  • Méthodes de régularisation par contraintes : Régression Ridge, LASSO, Elastic Net
  • Sélection de modèle par procédures d'apprentissage statistique
  • Régression robuste
  • Régression non paramétrique

Méthodes de classification supervisée

  • Régression logistique binaire
  • Régression Logistique multinomiale et ordinale
  • Analyse factorielle discriminante
  • Discrimination sur variables qualitatives
  • Analyse discriminante probabiliste Linéaire et Quadratique
  • Approche non paramétrique : Méthode des noyaux, Méthode des k plus proches voisins

Traitement des données manquantes

 

Bibliographie :
  • G.GOVAERT: Analyse des données ( Hermes,2003)
  • M.BARDOS: Analyse discriminante (Dunod,2001)
  • J.P.NAKACHE, J.CONFAIS: Statistique explicative appliquée (Technip, 2003)
  • G.SAPORTA: Probabilités, analyse des données, statistique 3ème édition (Technip,2010)
  • S.TUFFERY: Data mining et statistique décisionnelle, 3ème édition (Technip, 2010)
  • T.HASTIE, J.FRIEDMAN, F.TIBSHIRANI: The Elements of Statistical Learning (Springer 2009). Téléchargeable ici : http://www-stat.stanford.edu/~tibs/ElemStatLearn/download.html
  • K.V. Mardia, J.T. Kent and J.M. Bibby: Multivariate Analysis, Academic Press, 1979
  • G. James, D. Witten, T. Hastie and R. Tibshirani: An Introduction to Statistical Learning with application in R, 2ème édition (Springer, 2021))
  • G. James, D. Witten, T. Hastie, R. Tibshirani and J.Taylor: An Introduction to Statistical Learning with application in Python (Springer ,2023)

Cette UE apparaît dans les diplômes et certificats suivants :

  • MR12301A : Master Sciences, technologies, santé, mention mathématiques appliquées, statistique parcours Statistique du risque pour la finance et l'assurance
  • MR11603B : Master Sciences, technologies, santé mention Informatique parcours Systèmes d'information et business intelligence HTT
  • MR12303A : Master Sciences, technologies, santé, mention mathématiques appliquées, statistique parcours Science des données
  • MR12600A : Master Droit économie et gestion, mention actuariat

Prochaines sessions de formation

Recherche en cours