Analyse multivariée approfondie
STA201


Objectifs pédagogiques :

Approfondir les méthodes statistiques d'analyse exploratoire, de régression et de classification

Public et conditions d'accès :

Etre inscrit en M2 du master Statistique MR123 (ancien MR085) ou du master Actuariat MR126000A (ancien MR088) ou être agréé (niveau requis STA101 et STA102) .
 Pour obtenir l'agrément, les auditeurs adresseront par courrier électronique à l'enseignant responsable, Mme Niang (ndeye.niang_keita@cnam.fr ) un CV détaillé et une lettre de motivation indiquant les raisons de la demande et le projet pédagogique dans lequel elle s'inscrit.

Méthodes de validation :

La validation repose sur la réalisation d'une note de lecture d'articles scientifiques ou l'étude d'un jeu de données en utilisant les méthodes vues en cours.

Contenu de la formation :

Méthodes d'analyse exploratoire et confirmatoire :

  • Analyse factorielle exploratoire et confirmatoire
  • Codage optimal
  • Positionnement Multidimensionnel
  • Classification non supervisée et modèles de mélanges

Méthodes prédictives :

Méthodes de régression

  • Estimation des paramètres par ré-échantillonnage (Bootstrap, Jackknife)
  • Multicolinéarité et stabilité des estimations
  • Complexité du modèle, trade-off biais-variance et précision des prédictions
  • Méthodes de sélection des variables (Best subset regression, méthodes pas à pas)
  • Méthodes de régularisation par composantes : Régression sur Composantes Principales, Régression PLS
  • Méthodes de régularisation par contraintes : Régression Ridge, LASSO, Elastic Net
  • Sélection de modèle par procédures d'apprentissage statistique
  • Régression robuste
  • Régression non paramétrique

Méthodes de classification supervisée

  • Régression logistique binaire
  • Régression Logistique multinomiale et ordinale
  • Analyse factorielle discriminante
  • Discrimination sur variables qualitatives
  • Analyse discriminante probabiliste Linéaire et Quadratique
  • Approche non paramétrique : Méthode des noyaux, Méthode des k plus proches voisins

Traitement des données manquantes

 
Bibliographie :
  • G.GOVAERT: Analyse des données ( Hermes,2003)
  • M.BARDOS: Analyse discriminante (Dunod,2001)
  • J.P.NAKACHE, J.CONFAIS: Statistique explicative appliquée (Technip, 2003)
  • G.SAPORTA: Probabilités, analyse des données, statistique 3ème édition (Technip,2010)
  • S.TUFFERY: Data mining et statistique décisionnelle, 3ème édition (Technip, 2010)
  • T.HASTIE, J.FRIEDMAN, F.TIBSHIRANI: The Elements of Statistical Learning (Springer 2009). Téléchargeable ici : http://www-stat.stanford.edu/~tibs/ElemStatLearn/download.html
  • K.V. Mardia, J.T. Kent and J.M. Bibby: Multivariate Analysis, Academic Press, 1979

Cette UE apparaît dans les diplômes et certificats suivants :

  • MR12303A : Master Sciences, technologies, santé, mention mathématiques appliquées, statistique parcours Science des données
  • MR12301A : Master Sciences, technologies, santé, mention mathématiques appliquées, statistique parcours Statistique du risque pour la finance et l'assurance
  • CYC9102A : Diplôme d'ingénieur Spécialité informatique parcours Intelligence Artificielle et Optimisation
  • MR11603B : Master Sciences, technologies, santé mention Informatique parcours Systèmes d'information et business intelligence HTT
  • MR12600A : Master Droit économie et gestion, mention actuariat

Prochaines sessions de formation

Recherche en cours