Modélisation statistique
STA110


Objectifs pédagogiques

Maîtriser les outils de la modélisation statistique (sélection de modèles, validation, interprétation) dans un contexte général (données continues, discrètes, qualitatives, mixtes) via l'utilisation de méthodes paramétriques (modèles linéaires et modèle linéaire généralisé) ou non-paramétriques.

Acquérir des connaissances ainsi qu'un savoir-faire dont l'objectif est de traiter un problème concret par une approche de modélisation (applications à des données réelles).

Mettre en œuvre cette modélisation à l'aide d'un logiciel de modélisation statistique avancé (logiciel R) et savoir interpréter les résultats obtenus.

Public et conditions d'accès

Avoir le niveau de l'unité d'enseignement : STA. 103 (calcul des probabilités) et STA001 (Techniques de la statistique)

Compétences

Statisticien modélisateur

Méthodes de validation

L'évaluation se fera uniquement sous la forme de projets consistant en l'application des différentes méthodes de modélisation sur des données réelles.

Contenu de la formation

I) Méthodes paramétriques

Régression linéaire simple et multiple : modèle, moindres carrés, estimations, intervalles de confiance, tests, colinéarité, sélection de variables, validation, prédiction, interprétation. Recherche de points (aberrants, influents, atypiques et de points leviers).

Analyse de la Variance : à 1 facteur (mesures indépendantes, répétées) et à 2 facteurs (mesures indépendantes)  

Analyse de la Covariance (modèles, comparaison à la régression linéaire et à l'ANOVA à 1 facteur à mesures indépendantes, paradoxe de Lord)

Régression logistique : modèle probit et logit, estimations, tests, sélection de modèles, validation, prédiction.

Modèle linéaire généralisé (regression de Poisson, modèle polytomique)

Introduction à la modélisation Bayésienne
Introduction à l'analyse de séries temporelles


II) Méthodes non-paramétriques

Régression spline

Estimateurs par moyennes locales (estimateurs à noyau)

Régression polynomiale locale

L'enseignement comporte une initiation au logiciel R et une mise en oeuvre de ce logiciel dans diverses applications.

Bibliographie
  • CAMERON, TRIVEDI: Regression analysis of count data models (Cambridge University Press)
  • HAMILTON: Time series analysis (Princeton University Press)
  • Azaïs J-M., Bardet J-M: Le modèle linéaire par l’exemple (Dunod)
  • Cornillon P., Matzner-Lober, E.: Régression linéaire : Théorie et applications (Statistiques et probabilités appliquées))
  • , Cornillon, PA, Guyader, A., Husson, F., Jégou, N., Josse, J., Kloareg, M., Matzner-Lober, E., Rouvière, L.: Statistiques avec R (PUR)
  • J.J. Daudin, S. Robin, C. Vuillet: Statistique inférentielle : idées, démarches, exemples. (PUR)
  • Prum, B.: Modèle linéaire, Comparaison de groupes et régression (Les Editions INSERM)
  • G. Saporta: Probabilités, Analyse des données et Statistiques (Technip)

Cette UE apparaît dans les diplômes et certificats suivants :

  • MR12301A : Master Sciences, technologies, santé, mention mathématiques appliquées, statistique parcours Statistique du risque pour la finance et l'assurance
  • MR12303A : Master Sciences, technologies, santé, mention mathématiques appliquées, statistique parcours Science des données
  • CC3100A : Certificat de compétence Statistique pour la finance

Prochaines sessions de formation

Recherche en cours ...