Modèles linéaires
STA102


Objectifs pédagogiques :

Le cours présente des méthodes pour décrire, expliquer ou prédire une variables à l'aide d'un ou plusieurs caractères quantitatifs et/ou qualitatifs. Ces méthodes, fondées sur le modèle linéaire, sont illustrées par des sorties SAS.

Public et conditions d'accès :

Bases d'inférence statistique : variables aléatoire, statistiques et distributions d'échantillonnage, estimation ponctuelle et par intervalle, tests d'hypothèses. Notions de calcul matriciel.

Les UE STA104 et STA101 donnent toutes les connaissances nécessaires pour intégrer le cours.

Méthodes de validation :

Examen écrit

Contenu de la formation :

Régression linéaire simple :

  • analyses des données, ajustement linéaire par le critère des moindres carrés, décomposition de la somme des carrés totale, qualité de l'ajustement, points leviers
  • hypothèses du modèle, estimation des paramètres par la méthode des moindres carrés et de maximum de vraisemblance
  • ajustement du modèle
  • validation du modèle : test d'hypothèses et intervalles de confiance sur les coefficients, test de la signification globale du modèle, intervalle de confiance pour la droite, intervalle de prédiction
  • diagnostic du modèle
  • détection d'observations aberrantes et d'observation influentes

Régression linéaire multiple :

  • analyses des données, ajustement linéaire par le critère des moindres carrés, décomposition de la somme des carrés totale, qualité de l'ajustement, points leviers
  • hypothèses du modèle, estimation des paramètres par la méthode des moindres carrés 
  • la géométrie du modèle de régression multiple
  • théorème de Gauss - Markov
  • ajustement du modèle
  • validation du modèle : test d'hypothèses et intervalles de confiance sur les coefficients, théorème de Cochran, test de la signification globale du modèle, intervalle de confiance pour la droite, intervalle de prédiction
  • diagnostic du modèle
  • détection d'observations aberrantes et d'observation influentes
  • multicolinéarité : diagnostic et remèdes
  • sélection de variables
  • détection d'observations aberrantes et d'observation influentes

Analyse de la variance - modèle à un facteur :

  • l'analyse de la variance a un facteur comme modèle linéaire
  • estimation des paramètres (dispositif équilibré et déséquilibré) 
  • décomposition de la somme des carrées totale et qualité de l'ajustement du modèle
  • test de l'effet du facteur
  • validation des hypothèses de normalité et de homoscédasticité
  • tests post hoc pour les comparaisons multiples de moyennes
  • analyse de la variance non paramétrique

Analyse de la variance - modèle à deux facteurs :

  • l'analyse de la variance à deux facteurs comme modèle linéaire
  • estimation des paramètres et qualité du modèle
  • test d'hypothèses et intervalles de confiance sur les coefficients
  • étude de l'interaction
  • décomposition de la somme des carrés totale
  • décomposition de la somme des carrées du modèle
  • test de la significativité globale du modèle
  • tests des effets
  • test de comparaison des moyennes pour chaque facteur
  • test de comparaison des moyennes par traitements

Analyse de la covariance :

  • le modèle d'analyse de la covariance
  • estimation des paramètres
  • décomposition de la somme des carrés totale, ajustement du modèle
  • test de significativité globale du modèle
  • test des effets
  • test de comparaison des moyennes par traitements
  • sélection du modèle
Bibliographie :
  • P. DAGNELIE: Statistique théorique et appliquée - tome 2 (De Boeck, Bruxelles 2011)
  • Y. DODGE: Analyse de régression appliquée (Dunod 2004)
  • N. DRAPER et H. SMITH: Applied regression analysis (Wiley 1998)
  • M. LEJEUNE: Statistique: la théorie et ses applications (Springer 2010)
  • R.C. LITTELL: SAS for Linear Models, Fourth Edition (SAS Institute Inc. 2002)
  • G.SAPORTA: Probabilités, analyse des données, statistique (Technip 2011)
  • N.H. TIMM: Univariate and Multivariate General Linear Models: Theory and Applications using SAS Software (SAS Institute Inc. 1997)
  • M.TENENHAUS: Statistique. Méthodes pour décrire, expliquer et prévoir. (Dunod, 2007)

Cette UE apparaît dans les diplômes et certificats suivants :

  • MR11603A : Master Sciences, technologies, santé mention Informatique parcours Systèmes d'information et business intelligence
  • CC1200A : Certificat de compétence Data analyst - Chargé(e) d'études statistiques
  • LG04201A : Licence Sciences, technologies, santé mention mathématiques parcours Sciences des données

Prochaines sessions de formation

Recherche en cours