Modèles linéaires
STA102


Objectifs pédagogiques

Le cours présente des méthodes pour décrire, expliquer ou prédire une variables à l'aide d'un ou plusieurs caractères quantitatifs et/ou qualitatifs. Ces méthodes, fondées sur le modèle linéaire, sont illustrées par des sorties SAS.

Public et conditions d'accès

Bases d'inférence statistique : variables aléatoire, statistiques et distributions d'échantillonnage, estimation ponctuelle et par intervalle, tests d'hypothèses. Notions de calcul matriciel.

Les UE STA104 et STA101 donnent toutes les connaissances nécessaires pour intégrer le cours.

Compétences

Connaitre les bases théoriques des modèles présentés en cours, et en particulier :

- Les hypothèses des modèles

- Les méthodes de construction des estimateurs des paramètres

- Les propriétés des estimateurs

Etre capable d'interpréter les sorties d'un logiciel à fin de :

- Evaluer l'ajustement aux données et la signification statistique du modèle

- Détecter des données aberrantes et influentes

- Vérifier les hypothèses du modèle.

- Détecter des problèmes de multi colinéarité

- Choisir le meilleur modèle par la sélection des variables

Méthodes de validation

Examen écrit

Contenu de la formation

Régression linéaire simple :

  • analyses des données, ajustement linéaire par le critère des moindres carrés, décomposition de la somme des carrés totale, qualité de l'ajustement, points leviers
  • hypothèses du modèle, estimation des paramètres par la méthode des moindres carrés et de maximum de vraisemblance
  • ajustement du modèle
  • validation du modèle : test d'hypothèses et intervalles de confiance sur les coefficients, test de la signification globale du modèle, intervalle de confiance pour la droite, intervalle de prédiction
  • diagnostic du modèle
  • détection d'observations aberrantes et d'observation influentes

Régression linéaire multiple :

  • analyses des données, ajustement linéaire par le critère des moindres carrés, décomposition de la somme des carrés totale, qualité de l'ajustement, points leviers
  • hypothèses du modèle, estimation des paramètres par la méthode des moindres carrés 
  • la géométrie du modèle de régression multiple
  • théorème de Gauss - Markov
  • ajustement du modèle
  • validation du modèle : test d'hypothèses et intervalles de confiance sur les coefficients, théorème de Cochran, test de la signification globale du modèle, intervalle de confiance pour la droite, intervalle de prédiction
  • diagnostic du modèle
  • détection d'observations aberrantes et d'observation influentes
  • multicolinéarité : diagnostic et remèdes
  • sélection de variables
  • détection d'observations aberrantes et d'observation influentes

Analyse de la variance - modèle à un facteur :

  • l'analyse de la variance a un facteur comme modèle linéaire
  • estimation des paramètres (dispositif équilibré et déséquilibré) 
  • décomposition de la somme des carrées totale et qualité de l'ajustement du modèle
  • test de l'effet du facteur
  • validation des hypothèses de normalité et de homoscédasticité
  • tests post hoc pour les comparaisons multiples de moyennes
  • analyse de la variance non paramétrique

Analyse de la variance - modèle à deux facteurs :

  • l'analyse de la variance à deux facteurs comme modèle linéaire
  • estimation des paramètres et qualité du modèle
  • test d'hypothèses et intervalles de confiance sur les coefficients
  • étude de l'interaction
  • décomposition de la somme des carrés totale
  • décomposition de la somme des carrées du modèle
  • test de la significativité globale du modèle
  • tests des effets
  • test de comparaison des moyennes pour chaque facteur
  • test de comparaison des moyennes par traitements

Analyse de la covariance :

  • le modèle d'analyse de la covariance
  • estimation des paramètres
  • décomposition de la somme des carrés totale, ajustement du modèle
  • test de significativité globale du modèle
  • test des effets
  • test de comparaison des moyennes par traitements
  • sélection du modèle
Bibliographie
  • P. DAGNELIE: Statistique théorique et appliquée - tome 2 (De Boeck, Bruxelles 2011)
  • Y. DODGE: Analyse de régression appliquée (Dunod 2004)
  • N. DRAPER et H. SMITH: Applied regression analysis (Wiley 1998)
  • M. LEJEUNE: Statistique: la théorie et ses applications (Springer 2010)
  • R.C. LITTELL: SAS for Linear Models, Fourth Edition (SAS Institute Inc. 2002)
  • G.SAPORTA: Probabilités, analyse des données, statistique (Technip 2011)
  • N.H. TIMM: Univariate and Multivariate General Linear Models: Theory and Applications using SAS Software (SAS Institute Inc. 1997)
  • M.TENENHAUS: Statistique. Méthodes pour décrire, expliquer et prévoir. (Dunod, 2007)

Cette UE apparaît dans les diplômes et certificats suivants :

  • MR11604A : Master Sciences, technologies, santé mention Informatique parcours Traitement de l'information et exploitation des données
  • MR11603A : Master Sciences, technologies, santé mention Informatique parcours Systèmes d'information et business intelligence
  • CC1200A : Certificat de compétence Data analyst - Chargé(e) d'études statistiques
  • LG04201A : Licence Sciences, technologies, santé mention mathématiques parcours Sciences des données
  • MR11605A : Master Sciences, technologies, santé mention Informatique parcours Préparation à l'agrégation en informatique

Prochaines sessions de formation

Filtres :
Centre de formation Semestre
2021/2022
Jours de
formation
Modalité Tarif    
Paris Semestre 1 180 € Inscription fermée

Date de début des cours (*) : 20/09/2021

* Les dates fournies sont d'ordre général à toutes les formations.
Les cours pour cette formation peuvent potentiellement commencer un peu plus tard dans le semestre.

Paris
Semestre 1
Cours en ligne
180 €
Légende :
Tarif :

Seul le financement à titre individuel est proposé à l'inscription en ligne. Si vous souhaitez financer votre formation par votre entreprise, vous devez demander un devis auprès de nos centres Tarifs en vigueur depuis le 17 juin 2020.

Date de début de cours :

Les dates fournies sont d'ordre général à toutes les formations. Les cours pour cette formation peuvent potentiellement commencer un peu plus tard dans le semestre.

Annuel :

Il s'étend de fin septembre / début octobre à début juillet (dates indicatives, renseignez-vous auprès de votre centre).

Semestre 1 :

Il s'étend de fin septembre / début octobre à fin janvier / début février (dates indicatives, renseignez-vous auprès de votre centre).

Semestre 2 :

Il s'étend de fin février / début mars à début juillet (dates indicatives, renseignez-vous auprès de votre centre).

Cours du soir :

Les cours commencent le plus souvent à 18h30 dans les centres.

  Cours en journée :

Se renseigner auprès du centre pour connaître les horaires.

Cours en ligne :

Les cours sont diffusés sous forme de séances numériques via une plateforme d'e-learning animées et tutorées par un enseignant. Des regroupements peuvent être proposés dont certains sont obligatoires.

  Cours hybrides :

Cette modalité mixe des cours en présentiel (en cours du soir ou en journée) et des cours en ligne.

  Cours en ligne organisés par un autre
centre CNAM Régional :

Les cours sont diffusés sous forme de séances numériques via une plateforme d'e-learning animées et tutorées par un enseignant.

Recherche en cours ...