Données catégorielles
STA212


Objectifs pédagogiques :

Permettre aux ingénieurs, cadres d'entreprises ou d'administrations, médecins, chercheurs, de construire des modèles explicatifs de variables qualitatives. Le cours s'appuie sur la pratique du logiciel SAS, mis à disposition des auditeurs.

Public et conditions d'accès :

Ce cours s'adresse en priorité aux auditeurs préparant le master MR0085.
Il s'adresse également à des auditeurs préparant le diplôme d'actuaire.
Niveau requis: STA102 (régression et analyse de la variance) et STA104 (statistique mathématique).

Méthodes de validation :

Rédaction d'un mémoire utilisant les méthodes présentées en cours

Contenu de la formation :

Présentation des méthodes statistiques traitant des variables qualitatives
Principes généraux d'estimation d'un modèle (maximum de vraisemblance)

La régression logistique simple
Notion de variable latente
Les modèles PROBIT, LOGIT
Le modèle logistique et son interprétation
Analyse des résidus, des observations

La régression logistique multiple
Le modèle : prédicteurs quantitatifs ou qualitatifs
Sélection de variables
Résumé des tests de validité générale d'un modèle
Tables de classement, courbe ROC
Interprétation des coefficients de la régression logistique : odds ratio
La régression logistique dans le cas où Y est une variable polytomique ordonnée
Aspects pratiques de la mise en oeuvre des méthodes de régression logistique
La procédure LOGISTIC

Présentation des modèles linéaires généralisés et de la procédure GENMOD
Régression de Poisson
Etude de contrastes

Modélisation d'une réponse multinomiale
Estimation par maximum de vraisemblance ou par moindres carrés généralisés
Etude de cas avec la procédure CATMOD

Comparaison de la régression logistique avec d'autres méthodes de modélisation d'une réponse qualitative
Analyse discriminante sur variables quantitatives et qualitatives
Arbres de décision
Eléments pratiques de création d'un score 
 
Méthodes PLS
Présentation de NIPALS, PLS1,PLS2
Applications: régression logistique PLS, analyse discriminante PLS
Modèles linéaires généralisés PLS

Bibliographie :
  • HOSMER D., LEMESHOW S.: Applied logistic regression 2ième édition (Wiley, 2000)
  • NAKACHE J.P., CONFAIS J.: Statistique explicative appliquée (Technip, 2003)
  • Editeurs DROESBEKE, LEJEUNE, SAPORTA; Auteurs: CROUX, GONZALEZ....: Modèles statistiques pour données qualitatives (Technip 2005)
  • STOKES M.E., DAVIS C.S. & KOCH G.G.: Categorical Data Analysis using the SAS System (SAS Institute Inc, Cary, NC, 2000)
  • BARDOS M.: Analyse discriminante (Dunod, 2001)
  • AGRESTI A.: Categorical data analysis 2ième édition (Wiley, 2002)

Cette UE apparaît dans les diplômes et certificats suivants :

  • MR11604A : Master Sciences, technologies, santé mention Informatique parcours Traitement de l'information et exploitation des données
  • MR12303A : Master Sciences, technologies, santé, mention mathématiques appliquées, statistique parcours Science des données
  • MR12301A : Master Sciences, technologies, santé, mention mathématiques appliquées, statistique parcours Statistique du risque pour la finance et l'assurance

Prochaines sessions de formation

Filtres :
Centre de formation Semestre
2023/2024
Jours de
formation
Modalité Crédits    
Paris Semestre 2 9 crédits (1)

Date de début des cours (*) :

  • 05/02/2024

* Les dates fournies sont d'ordre général à toutes les formations.
  Les cours pour cette formation peuvent potentiellement commencer un peu plus tard dans le semestre.

Ajouter au panier
Contacter le centre
Légende :
Tarif (1) :

Vous pouvez consulter nos tarifs ici.
Selon votre statut, il existe différents dispositifs de financement qui peuvent financer jusqu'à 100 % de votre formation. Nos chargés de formation en centre vous accompagneront pour constituer votre dossier.

Date de début de cours :
  • Île-de-France :
    • 1er semestre et annuel : 02/10/2023
    • 2e semestre : 19/02/2024
  • Paris :
    • 1er semestre et annuel : 18/09/2023
    • 2e semestre : 05/02/2024

Les dates fournies sont d'ordre général à toutes les formations. Les cours pour cette formation peuvent potentiellement commencer un peu plus tard dans le semestre.

Annuel :

Il s'étend de fin septembre / début octobre à début juillet (dates indicatives, renseignez-vous auprès de votre centre).

Semestre 1 :

Il s'étend de fin septembre / début octobre à fin janvier / début février (dates indicatives, renseignez-vous auprès de votre centre).

Semestre 2 :

Il s'étend de fin février / début mars à début juillet (dates indicatives, renseignez-vous auprès de votre centre).

Cours du soir :

Les cours commencent le plus souvent à 18h30 dans les centres.

  Cours en journée :

Se renseigner auprès du centre pour connaître les horaires.

Cours en ligne :

les cours sont diffusés sous forme de séances numériques via une plateforme d’e-learning animées et tutorées par un enseignant. Des séances de regroupement en visio sont proposées.

  Classe virtuelle :

L'enseignant à distance intervient en direct et en visioconférence sur la plateforme d'e-learning. Il complète son intervention par des activités interactives (exercices échanges…)

  Cours en ligne hybride :

Cette modalité associe des cours en ligne tutorées et des regroupements en présentiel obligatoires.

  Cours hybrides :

Cette modalité mixe des cours en présentiel (en cours du soir ou en journée) et des cours en ligne.

  Cours en ligne organisés par un autre
centre CNAM Régional :

Les cours sont diffusés sous forme de séances numériques via une plateforme d'e-learning animées et tutorées par un enseignant.

Recherche en cours