Analyse des données : méthodes descriptives
STA101


Objectifs pédagogiques :

Explorer, décrire et interpréter des données dans leur aspect multidimensionnel. Le cours s'appuiera sur la pratique du logiciel R.

Public et conditions d'accès :

Cette formation s'adresse à toute personne souhaitant :
- analyser des données statistiques multidimensionnelles (chargé d'études, ingénieur, chercheur, technicien, etc)
- se spécialiser par la suite dans le traitement de données massives.
Elle nécessite des connaissances de base en statistique descriptive (univariée et bivariée) et des notions de calcul matriciel.

Compétences :

Etre en mesure à l'issue de l'enseignement de produire des études statistiques (rédaction d'un rapport) mettant en jeu les techniques d'analyse factorielle et de classification.

Méthodes de validation :

Le contrôle des connaissances est basé uniquement sur une étude de cas donnant lieu à la rédaction d'un rapport.

Contenu de la formation :

Traitements préalables à une analyse factorielle
Analyses bivariées (analyses univariées supposées maîtrisées)

Outils mathématiques de l'analyse des données
Rappels d'algèbre linéaire
Notion de métrique, projecteur

L'analyse en composantes principales
Principe de l'ACP
Calcul des facteurs principaux et des composantes principales
Mesure de qualité des résultats, techniques d'interprétation
Utilisation de variables illustratives
Gestion des données manquantes

L'analyse des correspondances simples
Principe et métrique associée
Représentation des profils-lignes et des profils-colonnes, représentation simultanée
Règle d'interprétation des résultats

L'analyse des correspondances multiples
Principes de mise en oeuvre et interprétation
Application au dépouillement d'enquêtes

L'Analyse factorielle des données mixtes
Equilibre entre variables de natures différentes
Principe de mise en oeuvre et interprétation

Les méthodes de classification automatique
Méthodes non hiérarchiques : centres mobiles, nuées dynamiques
Méthodes hiérarchiques : méthode de Ward, construction et lecture du dendrogramme
Aspects pratiques de la classification : méthodes mixtes
Interprétation d'une partition à l'aide des variables initiales, en liaison avec une analyse factorielle

Bibliographie :
  • SAPORTA G.: Probabilités, analyse des données et statistique. 3 ème édition (Technip, 2011)
  • TENENHAUS M.: Statistique. Méthodes pour décrire, expliquer et prévoir (Dunod, 2010)
  • LEBART L., MORINEAU A., PIRON M.: Statistique exploratoire multidimensionnelle (Dunod, 4ème édition, 2006)
  • BRY X.: Analyses factorielles simples (Economica, 1995)
  • BOUROCHE J.M., G. SAPORTA: L'analyse des données (Que-Sais-Je ? PUF, 9ème édition, 2006)
  • NAKACHE J.-P., CONFAIS J.: Approche pragmatique de la classification. Technip 2005
  • Pierre-André Cornillon, Arnaud Guyader, Julie Josse ....: Statistiques avec R. Presses universitaires de Rennes 2012
  • François Husson, Sébastien Lê et Jérôme Pagès: Analyse de données avec R. Presses universitaires de Rennes 2009

Cette UE apparaît dans les diplômes et certificats suivants :

  • MR11603A : Master Sciences, technologies, santé mention Informatique parcours Systèmes d'information et business intelligence
  • CC1200A : Certificat de compétence Data analyst - Chargé(e) d'études statistiques
  • LG04201A : Licence Sciences, technologies, santé mention mathématiques parcours Sciences des données
  • MR11607A : Master Sciences, technologies, santé mention Informatique parcours Sécurité informatique, cybersécurité et cybermenaces En bretagne
  • MR11602A : Master Sciences, technologies, santé mention Informatique parcours Recherche opérationnelle
  • MR11603B : Master Sciences, technologies, santé mention Informatique parcours Systèmes d'information et business intelligence HTT
  • MR11604A : Master Sciences, technologies, santé mention Informatique parcours Traitement de l'information et exploitation des données
  • MR11605A : Master Sciences, technologies, santé mention Informatique parcours Préparation à l'agrégation en informatique
  • MR11606A : Master Sciences, technologies, santé mention Informatique parcours Réseaux et objets connectés
  • CRN0803A : Titre RNCP Niveau 6 Concepteur intégrateur d'infrastructures informatiques (systèmes et réseaux, applicatives, ou de sécurité) parcours Cybersécurité

Prochaines sessions de formation

Filtres :
Centre de formation Semestre
2024/2025
Jours de
formation
Modalité Crédits    
Paris Semestre 2 6 crédits (1)

Date de début des cours (*) :

  • 03/02/2025

* Les dates fournies sont d'ordre général à toutes les formations.
  Les cours pour cette formation peuvent potentiellement commencer un peu plus tard dans le semestre.

Ajouter au panier
Contacter le centre
Légende :
Tarif (1) :

Vous pouvez consulter nos tarifs ici.
Selon votre statut, il existe différents dispositifs de financement qui peuvent financer jusqu'à 100 % de votre formation. Nos chargés de formation en centre vous accompagneront pour constituer votre dossier.

Date de début de cours :
  • Île-de-France :
    • 1er semestre et annuel : 30/09/2024
    • 2e semestre : 17/02/2025
  • Paris :
    • 1er semestre et annuel : 16/09/2024
    • 2e semestre : 03/02/2025

Les dates fournies sont d'ordre général à toutes les formations. Les cours pour cette formation peuvent potentiellement commencer un peu plus tard dans le semestre.

Annuel :

Il s'étend de fin septembre / début octobre à début juillet (dates indicatives, renseignez-vous auprès de votre centre).

Semestre 1 :

Il s'étend de fin septembre / début octobre à fin janvier / début février (dates indicatives, renseignez-vous auprès de votre centre).

Semestre 2 :

Il s'étend de fin février / début mars à début juillet (dates indicatives, renseignez-vous auprès de votre centre).

Cours du soir :

Les cours commencent le plus souvent à 18h30 dans les centres.

  Cours en journée :

Se renseigner auprès du centre pour connaître les horaires.

Cours en ligne :

les cours sont diffusés sous forme de séances numériques via une plateforme d’e-learning animées et tutorées par un enseignant. Des séances de regroupement en visio sont proposées.

  Classe virtuelle (Formation à distance planifiée):

L'enseignant à distance intervient en direct et en visioconférence sur la plateforme d'e-learning. Il complète son intervention par des activités interactives (exercices échanges…)

  Cours en ligne hybride :

Cette modalité associe des cours en ligne tutorées et des regroupements en présentiel obligatoires.

  Cours hybrides :

Cette modalité mixe des cours en présentiel (en cours du soir ou en journée) et des cours en ligne.

  Cours en ligne organisés par un autre
centre CNAM Régional :

Les cours sont diffusés sous forme de séances numériques via une plateforme d'e-learning animées et tutorées par un enseignant.

    Formation co-modale :

Formation proposée en présentiel et à distance en simultané. L'auditeur a la possibilité de choisir de venir sur site pour suivre l'enseignement ou bien de suivre à distance. Les cours se déroulent en semaine généralement après 18h ou le samedi.

Recherche en cours