Apprentissage statistique : modélisation descriptive et introduction aux réseaux de neurones
RCP208


Objectifs pédagogiques :

Ce cours donne des éléments de base de l'analyse des données et de la modélisation descriptive, ainsi que des principes à mettre en œuvre pour traiter des applications réelles. Une introduction à la modélisation décisionnelle avec des réseaux de neurones est également présentée. L'analyse des données et la modélisation descriptive aident à comprendre les données empiriques issues de phénomènes naturels, économiques ou socio-culturels. Cette compréhension facilite la mise en œuvre de méthodes performantes de construction de modèles décisionnels.
Les méthodes abordées ont de très nombreuses applications dans des domaines aussi divers que l'assurance qualité, les enquêtes d'opinion, le marketing, la gestion de la relation client, la climatologie, la sécurité, etc.
L'enseignement adopte une approche pragmatique, les séances de travaux pratiques permettant la mise en œuvre systématique des méthodes présentées.
Les unités d'enseignement RCP209 « Apprentissage statistique : modélisation décisionnelle et apprentissage profond », RCP211 « Intelligence artificielle avancée » et RCP217 « Intelligence artificielle pour des données multimédia » sont des suites recommandées de RCP208.

Public et conditions d'accès :

Cet enseignement s'adresse aux auditeurs souhaitant acquérir des connaissances de base sur l'analyse des données, la reconnaissance des formes et la fouille de données (data mining).
Prérequis obligatoires : avoir suivi le cycle préparatoire de l'EICNAM ou avoir un niveau équivalent (licence).

Compétences :

Analyse des données, modélisation descriptive à partir de données, introduction à la modélisation décisionnelle avec application à la reconnaissance des formes et à la fouille de données.

Méthodes de validation :

Examen ; certaines questions peuvent porter sur les travaux pratiques.

Contenu de la formation :

Les thèmes abordés dans les séances de cours et de travaux pratiques (TP) sont :

  • Applications, nature des problèmes de modélisation et spécificités des données.
  • Analyse des données, réduction de dimension : méthodes factorielles.
  • Réduction non-linéaire de dimension : UMAP, t-SNE.
  • Sélection de variables.
  • Classification automatique : k-moyennes, DBSCAN.
  • Estimation de densités : noyaux, modèles de mélange.
  • Imputation des données manquantes.
  • Réseaux de neurones multi-couches : architectures, capacités d'approximation, apprentissage et régularisation, explicabilité.

Chaque séance de cours est suivie d'une séance de TP permettant de mettre en œuvre les méthodes présentées.
Les TP sont réalisés en utilisant principalement la plateforme Scikit-learn. Une introduction rapide au langage Python, à NumPy, à matplotlib et à Scikit-learn est prévue lors des premières séances de TP.

Bibliographie :
  • A. Belaid, Y. Belaid: Reconnaissance des formes : méthodes et applications. Ed. Inter Editions.
  • G. Dreyfus, et al: Réseaux de neurones : méthodologies et applications. Ed. Eyrolles.
  • M. Crucianu, J.-P. Asselin de Beauville, R. Boné: Méthodes factorielles pour l'analyse des données : méthodes linéaires et extensions non-linéaires. Ed. Hermès.
  • G. Saporta: Probabilités, analyse des données et statistique. Ed. TECHNIP.
  • D.J. Hand, H. Mannila, P. Smyth: Principles of Data Mining (Adaptive Computation and Machine Learning). Ed. Bradford Book.

Cette UE apparaît dans les diplômes et certificats suivants :

  • CS9700A : Certificat de spécialisation Intelligence artificielle
  • CS10900A : Certificat de spécialisation Intelligence artificielle et calcul scientifique
  • CYC9102A : Diplôme d'ingénieur Spécialité informatique parcours Intelligence Artificielle et Optimisation
  • CYC9106A : Diplôme d'ingénieur Spécialité informatique parcours Cybersécurité
  • MR11602A : Master Sciences, technologies, santé mention Informatique parcours Recherche opérationnelle
  • MR11603B : Master Sciences, technologies, santé mention Informatique parcours Systèmes d'information et business intelligence HTT
  • MR11604A : Master Sciences, technologies, santé mention Informatique parcours Traitement de l'information et exploitation des données

Prochaines sessions de formation

Filtres :
Centre de formation Semestre
2024/2025
Jours de
formation
Modalité Crédits    
Paris Semestre 2 6 crédits (1)

Date de début des cours (*) :

  • 03/02/2025

* Les dates fournies sont d'ordre général à toutes les formations.
  Les cours pour cette formation peuvent potentiellement commencer un peu plus tard dans le semestre.

Ajouter au panier
Contacter le centre
Légende :
Tarif (1) :

Vous pouvez consulter nos tarifs ici.
Selon votre statut, il existe différents dispositifs de financement qui peuvent financer jusqu'à 100 % de votre formation. Nos chargés de formation en centre vous accompagneront pour constituer votre dossier.

Date de début de cours :
  • Île-de-France :
    • 1er semestre et annuel : 30/09/2024
    • 2e semestre : 17/02/2025
  • Paris :
    • 1er semestre et annuel : 16/09/2024
    • 2e semestre : 03/02/2025

Les dates fournies sont d'ordre général à toutes les formations. Les cours pour cette formation peuvent potentiellement commencer un peu plus tard dans le semestre.

Annuel :

Il s'étend de fin septembre / début octobre à début juillet (dates indicatives, renseignez-vous auprès de votre centre).

Semestre 1 :

Il s'étend de fin septembre / début octobre à fin janvier / début février (dates indicatives, renseignez-vous auprès de votre centre).

Semestre 2 :

Il s'étend de fin février / début mars à début juillet (dates indicatives, renseignez-vous auprès de votre centre).

Cours du soir :

Les cours commencent le plus souvent à 18h30 dans les centres.

  Cours en journée :

Se renseigner auprès du centre pour connaître les horaires.

Cours en ligne :

les cours sont diffusés sous forme de séances numériques via une plateforme d’e-learning animées et tutorées par un enseignant. Des séances de regroupement en visio sont proposées.

  Classe virtuelle (Formation à distance planifiée):

L'enseignant à distance intervient en direct et en visioconférence sur la plateforme d'e-learning. Il complète son intervention par des activités interactives (exercices échanges…)

  Cours en ligne hybride :

Cette modalité associe des cours en ligne tutorées et des regroupements en présentiel obligatoires.

  Cours hybrides :

Cette modalité mixe des cours en présentiel (en cours du soir ou en journée) et des cours en ligne.

  Cours en ligne organisés par un autre
centre CNAM Régional :

Les cours sont diffusés sous forme de séances numériques via une plateforme d'e-learning animées et tutorées par un enseignant.

    Formation co-modale :

Formation proposée en présentiel et à distance en simultané. L'auditeur a la possibilité de choisir de venir sur site pour suivre l'enseignement ou bien de suivre à distance. Les cours se déroulent en semaine généralement après 18h ou le samedi.

Recherche en cours