Apprentissage statistique : modélisation décisionnelle et apprentissage profond
RCP209


Objectifs pédagogiques

Ce cours présente des méthodes de modélisation décisionnelle à partir des données, notamment à travers les machines à vecteurs supports (SVM), les réseaux de neurones profonds, et la prédiction structurée, en vue de leur utilisation dans des applications réelles.
L'apprentissage automatique permet de construire, à partir des données empiriques, des modèles pour la prise de décision. Les méthodes abordées ont de très nombreuses applications dans des domaines aussi divers que l'assurance qualité, le diagnostique médical, les véhicules autonomes, la bio-ingénierie, la climatologie, la sécurité environnementale, le marketing, la gestion de la relation client, la recherche d'information, etc.

Public et conditions d'accès

Cet enseignement s'adresse aux auditeurs souhaitant acquérir des connaissances sur la modélisation à partir des données pour la reconnaissance des formes et la fouille de données (data mining).
Prérequis obligatoires : avoir suivi la première partie du cycle spécialisation de l'EICNAM ou avoir le niveau M1 (Bac + 4). Il est fortement recommandé d'avoir suivi au préalable l'UE RCP208 « Reconnaissance des formes et méthodes neuronales » ou un enseignement équivalent comportant une présentation des méthodes de base d'analyse des données et de modélisation descriptive des données.

Compétences

Modélisation décisionnelle à partir de données, avec application à la reconnaissance de formes et à la fouille de données.

Méthodes de validation

La note finale est la moyenne non pondérée entre la note obtenue au projet et la note obtenue à l'examen final.

Contenu de la formation

Les thèmes abordés dans les séances de cours et de travaux pratiques (TP) sont :

  • Apprentissage supervisé : discrimination, régression, prédiction structurée.
  • Evaluation et sélection de modèles.
  • Arbres de décision et forêts d'arbres de décision (random forest).
  • Machines à vecteurs de support (SVM) : discrimination, régression, estimation du support d'une distribution, ingénierie des noyaux.
  • Réseaux de neurones, apprentissage de représentations, apprentissage profond (deep learning).
  • Modèles graphiques, apprentissage structuré.

Chaque séance de cours est suivie d'une séance de travaux pratiques (TP) permettant de mettre en œuvre les méthodes présentées.
Les TP sont réalisés en utilisant les plateformes Scikit-learn et Keras. Une introduction à Scikit-learn et à Keras est prévue lors des séances de TP.

Bibliographie
  • G. Dreyfus et al: Réseaux de neurones ( Eyrolles).
  • A. Cornuéjols et al: Apprentissage artificiel : Concepts et algorithmes (Eyrolles)
  • P. Naim et al: Réseaux bayésiens (Eyrolles).
  • B. Scholkopf, A. J. Smola: Learning With Kernels: Support Vector Machines, Regularization, Optimization and Beyond (MIT Press).
  • T. Hastie et al: The Elements of Statistical Learning: Data Mining, Inference, and Prediction (Springer).
  • F.V. Jensen: Bayesian Networks and Decision Graphs ( Springer-Verlag).
  • C.M. Bishop: Neural Networks for Pattern Recognition (Oxford University Press)

Cette UE apparaît dans les diplômes et certificats suivants :

  • CS9700A : Certificat de spécialisation Intelligence artificielle
  • MR11604A : Master Sciences, technologies, santé mention Informatique parcours Traitement de l'information et exploitation des données
  • CYC9102A : Diplôme d'ingénieur Spécialité informatique parcours Informatique modélisation optimisation
  • CYC9106A : Diplôme d'ingénieur Spécialité informatique parcours Cybersécurité

Prochaines sessions de formation

Recherche en cours ...