Entreposage et fouille de données
STA211


Public et conditions d'accès

être admis en M2 du master STIC, mention statistique ou être agréé.

La demande d'agrément est à faire uniquement pour les auditeurs qui souhaitent suivre STA211 en présentiel au semestre 1. Pour obtenir l'agrément, les auditeurs adresseront, à partir du 25 Août,   par courrier électronique à l'enseignant responsable : ndeye.niang_keita@cnam.fr, un CV détaillé et une lettre de motivation indiquant les raisons de  la demande et le projet pédagogique dans lequel elle s'inscrit . Une réponse sera donnée dans un délai d'une dizaine de jours.
Niveau requis : NFA008 (bases de données) et STA101 (analyse des données, méthodes descriptives). Ces prérequis sont indispensables pour obtenir l'agrément. Vérifier avant d'envoyer une demande d'agrément.

Contenu de la formation

Modèles prévisionnels et systèmes de gestion de l'entreprise
- structures spécifiques des bases de données de Data warehouse (star schema)
- OLAP
Méthodologies générales
- Méthodologies de Data Mining
Pré-traitement des données
- Analyses de la qualité des données,
- Techniques d'appréhension des valeurs manquantes ou aberrantes
- Techniques de construction de bases de travail (agrégations, etc. . . )
Données et techniques de fouille
Méthodes non supervisées :
- Cartes de Kohonen,  Règles d'association 
Méthodes supervisées :
- Rappels de théorie de l'apprentissage
- Arbres de décision, forêts aléatoires, SVM, Réseaux de neurones, deep learning
- Méta-algorithmes :
- boosting, bagging
Fouille dans de nouveaux types de données et méthodes associées :
- Données textuelles - Données multivues - Images et Multimedia
Outils :
- Environnements freeware : R, Python
- Outils spécifiques : SAS-EM,  SPAD
- Data Mining et bases de données : OLAP Business Object

Bibliographie
  • M.BARDOS: Analyse discriminante (Dunod, 2001)
  • G.SAPORTA: Probabilités, analyse des données et statistique (Technip, 2006)
  • S.TUFFERY: Data mining et statistique décisionnelle (Technip, 2005)
  • S.TUFFERY: Etude de cas en statistique décisionnelle (Technip, 2009)
  • T.HASTIE, J.FRIEDMAN, F.TIBSHIRANI: Elements of Statistical Learning (Springer, 2009)
  • G.GOVAERT (ed): Analyse des données (Hermes,2003)
  • L. LEBART, A. MORINEAU, M. PIRON: Statistique exploratoire multidimensionnelle (1995)
  • J.P.NAKACHE, J.CONFAIS: Statistique explicative appliquée (Technip, 2003)
  • James, Witten, Hastie, & Tibshirani: An Introduction to Statistical Learning (2013) Téléchargeable ici:http://web.stanford.edu/~hastie/local.ftp/Springer/ISLR_print1.pdf

Cette UE apparaît dans les diplômes et certificats suivants :

  • CS5900A : Certificat de spécialisation Analyste de données massives
  • CS8800A : Certificat de spécialisation Bio-informatique avancée
  • MR12303A : Master Sciences, technologies, santé, mention mathématiques appliquées, statistique parcours Science des données
  • CYC9102A : Diplôme d'ingénieur Spécialité informatique parcours Informatique modélisation optimisation

Prochaines sessions de formation

Filtres :
Centre de formation Semestre
2021/2022
Jours de
formation
Modalité Tarif    
Paris Semestre 2 270 € Inscription fermée

Date de début des cours (*) : 20/09/2021

* Les dates fournies sont d'ordre général à toutes les formations.
Les cours pour cette formation peuvent potentiellement commencer un peu plus tard dans le semestre.

Paris
Semestre 2
Cours en ligne
270 €
Légende :
Tarif :

Seul le financement à titre individuel est proposé à l'inscription en ligne. Si vous souhaitez financer votre formation par votre entreprise, vous devez demander un devis auprès de nos centres Tarifs en vigueur depuis le 17 juin 2020.

Date de début de cours :

Les dates fournies sont d'ordre général à toutes les formations. Les cours pour cette formation peuvent potentiellement commencer un peu plus tard dans le semestre.

Annuel :

Il s'étend de fin septembre / début octobre à début juillet (dates indicatives, renseignez-vous auprès de votre centre).

Semestre 1 :

Il s'étend de fin septembre / début octobre à fin janvier / début février (dates indicatives, renseignez-vous auprès de votre centre).

Semestre 2 :

Il s'étend de fin février / début mars à début juillet (dates indicatives, renseignez-vous auprès de votre centre).

Cours du soir :

Les cours commencent le plus souvent à 18h30 dans les centres.

  Cours en journée :

Se renseigner auprès du centre pour connaître les horaires.

Cours en ligne :

Les cours sont diffusés sous forme de séances numériques via une plateforme d'e-learning animées et tutorées par un enseignant. Des regroupements peuvent être proposés dont certains sont obligatoires.

  Cours hybrides :

Cette modalité mixe des cours en présentiel (en cours du soir ou en journée) et des cours en ligne.

  Cours en ligne organisés par un autre
centre CNAM Régional :

Les cours sont diffusés sous forme de séances numériques via une plateforme d'e-learning animées et tutorées par un enseignant.

Recherche en cours ...