Business Intelligence (1) - Data Warehouses
NFE211


Objectifs pédagogiques :

Acquérir une compréhension solide de la Business Intelligence (BI) et, plus largement, de l'ensemble des processus et composants d'une architecture décisionnelle centrée sur un entrepôt de données (Data Warehouse).

Cette UE met l'accent sur :

  • la conception d'un entrepôt de données (modélisation multidimensionnelle, faits/dimensions, granularité, historisation) ;
  • la mise en œuvre opérationnelle, avec un focus particulier sur la chaîne BI  : Data Warehouse – ETL – Data Mart – Reporting

À l'issue du module, l'auditeur est capable de définir une architecture BI, de concevoir un schéma d'entrepôt adapté aux besoins métiers et de mettre en place un flux ETL.

Remarque : pour une maîtrise complète du cycle décisionnel — de la gestion/valorisation des données jusqu'à leur analyse avancée (Data Science) — il est recommandé de suivre également le NFE212 (semestre 2), qui fait suite au NFE211 (semestre 1). 

Public et conditions d'accès :

Ce cours est destiné aux auditeurs préparant le diplôme d'ingénieur en informatique option Systèmes d'information et Business Intelligence ainsi qu'à ceux inscrits au Master Informatique, parcours Systèmes d'information et Business Intelligence.


Prérequis : Bonnes connaissances en bases de données et en systèmes d'information.

Compétences :

Capacité d'intégration dans une équipe de développement de système d'information décisionnel. En particulier compétences en conception et exploitation d'entrepôts de données :

  • Capacité à concevoir et implémenter la partie ETL d'un Data Warehouse
  • Capacité à concevoir et implémenter des cubes décisionnels
  • Capacité à concevoir dans sa totalité une chaîne décisionnelle
  • Capacité à mettre en œuvre une chaîne décisionnelle à l'aide des outils du marché
  • Capacité à exploiter une chaîne décisionnelle
  • Capacité à gérer l'intégration des données
  • Capacité à gérer un projet décisionnel
Méthodes de validation :

Examen final

Contenu de la formation :

Introduction

  • La Business Intelligence
  • Business Intelligence et Big Data
  • Objectifs d'un entrepôt de données
  • OLAP versus OLTP

Architecture d'un entrepôt de données

  • Architecture matérialisée /architecture médiateur
  • Dualité Entrepôt / magasins, Architecture de Inmon, Architecture de Kimball
  • Data Warehouse / Data Lake
  • Les méta-données, gestion, standardisation

Modélisation multidimensionnelle

  • La modélisation multidimensionnelle, faits, dimensions, hiérarchies, indicateurs
  • Modèles OLAP, ROLAP, MOLAP 
  • Modélisation en étoile, en flocon, en constellation
  • Les dimensions à changement lent (slowly changing dimension) 


Ingénierie d'extraction et d'intégration des données

  • L'extraction des données
  • Le nettoyage des données
  • L'intégration sémantique des données
  • Le rafraichissement des données
  • Solution par outils ETL

Business intelligence et Big data 

  • Data Lake 
  • Modern Data Warehouse
  • Data Fabric
  • Data Lakehouse

Environnement technologique

  • ETL : SQL Server Integration Services (Microsoft SSIS)
Bibliographie :
  • M. Jarke , M. Lenzerini, Y. Vassiliou, P. Vassiliadis: Fundamentals of datawarehouses (2d édition, Springer, 2003).
  • E. Métais: Systèmes d'aide à la décision et entrepôts de données (Encyclopedia Universalis) http://www.universalis.fr/encyclopedie/systemes-informatiques-systemes-d-aide-a-la-decision/
  • W.H. Inmon: Building the Datawarehouse
  • Kimball R, Ross M.: Entrepôts de données, guide pratique de modélisation multidimensionnelle, Vuibert 2003

Cette UE apparaît dans les diplômes et certificats suivants :

  • MR11603A : Master Sciences, technologies, santé mention Informatique parcours Systèmes d'information et business intelligence
  • MR11604A : Master Sciences, technologies, santé mention Informatique parcours Traitement de l'information et exploitation des données
  • CS14400A : Certificat de spécialisation Business Intelligence
  • CYC9105A : Diplôme d'ingénieur Spécialité informatique parcours Informatique systèmes d'information
  • MR11603B : Master Sciences, technologies, santé mention Informatique parcours Systèmes d'information et business intelligence HTT

Prochaines sessions de formation

Recherche en cours