Données ouvertes et liées (open data, linked data)
NTD212


Objectifs pédagogiques :

Objectif : comprendre et utiliser la collecte et l'enrichissement des données pour l'environnement documentaire

Ce module introduit les classifications sur le web, la modélisation et la représentation des connaissances, les ontologies et le web sémantique, les modèles de métadonnées en gestion de l'information et les humanités numériques.

Il a pour objectif opérationnel de collecter et préparer les données pour enrichir les collections des humanités numériques et générer des visualisations sur des tableaux de bords ou insérables dans des rapports. Les domaines intéressés sont ceux qui construisent des connaissances ; le secteur culturel y est privilégié.

Public et conditions d'accès :

Cette UE, à distance, nécessite d'être inscrit au premier semestre (avant novembre) pour son démarrage en janvier. Elle se déroule jusqu'en mars et s'adresse prioritairement aux spécialistes de l'information (documentaliste, bibliothécaire, secrétaire d'édition, secrétaire de rédaction, journaliste, veilleur, etc.) mais peut également concerner les professionnels proches de ces fonctions et désireux d'élargir leur champ d'action. Elle est intégrée au certificat CS22, "Les TIC dans les SID", formation à distance de conception et gestion de systèmes d'information documentaire.
Cette UE peut entrer dans le parcours d'une VAE.

Compétences :
  • Comprendre le web de données
  • Comprendre les principes de construction d'une ontologie
  • Etre capable d'intervenir dans la conception et la gestion de projets d'Humanités Numériques
  • Exploiter les données en libre accès (open data)
  • Créer des visualisations de données
Méthodes de validation :

Un rendez-vous de travail hebdomadaire : 5 ateliers à distance, 5 réunions de régulation à distance, 5 TP à réaliser.

Travaux individuels et en groupe.

Contenu de la formation :

MÉTHODE D'APPRENTISSAGE

L'étudiant(e) dispose d'un accès à une plate-forme d'enseignement où sont entreposés les cours, les exercices à réaliser en autonomie, le calendrier des visioconférences et des travaux à réaliser, les périodes de tutorat et de restitution des travaux.

PLAN DE TRAVAIL

5 ateliers à distance, 5 réunions de régulation à distance, 5 TP à réaliser

COURS en ligne

XML et les linked data

  • Identification et adressage
  • Typologie et qualité des identifiants
  • Le web de données
  • RDF
  • De la notice aux métadonnées
  • Les bases de SPARQL

Ontologies, terminologies, web sémantique

  • Les ressources sémantiques
  • Les ontologies
  • Evolution des travaux en ingénierie des connaissances
  • Thesaurus vs Ontologie formelle : l'exemple du MeSH
  • Le "cake" du web sémantique et le  "cake" du web de données
  • Création d'une ontologie en OWL avec Protégé 4

Humanités numériques

  • Les données des Humanités Numériques
  • Exploration, interrogation, exploitation des données
  • Processus d'enrichissements
  • Création de nouveaux produits documentaires

Collecte et préparation des données ouvertes

  • Les données ouvertes : définition, intégrité, consistance, authenticité
  • Les outils et services de gestion de données
  • Prise en main d'un outil opensource de collecte et de préparation de données

Datavisualisation

  • Typologie des structures visuelles (quantitatives, temporelles, spatio-temporelles, spatiales)
  • Méthodes statistiques et analytiques
  • Les outils et services de gestion et de visualisation de données
  • Prise en main de services en ligne de génération de visualisations

ATELIERS

  • XML et les linked data
  • Ontologies et web sémantique
  • Humanités numériques
  • Collecter et préparer des données ouvertes
  • Datavisualisation

Cette UE apparaît dans les diplômes et certificats suivants :

  • CS2200A : Certificat de spécialisation Les TIC (technologies de l'information et de la communication) dans les systèmes d'information documentaire

Prochaines sessions de formation

Recherche en cours