Outils informatiques de la statistique
STA115


Objectifs pédagogiques :

Maîtrise du langage R et du logiciel SAS pour pouvoir effectuer le traitement et l'analyse statistique des données.

Public et conditions d'accès :
  • Connaissances de base en statistique (au moins une bonne connaissance des statistiques descriptives)
  • Expérience de l'utilisation d'un logiciel informatique.
  • Etre en mesure de : i) comprendre les structures de fichiers et des commandes du système sur son système d'exploitation ii) accéder à des fichiers de données sur son système d'exploitation.
Méthodes de validation :

Les projets consistent en écrire des programmes en utilisant R et SAS. Les programmes serviront à importer des fichiers de données et exporter des objets R (ou des jeux de données SAS), manipuler les données et les analyser à l'aide de procédures statistiques et représentations graphiques adéquates. Pour certains projets, on devra en outre effectuer une analyse des sorties des procédures statistiques et graphiques (interprétation des sorties). Il est demandé de remettre un rapport décrivant la problématique (introduction) et détaillant l'ensemble de la démarche.

Contenu de la formation :


Langage R

  •  Les bases du langage, typologie et propriétés des objets en R
  •  Les données : lecture, manipulation, importation et exportation
  • Analyse exploratoire des données avec les outils graphiques
  • Les analyses statistiques 
  • Ecriture de fonctions


       SAS

  •  Langage SAS de base : gestion des données (étape DATA),
  •                                         procédures usuelles (étape PROC)
  • SAS SQL : gestion des données
  • SAS IML : langage matriciel
  • Langage macro : écriture de macro-programmes
  • SAS Graph : réalisation de graphiques, cartographie élémentaire
  • SAS/STAT pour l'analyse unidimensionnelle/multidimensionnelle et l'analyse prédictive

 

Bibliographie :
  • Langage R :: Manuels téléchargeables gratuitement à l'adresse : http://cran.r-project.org/manuals.html
  • Hélène Kontchou-Kouomegni & Olivier Decourt: SAS Maîtriser SAS Base et SAS Macro SAS 9 et versions antérieures (DUNOD - 2004)
  • Pierre Lafaye de Micheaux , Rémy Drouilhet, Benoît Liquet: Le logiciel R Maîtriser le langage - Effectuer des analyses statistiques (Springer 2010)
  • André Wielki: Pratique de SAS sous Windows 9.2 : http://etudes.ebi-edu.com/sas_pharma/down/AWsas92Vol1.pdf
  • François Husson, Sébastien Lê & Jérôme Pagès: Analyse de données avec R (Presses Universitaires de Rennes 2009)
  • Frédéric Bertrand & Myriam Maumy-Bertrand: Initiation à la statistique avec R (Dunod 2010)

Cette UE apparaît dans les diplômes et certificats suivants :

  • MR12303A : Master Sciences, technologies, santé, mention mathématiques appliquées, statistique parcours Science des données
  • MR12301A : Master Sciences, technologies, santé, mention mathématiques appliquées, statistique parcours Statistique du risque pour la finance et l'assurance
  • CC1200A : Certificat de compétence Data analyst - Chargé(e) d'études statistiques

Prochaines sessions de formation

Recherche en cours