Rencontres R 2015 - Grenoble

Conférence
Date de publication

24 juin 2015

Les 4e Rencontres R ont eu lieu à Grenoble du 24 au 26 juin 2015 (site web).

Conférenciers invités

R permet de simplifier les chaînes de traitements d’analyse spatiale et de cartographie qui nécessitait auparavant l’utilisation de nombreux logiciels (souvent propriétaires). A partir d’exemples nous illustrerons les différentes étapes du traitement de l’information géographique (acquisition et mise en forme, traitements, représentations). Nous aborderons notamment l’utilisation d’API de cartographie, la manipulation et la représentation de données géographiques (flux, stocks…), les opérations classiques de géotraitement ainsi que des traitements plus poussés faisant notamment appel aux méthodes de lissage spatial.

L’analyse statistique de données spatiales fait appel à des méthodes d’exploration et de modélisation qui sont propres à la nature «spatiale » des données. A partir d’études de cas, on essaiera de montrer un aperçu des méthodes et librairies R qui traitent des trois principaux courants de la statistique spatiale : l’économétrie spatiale (spdep, [Bivand et al., 2013]), les processus ponctuels spatiaux (spatstat, [Baddeley et Turner, 2005]) et la géostatistique (geoR, [Diggle et Ribeiro, 2007])

L’objectif de cet exposé est de montrer comment R peut être utilisé pour présenter (quasi) tous les aspects de la science des données : récupération des données, nettoyage, traitement statistique etvisualisation. Je m’appuierai pour cela sur deux programmes deformations récemment créés : le parcours Data Science du M2 Mathématique et applications Paris Saclay et le Data Science Starter Program, une formation continue proposée par l’École polytechnique.

R est devenu la lingua-franca de nombreux domaines grâce à sa concision, ses NAs, ses objets et la possibilité d’exprimer symboliquement des formules. Les informaticiens n’y ont vu jusqu’à récemment qu’un outil pour tracer des graphes et non un langage. A l’origine (et encore aujourd’hui), les programmes sont développés en R, puis optimisés en C. Ceci requiert des doubles compétences de la part des programmeurs, augmente le risque d’erreur dans le code tout en le rendant difficilement maintenable.

En tant qu’informaticien notre rôle n’est pas de juger le langage mais d’offrir des performances acceptables pour l’utilisateur final tout en préservant sa sémantique qui est malheureusement non spécifiée. Pour extraire cette sémantique, il nous a fallu regarder sous le capot, et c’est ainsi que le cauchemar a commencé …

Tutoriels

Programme des rencontres
auteurrices titre mots_cles
François Husson, Pauline Vaissié, Astrid Monge Graphiques interactifs en analyse de données avec Factoshiny
Benoit Thieurmel visNetwork : création et visualisation intéractives de réseaux
Madalina Olteanu, Nathalie Villa-Vialaneix Classification et visualisation de graphes avec SOMbrero
Marie De Antonio Un package R pour modéliser la survie en tenant compte des effets centres et des risques compétitifs
Frédérique Letué, Caroline Bazzoli, Marie-José Martinez Une étude de cas en biomécanique avec la fonction lme de R pour modéliser des structures complexes d'effets aléatoires et de matrice de variance-covariance des erreurs
Florent Chuffart, Helene Duplus-Bottin, Daniel Jost, Gaël Yvert A General Method to map Single-cell Probabilistic Trait Loci of the Genome
Julien Péron An extension to generalized pairwise comparisons for prioritized outcomes with censoring
Michael Gb Blum abc : un paquetage R pour le calcul bayésien approché
Eric Matzner-Lober, Pierre-André Cornillon ibr: un paquet R pour la réduction itérative de biais
Robin Genuer, Adrien Todeschini Compétitions d'apprentissage automatique avec le package rchallenge
Vincent Guyader Datacamp : Apprendre R, en faisant du R, dans R...et en français.
Philippe Courcoux FreeSortR : un package pour l'analyse de données de tri libre.
Sébastien Plutniak L'histoire en miettes : analyse de graphes avec R pour l'étude de la fragmentation des objets archéologiques
Adrien Mazoyer, Stéphane Despreaux, Bernard Ycart Modèles de mutations : étude probabiliste et estimation paramétrique
Hugo Varet, Jean-Yves Coppée, Marie-Agnès Dillies SARTools : un pipeline complet pour l'analyse différentielle de données RNA-Seq
Antoine Schorgen, Nadine Hilgert Validation de données en phénotypage végétal
Marie Chavent, Marc Fuentes Clustering divisif monothétique. La package divclust
Evelyne Vigneau, El Mostafa Qannari Classification de variables avec possibilité de mettre à l'écart des variables atypiques ou de bruit. Implémentation dans le package ClustVarLV.
Florent Langrognet Etude de la robustesse de RMixmod (package de classification par modèles de mélanges) en cas de chevauchement de classes
Didier Girard An experimental assessment of the "Gibbs-Energy and Empirical-Variance" estimating equations (via Kalman smoothing) for Matérn processes
Artemis Toumazi, Kenneth Knoblauch, Henry Kennedy, Martin Privat Bayesian Analysis of Connectivity in Macaque Cerebral Cortex using JAGS and Stan
FranÇois Bartolo, Sébastien Déjean, Benoit Gautier, Ignacio González, Florian Rohart, Kim-Anh Lê Cao Computational optimisation for mixOmics, the R package dedicated to 'omics' data integration
Magali Berland, Emmanuelle Le Chatelier, Edi Prifti, Nicolas Pons, Anne-Sophie Alvarez, Ndeye Gaye, Jean-Michel Batto, Vincent Ducrot, Kévin Juilly, Sébastien Monot, Thierry Goubier, Nahid Emad, Dusko Ehrlich Identifier des biomarqueurs en métagénomique quantitative : la promesse du Big Data
Clement Abbatecola, Kenneth Knoblauch, Peggy Gerardin, Henry Kennedy Maximum likelihood conjoint measurement: From GLM to GAM
Aurore Archimbaud, Anne Ruiz Gazen, Klaus Nordhausen Packages R pour la détection d'observations atypiques multivariées.
Benoit Liquet BIG-SIR a Sliced Inverse Regression Approach for Massive Data
Iyad Alshabani, Jean-Michel Batto, Magali Berland, Denis Caromel, Ndeye Aram Gaye, Emmanuelle Le Chatelier, Laurent Pellegrino, Nicolas Pons, Edi Prifti, Fabien Viale PARConnector : sans détour du Langage R au Cloud Big Data - Application à l'analyse Metagenomique
Serge Iovleff Rtkpp: Un package pour faire l'interface entre R et la bibliothèque STK++
David Gohel Reporting automatisé avec ReporteRs et rtable
Emmanuel Rousseaux, Gilbert Ritschard The Rsocialdata.network extension: Handling and analysing egocentric network survey data in R
Juhui Wang, Hervé Monod, Robert Faivre, Hervé Richard «MTK» : un package pour unifier les démarches d'exploration numérique de modèles
Gérard Grégoire, Jean-Pierre Imbert ClustInvest : outils pour l'analyse et l'interprétation de classifications nonsupervisées avec variables binaires. Application à des données d'accidents de décompression
Alexis Arnaud, Florence Forbes, Benjamin Lemasson, Emmanuel Barbier Paquet R pour l'estimation d'un mélange de lois de Student multivariées à échelles multiples.
Amaury Labenne, Marie Chavent, Vanessa Kuentz-Simonet, Jérôme Saracco Le package ClustGeo : Classification ascendante hiérarchique avec contraintes de proximité géographique
Charles Bouveyron, Julien Jacques funFEM: an R package for functional data clustering
Christophe Genolini kmlShape : un algorithme de partitionnement des données longitudinales basé sur la forme des trajectoires
Brice Ozenne MRIaggr : un package pour la gestion et le traitement de données multivariées d'imagerie
Olivier Francois LEA : un package R pour la génomique des populations