Journée Système (JoSy) : La reproductibilité en pratique : méthodes et outils
→
Europe/Paris
amphithéâtre Lederer (Villeurbanne)
amphithéâtre Lederer
Villeurbanne
ICBMS - Bâtiment Lederer 1 Rue Victor Grignard 69100 Villeurbanne
https://www.univ-lyon1.fr/campus/plan-des-campus/batiment-edgar-lederer-945443.kjsp?RH=1401954787115
Description
Pour sa 11ème journée, ARAMIS, en collaboration avec RESINFO a souhaité explorer la reproductibilité sous toutes ces formes et les questions associées.
- Comment assurer la protection, la qualité et la traçabilité des données ?
- Comment stocker, protéger et exploiter ces données ?
- Quel code : comment l'écrire, le stocker et garantir son exécution dans le temps ?
- Es-ce que l'approche via des conteneur répond à cette problématique ?
-
- 09:00 → 09:15
- 09:15 → 10:00
-
10:00
→
10:30
SIDUS : c'est un “grand pas” pour la déduplication. Un unique “petit pas” pour la reproductibilité ? 30mAu delà de son aspect “pratique” (“on n'installe plus les machines, on les démarre !”), SIDUS apporte une reproductibilité totale du système d'exploitation, dans le temps (sur une même machine à des instants différents) ou dans l'espace (sur des machines déployées au même instant). A travers quelques exemples du Centre Blaise Pascal, nous verrons que, lorsque des variabilités (notamment temporelles) apparaissent sur des installations sous un même SIDUS, les origines sont à rechercher ailleurs : matériel, BIOS, conditions climatiques… Nous concluerons que, si des solutions à base de conteneurs présentent la racine d'un système comme le graal de la reproductibilité, il n'en est rien : SIDUS vous prouvera le contraire !Orateur: E. Quemener (ENS Lyon)
-
10:30
→
10:45
PAUSE 15m
-
10:45
→
11:30
La reproductibilité au service de la Biologie computationnelle 45mLes outils de reproductibilité choisis ont tous des équivalents fonctionnels (docker/singularity, snakemake/nextflow, jupyter/Rmarkdown, …) Une étude récente publiée dans Nature a montré que près de 70% des expériences en Biologie ne sont pas reproductibles. Il est donc indispensable de mettre en place des bonnes pratiques afin de garantir l’intégrité des données et la reproductibilité des résultats d’analyse. Concernant les données, les principes FAIR-data sont de plus en plus utilisés. Ces mêmes principes peut être détournés au service des analyses pour garantir des résultats identiques à partir d’un même jeu de données et au cours du temps..L’objectif de cette présentation est de proposer un panel de fonctionnalités permettant de rendre reproductible une analyse complète de bioinformatique. L’exemple présenté a pour but de sélectionner des gènes qui ne se comportent pas de la même façon entre deux conditions expérimentales. Les fonctionnalités présentées ne sont pas dépendantes de cet exemple. En effet, elles peuvent être appliquées à n'importe quelle autre question biologique.Brièvement, nous récupérons les données depuis les bases de données publiques (ENA/SRA), nous réalisons une analyse reproductible avec un système de workflow (snakemake) dans un environnement virtuel (docker) dont l'ensemble du code, versionné (git), est disponible en open source (Github et dockerhub). La visualisation des résultats est dynamique (shiny app) et un rapport (Rmarkdown) en pdf ou html est disponible. Il regroupe les résultats de l’analyse et détaille l’ensemble des paramètres choisis par l'utilisateur.Orateur: T. Denecker (I2BC, Gif-Sur-Yvette)
- 11:30 → 12:00
-
12:00
→
14:00
Repas 2h
- 14:00 → 14:07
- 14:08 → 14:15
-
14:15
→
15:00
Présentation du MOOC Recherche Reproductible 45mUtilisation d'un serveur Gitlab pour réaliser tous les exercices du MOOC, d'un espace personnel Jupyter par apprenant (Jupyterhub) avec un système de gestion de version simplifié.Orateurs: B. Rospars (INRIA Grenoble), L. Farhi (INRIA Grenoble)
- 15:00 → 15:30
-
15:30
→
15:45
PAUSE 15m
- 15:45 → 16:30
- 16:30 → 17:00
- 17:00 → 17:30