Journée Système (JoSy) : La reproductibilité en pratique : méthodes et outils

Europe/Paris
amphithéâtre Lederer (Villeurbanne)

amphithéâtre Lederer

Villeurbanne

ICBMS - Bâtiment Lederer 1 Rue Victor Grignard 69100 Villeurbanne https://www.univ-lyon1.fr/campus/plan-des-campus/batiment-edgar-lederer-945443.kjsp?RH=1401954787115
Description

Pour sa 11ème journée, ARAMIS, en collaboration avec RESINFO a souhaité explorer la reproductibilité sous toutes ces formes et les questions associées.

  • Comment assurer la protection, la qualité et la traçabilité des données ?
  • Comment stocker, protéger et exploiter ces données ?
  • Quel code : comment l'écrire, le stocker et garantir son exécution dans le temps ?
  • Es-ce que l'approche via des conteneur répond à cette problématique ?
    • 09:00 09:15
      Présentation ARAMIS - DR7 - Univ-Lyon 1 / ICBMS 15m
      Orateur: M. Vincent HURTEVENT (ARAMIS)
      Vidéo
    • 09:15 10:00
      Keynote : Les enjeux de “la recherche reproductible” 45m
      Orateur: K. Hinsen (Centre de Biophysique Moléculaire, CNRS Orléans)
      Transparents
      Vidéo
    • 10:00 10:30
      SIDUS : c'est un “grand pas” pour la déduplication. Un unique “petit pas” pour la reproductibilité ? 30m
      Au delà de son aspect “pratique” (“on n'installe plus les machines, on les démarre !”), SIDUS apporte une reproductibilité totale du système d'exploitation, dans le temps (sur une même machine à des instants différents) ou dans l'espace (sur des machines déployées au même instant). A travers quelques exemples du Centre Blaise Pascal, nous verrons que, lorsque des variabilités (notamment temporelles) apparaissent sur des installations sous un même SIDUS, les origines sont à rechercher ailleurs : matériel, BIOS, conditions climatiques… Nous concluerons que, si des solutions à base de conteneurs présentent la racine d'un système comme le graal de la reproductibilité, il n'en est rien : SIDUS vous prouvera le contraire !
      Orateur: E. Quemener (ENS Lyon)
      Transparents
      Vidéo
    • 10:30 10:45
      PAUSE 15m
    • 10:45 11:30
      La reproductibilité au service de la Biologie computationnelle 45m
      Les outils de reproductibilité choisis ont tous des équivalents fonctionnels (docker/singularity, snakemake/nextflow, jupyter/Rmarkdown, …) Une étude récente publiée dans Nature a montré que près de 70% des expériences en Biologie ne sont pas reproductibles. Il est donc indispensable de mettre en place des bonnes pratiques afin de garantir l’intégrité des données et la reproductibilité des résultats d’analyse. Concernant les données, les principes FAIR-data sont de plus en plus utilisés. Ces mêmes principes peut être détournés au service des analyses pour garantir des résultats identiques à partir d’un même jeu de données et au cours du temps..L’objectif de cette présentation est de proposer un panel de fonctionnalités permettant de rendre reproductible une analyse complète de bioinformatique. L’exemple présenté a pour but de sélectionner des gènes qui ne se comportent pas de la même façon entre deux conditions expérimentales. Les fonctionnalités présentées ne sont pas dépendantes de cet exemple. En effet, elles peuvent être appliquées à n'importe quelle autre question biologique.Brièvement, nous récupérons les données depuis les bases de données publiques (ENA/SRA), nous réalisons une analyse reproductible avec un système de workflow (snakemake) dans un environnement virtuel (docker) dont l'ensemble du code, versionné (git), est disponible en open source (Github et dockerhub). La visualisation des résultats est dynamique (shiny app) et un rapport (Rmarkdown) en pdf ou html est disponible. Il regroupe les résultats de l’analyse et détaille l’ensemble des paramètres choisis par l'utilisateur.
      Orateur: T. Denecker (I2BC, Gif-Sur-Yvette)
      Transparents
      Vidéo
    • 11:30 12:00
      Panorama des solutions de diffusions et d’installations des codes logiciels dans un contexte HPC largement multi-utilisateurs 30m
      Orateurs: P.A. Bouttier (UGA Grenoble), V. Louvet (UGA Grenoble)
      Transparents
      Vidéo
    • 12:00 14:00
      Repas 2h
    • 14:00 14:07
      Lightning talk: Pipelines nextflow 7m
      Orateur: J. Ganofsky (ENS Lyon)
      Transparents
      Vidéo
    • 14:08 14:15
      Lightning talk : Portail web pour soumettre et formatter des jeux de données / package R 7m
      Orateur: S. Dray (LBBE)
      Transparents
      Vidéo
    • 14:15 15:00
      Présentation du MOOC Recherche Reproductible 45m
      Utilisation d'un serveur Gitlab pour réaliser tous les exercices du MOOC, d'un espace personnel Jupyter par apprenant (Jupyterhub) avec un système de gestion de version simplifié.
      Orateurs: B. Rospars (INRIA Grenoble), L. Farhi (INRIA Grenoble)
      Transparents
      Vidéo
    • 15:00 15:30
      Au-delà des conteneurs: environnements logiciels reproductibles avec GNU Guix 30m
      Orateur: L. Courtes (INRIA Bordeaux)
      Transparents
      Vidéo
    • 15:30 15:45
      PAUSE 15m
    • 15:45 16:30
      Execo a library to manage unix processes on thousands of remote hosts 45m
      It is well designed for: - prototyping experiments on distributed systems - automatize admin tasks - create reproducible experiments
      Orateur: L. Pouilloux (Ecole centrale, Lyon)
      Transparents
      Vidéo
    • 16:30 17:00
      Bistro: a library to build large-scale workflows in computational biology (OCaml) 30m
      Orateur: P. VEBER (UMR 5558, Lyon)
      Transparents
      Vidéo
    • 17:00 17:30
      La plateforme web “Virtual Imaging Platform” pour une science ouverte et reproductible. 30m
      Orateur: S. POP (Creatis Lyon)
      Transparents
      Vidéo