Bioinformatique, gestion des données et système d’information

WP leader: Johann Joets (UMR GV)

Partenaires impliqués : UMR GV, URGI, Biogemma

Contexte et objectifs:

AMAIZING générera et utilisera un vaste spectre de données hétérogènes incluant des millions de lectures de séquences (WP3), des données de génotypage (WP4) et de phénotypage (WP5). Ces données devront être stockées correctement et traitées avant d’être mises à disposition des partenaires du projet et, par la suite, de la communauté européenne.

Le WP2 a pour objectif de fournir aux partenaires des outils et un système d’information (SI), une assistance technique, de la programmation scientifique, de la gestion de bases de données, de la formation à l’utilisation de logiciels scientifiques et de bases de données pour faire face à cette énorme masse de données.

Le WP2 :

  • Mettra à disposition des autres WPs les supports informatiques, développera et gérera les bases de données et les interfaces, et créera les outils d’analyse de données.
  • Fournira des services bien adaptés aux contraintes matérielles et des solutions pour améliorer les logiciels existants en les adaptant à l’ordinateur du cluster (parallélisation) ou, si possible à l’ordinateur avec une architecture 64 bits, nécessaire pour gérer la mémoire vive (RAM).
  • Implémentera les différentes bases de données (ThaliaDB, GnpIS, Phenome (Ephesis),…) avec les données issues des différents workpackages, assurera l’échange des données entre les producteurs, les utilisateurs et le stockage, ainsi que la promotion de l’utilisation de formats standard et d’ontologie, si possible, et assurer le lien avec les centres de données internationaux pour l’échange de donnnées selon les règles définies dans le projet
  • Créera un système d’information dédié aux données  d’AMAIZING (AIS) relié aux architectures existantes et au système d’information GnpIS de l’URGI, à la base de donnée ThaliaDB de l’UMR GV et à BioMercator, et intégré à un portail web présentant un ensemble de services permettant de traiter les requêtes spécifiques des sélectionneurs et des généticiens.

Livrables

D2.1.1: Définition des logiciels et interface (URGI, Mois 12)

D2.1.2: Sessions de formation sur l’AIS (URGI, chaque année à partir de M36)

D2.2.1: Rapport sur les tests les nouvelles ressources hardware (le Moulon, M24)

D2.2.2: Revue de logiciel optimise pour le traitement intensif (le Moulon, M24, M36, M48)

D2.3: Mises à jour des bases de données (BGA, mises à jour mineures tous les 6 mois, mises à jour majeures tous les ans)

D2.4.1: Mises à jour du portail web AIS (incluant GnpIS base de données et mises à jour de ThaliaDB updates, revue des services web, datamarts, requêtes des sélectionneurs et des généticiens) (URGI Une mise à jour majeure tous les ans et une mineure tous les 6 mois)

D2.4.2: Revue de BioMercator v5 (Le Moulon, M36)