Le maniement des données, un défi pour la recherche

Icon_noun_Herausforderung_Forschung

La recherche dans le domaine de la santé personnalisée ne cesse de progresser. Les données jouent ici un rôle important. Grâce aux nouvelles technologies, on les génère toujours plus rapidement, leur qualité est meilleure et leurs quantités de plus en plus grandes. Ainsi, par exemple, le séquençage d’un génome entier est aujourd’hui relativement facile et n’est plus très onéreux. La séquence en tant que telle n’apporte toutefois pas de nouvelles connaissances : les données doivent être analysées et interprétées.

La recherche dans le domaine des maladies rares ou, en partie, même très rares vise normalement à trouver dans le génome des patients une ou deux mutations responsables de la maladie. Ces mutations sont souvent les seuls facteurs déclencheurs de la pathologie. Or le défi est de trouver et d’identifier les mutations significatives parmi toutes les altérations du génome. En effet, étant donné que les génomes humains diffèrent par des milliers de paires de base, ceci indépendamment de toute maladie (polymorphisme normal), il est nécessaire de disposer de systèmes informatiques très performants afin d’identifier les différences spécifiques de la pathologie. La recherche de la mutation responsable de la maladie est donc souvent comparée à la recherche d’une aiguille dans une botte de foin.

Pour l’exploration de maladies non rares, les maladies cardiovasculaires par exemple, de grands ensembles de données sont également essentiels. Dans la plupart des cas, ces maladies ne sont pas seulement déterminées génétiquement, mais résultent de l’interaction de facteurs génétiques et environnementaux. Pour en comprendre la cause, il faut, ici en particulier, de grandes quantités de données issues d’une population aussi hétérogène que possible. C’est la seule façon de rechercher quelles sont les modifications génétiques pertinentes ou non.

Chaque séquençage complet d’un génome humain génère un volume de données d’au moins 300 giga-octets, ainsi les chercheurs ont besoin de moyens de stockage adaptés, non seulement pour le traitement de ces données mais aussi pour leur sauvegarde. Le facteur le plus important demeure néanmoins l’expertise des personnes qualifiées. Pour l’analyse et l’interprétation des données, il est nécessaire d’avoir des spécialistes qui possèdent des connaissances dans plusieurs domaines : compétences biologiques et médicales ainsi qu’une expertise en statistique et en technologies informatiques.

Septembre 2018