La recherche biomédicale figure parmi les branches scientifiques qui collectent, traitent et exploitent abondamment les données, de leur forme la plus classique à leur nature la plus évoluée : la Big data. Cette dernière est à la fois ressource et facteur en matière d’analyse biologique et pathologique. Elle est utilisée pour un certain nombre d’opérations. Elle permet de mettre en évidence des facteurs de risque de maladies, de faciliter le diagnostic des cancers, d’identifier les facteurs d’efficacité des soins médicaux chez les patients, d’étudier les micro-organismes, etc.
Mais l’informatique du XXIe siècle et encore une fois la Big data ont permis surmonter les principales problématiques et les blocages en matière de recherche. Le traitement poussé des mégadonnées, leurs analyse, recoupement et visualisation, ont donné lieu à de nouvelles orientations, de nouvelles connaissances sur les maladies, puis à des progrès fantastiques. En quoi consistent ces avancées ? Où se place la Big data dans ces recherches ?
Génomique et Big data parmi les meilleurs exemples de révolution de la recherche médicale
La génomique représente parfaitement tout le concept de la Big data, répondant à ses caractéristiques majeures, à savoir le volume, la vélocité et la variété. Ainsi :
- La génomique est avant tout une source et un facteur de données non massif. Au début des années 2000, la première séquence du génome humain (23 000 gènes) fut découverte, à savoir une suite totalisant 3 milliards de lettres. À l’échelle du nombre de personnes qui ont volontairement participé depuis aux études génomiques, les chercheurs ont trouvé un volume de données qui se mesure aujourd’hui en dizaines de pétaoctets.
- Les scientifiques font face à un développement extrêmement rapide de la Big data. Il est possible de dresser la séquence du génome d’un individu en une seule journée. Des techniques de séquençage nouvelle génération (technologie NGS, Illumina, TGS, Long Read, etc.) ainsi que des outils de microscopie dernière génération comme Titan Krios ont fait rapidement évoluer les bases de données au profit de nombreuses études sur des pathologies comme le cancer, les troubles du spectre de l’autisme, les maladies neuro dégénératives, ou autres.
- En plus de bénéficier d’un accès facilité à l’ensemble des génomes d’une multitude de patients ou de volontaires, le généticien peut utiliser des données plus diverses sur ces personnes, à savoir leur profil, les maladies ou troubles dont elles souffrent, leurs traitements, etc.
Grâce à la Big data, la génomique a permis bien de remises en question sur l’identification d’un dixième gène du VIH, le facteur génétique de l’empathie, l’héritage néandertalien du système immunitaire de l’homme moderne… Mais en dehors de la génomique, les mégadonnées révolutionnent d’autres aspects de la recherche en santé. Alliée à de nouveaux concepts technologiques comme le cloud computing, l’intelligence artificielle, les nouvelles techniques de microscopie, la Big data permet notamment des diagnostics poussés et précis à propos d’une maladie ou encore d’établir des modes de médication plus personnalisés.
Comment la Big data révolutionne la recherche en santé ?
Big Data présente une définition encore plus large aujourd’hui, vu la quantité de données incommensurable et exponentielle à disposition des chercheurs et des parties prenantes de l’industrie médicale et pharmaceutique. Les scientifiques font face à des données structurées ou non auxquelles il va falloir donner un sens, en fonction d’un ou de plusieurs objectifs particuliers. Nous pouvons évoquer notamment la nécessité actuelle de mettre en place un système de traitement adéquat et personnalisé. Par exemple, un traitement fonctionnant chez une catégorie de personnes pourrait être inopérant chez une autre. La génomique va viser dans ce cas la comparaison d’un nombre élevé de génomes appartenant aux deux catégories de patients, ceci dans le but de déceler des différences génétiques prouvant l’efficacité ou non de la thérapie en question chez l’un ou l’autre groupe. Nous pouvons aussi parler de la microscopie atomique telle que le Titan Krios et son environnement informatique qui permettent de réunir des milliards d’images de toutes sortes qu’il faut sélectionner, différencier, comparer…
De telles approches relèvent évidemment de tâches herculéennes et de pratiques pointues en data science. Celle-ci permet en somme de traiter rapidement et de valoriser les données grâce à un algorithme, des systèmes de traitement comme mapreduce, des outils d’automatisation, etc. Encore faut-il que les parties prenantes de la recherche scientifique médicale fassent preuve elles-mêmes d’une maîtrise de la Big data.
Des spécialistes à la rescousse du personnel data science
Les biologistes mis à contribution dans chaque étude devront interagir avec un large panel de spécialistes dans d’autres domaines tels que les mathématiciens, les statisticiens, les bio-informaticiens, etc. Il s’agit de concevoir et de développer des programmes informatiques et des algorithmes dédiés pour réaliser toutes les tâches en recherche. Et le traitement de la Big data et sa valorisation nécessitent des experts en data science. En génomique, grâce à des outils informatiques programmés, 3 milliards de lettres vont être analysées et comparées pour chaque génome. Il s’agit aussi de repérer des différences de lettres et d’identifier des relations. De nouvelles compétences en data science et management naissent aussi constamment dans les recherches en santé. Le dernier en date, le data manager, regroupe les laborantins, les responsables des données des patients hospitalisés, les informaticiens, les bio-statisticiens, les personnels juridiques et de l’éthique.
Les recherches biomédicales face aux enjeux des données big data
La Big data donne lieu à un processus de recherche simplifié ainsi qu’une haute précision dans les résultats. Cependant sa prise en main implique la nécessité de sécuriser aussi bien les données massives classées personnelles des sujets étudiés que leur traitement. Surtout que dans une optique de transparence et de collaboration entre les scientifiques du monde médical, les applications technologiques privilégient généralement une communication instantanée des données, même les plus sensibles, entre les chercheurs, en vue d’une avancée commune. Citons l’exemple du Royaume-Uni avec son projet UK Biobank, accessible sur le web, qui répertorie des données de santé de centaines de milliers de ses citoyens volontaires. Gratuit pour les chercheurs inscrits, l’accès est conditionné par le partage mutuel des découvertes respectives.
Par ailleurs, les producteurs de données font face à un autre principal défi, le matériel. La Big data nécessite en effet de plus en plus d’équipements de stockage et de supercalculateurs. Rien que pour le génome humain, il est nécessaire de créer un espace de stockage pouvant contenir environ une centaine de milliers de photos. Sachant que la génomique ne concerne pas uniquement l’humain, il est prévu dans quelques années de dresser le génome de tout l’océan !
Vous souhaitez vous former au Big Data ? Retrouvez les formations Data Full Stack et Data Analyst qui vous forment aux métiers de Data Analyst, Data Scientist, Data Engineer et AI Scientist.
Merci pour votre lecture ! Si vous souhaitez lire nos prochains articles autour de la Data et de l’IA, vous pouvez nous suivre sur Facebook, LinkedIn et Twitter pour être notifié lorsqu’un nouvel article est publié !